news 2026/4/17 10:03:42

重要的事情说三遍!重复提示词竟能让非推理模型准确率狂飙

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
重要的事情说三遍!重复提示词竟能让非推理模型准确率狂飙

重要的事情说三遍!重复提示词竟能让非推理模型准确率狂飙

原创 Victor 硅基捕手维克托2026年1月26日 08:18新加坡

论文链接:https://arxiv.org/abs/2512.14982
发布时间:2025.12.17

平时咱们在用大模型,尤其是那些非思考类的模型的时候,经常会遇到一种崩溃的情况:你明明在要求里写得清清楚楚,让它“不要输出多余的废话”或者“必须以某种格式开头”,它偏偏就像耳边风一样,直接给忽略了。

这时候,我有一些习惯性的办法:把重点词加粗,或者套上引号,甚至在开头说一遍、结尾再说一遍

没想到,这种带点情绪的“复读”操作,竟然被谷歌的研究员给专门写成了论文,还证明了它在科学上是非常有效,原来这也可以!

核心做法:简单到不可思议

谷歌的这篇论文,核心观点就一句话:在不使用推理模式时,直接把提示词复制一遍拼在一起发送(即[指令][指令]),就能显著提升大模型的性能。

基线输入形式及重复输入形式

而且最神奇的是,这种操作几乎没有副作用。它不会增加模型生成的字数,也不会让你觉得回复变慢了,因为它增加的只是“预填充(Pre-fill)”阶段的计算量,这部分在硬件上是可以并行处理的。

为什么“复读”能救命?

咱们先聊聊底层逻辑。

我觉得,这其实跟Transformer架构的“注意力机制”有很大关系。非思考模型在生成答案时,它其实是在玩一场概率游戏。如果你的指令只出现一次,模型在处理长文本时,注意力可能会分散,不小心就把你那条关键的指令给漏掉了。

接着我们从直观感受上看看为什么这种方法可行?

这就好比咱们人类的“快思考”和“慢思考”。非思考模型就像是处于“快思考”模式,你问它问题,它不过脑子直接就吐答案。而这种把提示词重复一遍的操作,就像是你在它耳边连喊了两遍“看重点!看重点!”,强行把它的注意力拉回到你的指令上。

相比之下,像o1或者DeepSeek-R1这种“思考模型”,它们自带“慢思考”属性。你去看它们的思考链路,它们往往会先复述一遍用户的要求,或者自己在那儿嘀咕:“用户让我干啥来着?哦,不能有废话。”这种复述需求或自我纠检的过程,其实已经起到了“重复输入”的效果,所以这篇论文提到的方法,主要对那些“性子急”的非思考模型有效

用数据说话:47胜0负的战绩

我翻了一下论文里的实验数据,这么简单的重复效果惊人。研究人员测试了包括Gemini、GPT、Claude和DeepSeek在内的各种主流模型。

在70组“模型+任务”的对比测试中,采用“重复提示词”的方法,在47组中取得了显著的性能提升,而剩下的23组则是打平,没有一组是变差的。这就意味着,这个方法属于“有百利而无一害”,哪怕没效果,也不会拖后腿。

尤其是在一些需要精准操作的任务上,这种提升简直是“降维打击”。比如论文里提到的一个叫“NameIndex”的任务,它是用来测试模型“细心程度”的一个高难度测试集,

它的规则非常对人来说也非常直接和简单,就是给模型个人名,然后让模型输出第个人名是什么。

NameIndex 测试集示例

各模型在 NameIndex 上表现如何呢?

  • Gemini 2.0 Flash-Lite在正常情况下,准确率只有惨不忍睹的21.33%

  • 但是,只要把提示词重复一遍,它的准确率瞬间飙升到了97.33%

这就是我前面说的,有些任务模型其实“会”,但它因为注意力没集中,“没看清”或“没关注到”要求,导致它答错了。

为什么对思考模式没啥用?

论文里也对比了这种方法在思考模式上的表现。结果发现,如果模型已经开启了思考模式(为了公平对比,论文中用的仍然是非思考模型,但添加特殊指令“Let's think step by step”,通过 CoT 的方式让模型在输出答案前先思考),重复提示词带来的边际效应就很低了

这也非常符合我们的直觉:思考模型在生成的过程中,其实已经在不断审视自己有没有满足要求。就像论文里观察到的,推理模型在训练过程中往往已经学会了复述用户的请求。当它自己已经开始“反复研读”你的指令时,你手动在输入端复读,就显得有点多此一举了。

总结:最简单的“暴力美学”

看完这篇论文,我最大的感受就是:有时候,最先进的技术问题,往往可以通过最原始、最“暴力”的方法解决。

如果你下次用AI写代码、做数据提取,或者处理一些复杂的格式要求,发现它老是记不住你的指令,别急着去改那些玄学的提示词模板。最简单、最有效的办法就是:Ctrl+C,Ctrl+V,把你的要求再说一遍。

毕竟,科学证明了,哪怕是AI,重要的事说三遍也是真理!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/10 6:13:46

NX4188-24,一款USB audio芯片,广泛用于USB耳机、声卡等领域

NX4188-24 是一款高度集成的 USB/Type-C 音频芯片,芯片内部整合了全部必需的模拟电路模块,涵盖双 DAC 与音频功放、麦克风增益电路、锁相环(PLL)、稳压模块以及 USB 收发单元。同时,它还提供专用的 HID 兼容音量控制引…

作者头像 李华
网站建设 2026/4/9 16:49:45

【计算机毕业设计案例】基于JavaWeb的在线美食探店分享平台基于web的美食探店平台(程序+文档+讲解+定制)

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华
网站建设 2026/4/15 19:56:29

智慧农业在种植、养殖、畜牧、水产等多个领域是如何解决问题的?

在科技飞速发展的今天,智慧农业正逐渐成为农业领域的一股新兴力量帮助农民解决着种植、养殖、畜牧、水产等多个领域的常见问题。那么,智慧农业究竟是如何发挥作用的呢?智慧农业助力种植领域在传统的种植过程中,农民常常面临着诸如…

作者头像 李华
网站建设 2026/4/14 3:27:15

工业智能网关:工厂数字化转型的核心枢纽

在数字化转型的浪潮中,许多制造企业面临一个核心痛点:车间里设备品牌众多、协议繁杂,PLC、CNC、仪器仪表各自为政,形成了一个个“信息孤岛”。宝贵的生产数据沉睡在本地,无法汇聚、分析和利用。数字化转型,…

作者头像 李华
网站建设 2026/4/17 17:29:58

【目标检测】YOLOv26:基于改进算法的乌鸦识别系统详解

本数据集名为Crow 2,版本为v1,创建于2023年3月13日,是一个专注于乌鸦检测的计算机视觉数据集。该数据集由qunshankj平台用户提供并采用CC BY 4.0许可协议授权,共包含416张经过专业标注的图像,所有标注均采用YOLOv8格式…

作者头像 李华
网站建设 2026/4/16 17:52:40

企微API自动化:外部群推送实现高效自动化

QiWe开放平台 个人名片 API驱动企微自动化,让开发更高效 核心能力:为开发者提供标准化接口、快速集成工具,助力产品高效拓展功能场景 官方站点:https://www.qiweapi.com 团队定位:专注企微API生态的技术服务团队 对接…

作者头像 李华