找回密码
 注册

Sign in with Twitter

It's what's happening?

微信登录

微信扫一扫,快速登录

萍聚头条

查看: 173|回复: 0

AI知识点 | 都2025年了,还需要打磨提示词能力吗?

[复制链接]
发表于 2025-11-2 15:45 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册 微信登录

×
作者:微信文章
导读

可能你会问,都2025年了还有必要打磨自己写提示词(英文:Prompt)的水平吗?毕竟各家大语言模型(后文简称大模型)的能力都很优秀,参数规模达到千亿万亿,理解和推理能力日益强大,更别说他们仍在快速地迭代成长。我的答案是有必要,很有必要。接下来结合在一线落地AI应用的视角来聊聊提示词的变与不变。

我相信将来不管大模型技术怎么发展,其底层原理决定了提示词一直会很重要,提示词是你和大模型沟通的桥梁,打磨提示词能力将是你参与AI一直要做的一件事情。

回到原点:为什么大模型需要提示词?




w1.jpg



提示词是用自然语言写给大模型的指令,明确告诉它要完成的任务、具体要求或期望的结果,指导大模型精准理解并回应你的需求。

提示词不是大模型特有的技术。早期AI一样有指令输入,只不过格式很固定,也不是自然语言。加上早期模型面向比较单一且垂直的领域任务,不需要有很灵活的提示词。于是提示词部分一般由算法工程师自己写掉了,模型的上层用户不需要也感受不到提示词的存在。

来到大模型时代,因为大参数量,海量数据使大模型具备了非常全能的能力,并非针对单一任务而设计。这就从机制上需要有提示词的输入来告诉大模型应该发挥哪部分特定任务的能力。打个不太恰当的比方,早期的模型像职业学校毕业的学生,技能固定。现在的大模型像大学毕业生,因为具备的能力通用性不一样决定了两者的可塑性不一样,两者参加工作的行业定向性也不一样,上岗培训的内容也不一样。

加上大模型强大的上下文学习能力这一特点,进一步增加了使用提示词的必要性。你只要通过提示词下达任务指令,哪怕是新的任务,只要给出少量关于新任务的示范,大模型也能够理解并执行任务。给大模型写提示词就是假设大模型是一个缺乏具体背景但了解很多世界通用知识的大学生。

综上所说,大模型的底层设计原理决定了提示词是大模型使用者和大模型之间必经的一座桥。这就好比你去餐厅吃饭,总要跟服务员说你想吃什么,或者扫码点单,餐厅服务员或二维码就是提示词。换句话说,餐食做得好不好吃,除了厨师水平外,还取决于你表达的诉求够不够精准了。不然就有可能给有忌口的你端上来一盘放了葱蒜姜的菜。

不过,有一点要强调的是,写提示词总比点餐要困难一些。毕竟你去餐厅吃饭哪怕只说了个菜名而不加其他诉求就足以让你吃到平均水准的菜。但因为大模型学习了超出你想象的海量知识,这些知识犹如装进了巨大的仓库,如果你的提示词太随意很有可能你得不到想要的答案,因为这个过程犹如在巨大仓库里找到一根针。这也是为什么你任何时候使用大模型时都应该保持对提示词精益求精的态度,持续打磨它。

提示词不变的地方:第一诉求是跟大模型对齐意图,表达准确

俗话说会哭的孩子有奶吃,放在写提示词语境里就是你要明确而又精确地表达出对大模型的诉求。记住,中国文化里的含蓄克制在写提示词时一定不好使,把诉求表达准确是提示词的第一目的。

应该怎么来表达诉求呢?

首先是结构化。这就好比语文老师叮嘱的那些写作文的方式方法比如突出中心思想、结构清晰,别堆彻词藻。你看到市面上介绍的很多提示词框架,重点都在分步骤地结构化提示词。我们来看几个框架:

1、CO-STAR(新加坡首届GPT-4提示词大赛冠军用的提示词框架):C(Context上下文,任务背景信息)、O(Objective目标,你期望大模型要完成的任务,对齐意图或目标)、 S(Style风格,希望回复的风格)、T(Tone语气,期望大模型回复的情感、情绪、态度)、A(Audience受众,目标受众)、R(Response响应,回复返回的格式比如Json ,输出的行文结构如金字塔、列表等)

2、ICIO:介绍(Instruction)、背景(Context)、输入数据(Input Data)、输出指标(Output Indicator)

3、CRISPE:上下文(Context)、角色(Role)、说明(Instruction)、主题(Subject)、预设(Preset)、例外(Exception)

4、RASCEF:角色(Role)、行动(Action)、情景(Situation)、背景(Context)、期望(Expectation)、格式(Format)

5、BROKE:背景(Background)、角色(Role)、目标(Objective)、关键结果(Key Result)、改进(Evaluation)

6、RTF:角色(Role)、任务(Task)、格式(Format)

7、TREF:包括任务(Task)、要求(Requirements)、期望(Expectations)、格式(Format)

8、STAR :情景(Situation)、任务(Task)、行动(Action)和结果(Result)

通过以上框架不难发现表达诉求的几个关键结构:需要大模型完成什么任务?任务有哪些背景信息?希望大模型如何输出答案?关键词都是结构化呈现。千万不要把所有提示词内容揉成一团,尽量分段。

其次,需要根据任务的性质按需加强某些结构的描述。这一步是具体场景实际落地的关键一步。

上面这些框架可能适用那些对答案要求不那么精确的场景比如写文章、翻译、百科知识问答等。对于企业级应用场景其实还有很多待优化的地方。通过几种场景来感受下:

    代码/SQL生成场景:需要对任务补充更加详细规则,例如企业自己的编码规范、代码组织结构、SQL语法约束

    多步推理类场景:需要增加CoT(Chain of Thoughts)信息,即多步骤执行的流程,一步一步思考的过程

    数据提取和转换场景:需要对结构化输出格式做细致的约束,json、xml、markdown有各自的格式要求

    有状态的多轮对话场景:需要增加历史对话信息、需要提取先前交互的信息或实体,可能涉及输入改写、模糊意图澄清


上面两点是通用技巧,最后再谈谈个人觉得也很重要的提示词经验。

1、深入理解和分析你所在的业务及流程是前提,业务外行是写不好提示词的。一方面能精准地使用行业语言用词,清晰而精准用词比什么都强。另一方面能合理地切割业务粒度,让提示词和业务粒度对应,便于提示词的复用,以及将来业务扩展带来的提示词修改。这一点在大型项目里尤其重要,因为复杂业务流程势必会拆分多个模块多个步骤,涉及多个任务提示词形成提示链模式。当然,这个道理也同样适用于多智能体场景,拆分和协作是工程化的好朋友。

2、要事第一原则。越关键的信息放到越前面,比如任务描述,输出格式要求。因为提示词首先是写给大模型看的,直接无歧义的提示词永远是对机器最友好,太啰嗦的提示词会稀释大模型对关键任务的注意力。

3、给出例子仍然非常有必要(few-shot),但切记例子的质量要高:是否覆盖边界?是否足够精简?是否有反例?。提问:对于SFT微调过的模型,提示词里要不要加示例呢?

4、用好标记:占位符(动态的内容在程序运行时临时替换掉,便于像管理代码一样管理提示词)、分割符(把大段输入内容用界定符包裹起来,防止大模型错误理解为指令)、注释符(便于大模型懂得忽略注释内容,但注释有时能便于日志监控、他人阅读)。

5、利用大模型来辅助你写提示词。比如可以让大模型给你生成提示词初稿,对提示词提问、查缺补漏逐步完善。也可以利用大模型来评估、监控上线后的提示词效果。

提示词变的地方

可以从两个视角来说一说关于提示词的变化:一是大模型视角,而是工程应用视角。

从大模型视角来看,大模型厂商持续在提升提示词的使用体验:

1、底层支持的上下文窗口大小一直在增加,从最初的几K到现在的上M,早先写提示词时要考虑到上下文窗口大小限制而精打细算,相对来说现在明显更加游刃有余了。提问:将来提示词窗口大小变得更大,RAG技术还需要吗?

2、提示词形式变得多样并且可以相互补充。前不久DeepSeek发布的通过OCR拍照的方式组织提示词在有些场合可以降低一个数量级的输入token量,很多网友大呼简直天才想法。

3、大模型的调用成本持续下降,这也是企业级AI应用普及的关键一点。只有水电煤成本足够低了才能迸发出更多AI应用。有时候多个任务揉到一个提示词里的场景就可以忽略调用成本,分成多个步骤里多个提示词。

从工程视角来看:

1、提示词催生了软件开发范式的改变。以前模型的调用门槛高,需要算法工程师或软件工程师写程序。现在软件行业的各种角色,特别是产品经理、设计师们,可以不靠工程师,自己写提示词也能完成产品的原型设计及功能效果摸底。这一改变将逐渐颠覆传统软件开发流程,角色的分工和协作变得更加灵活。

2、提示词变得和代码一样重要了。也就意味着以前围绕代码的一系列研发流水线流程比如审查、版本管理、测试、线上监控,在提示词工程领域一样需要。之所以上升到工程层次,是因为企业级应用需要稳定、规模化的效果。诚然,你写一版提示词可能满足了百分之六七十的情况, 但离商用还有差距,这个差距需要一系列工程手段来弥补和保障。

3、上下文工程的兴起。为了提高大模型的回复质量,提示词粒度还是太粗糙了,因而需要继续对提示词的内部结构做更加精细化的管理。比如记住用户和大模型交互历史、更加灵活地动态替换提示词一部分内容等等。

总之,业界正在用工程化思维和手段朝着越来越精细化的方向管理提示词,和大模型基础能力相得益彰,旨在最大程度释放大模型的AI能力。

结语

在这个AIGC时代,提示词让全民参与到AI生成内容的世界里。现在的你,不是在消费AI生成内容就是在制作AI生成内容,因此掌握和打磨如何写好提示词永不过时。

写提示词就是在写任务操作说明书,如何用少而精的文字表达出清晰而准确的意图不是一件容易的事,一段平淡无奇的提示词如果能经受住上亿次调用能保持稳定的结果输出,那就是顶级的提示词。头脑里有想法是一回事,将头脑中的想法经过充分分析并清晰表达出来,使任何理性的人都能理解的过程是另一回事,而这正是提示工程的核心。在这AI时代,要做一个文理双修的理工男。

我是飞邪,感谢阅读,欢迎关注非写不可获取最新文章:👇👇👇

往期节选:

Agent落地 | SAP、Salesforce、Palantir带来的启示(1)

Agent落地 | SAP、Salesforce、Palantir带来的启示(2)

Agent落地 | SAP、Salesforce、Palantir带来的启示(3)

AI知识点 | 大模型的本质、能力及缺陷
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
您需要登录后才可以回帖 登录 | 注册 微信登录

本版积分规则

Archiver|手机版|AGB|Impressum|Datenschutzerklärung|萍聚社区-德国热线-德国实用信息网

GMT+1, 2025-11-4 15:14 , Processed in 0.108364 second(s), 30 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表