【AI】写不好提示词?先搞懂“指令”“上下文”“输出格式”三要素
写不好提示词?先搞懂 “指令”“上下文”“输出格式” 三要素
**
一、引言
在当下,各类大模型如 ChatGPT、文心一言等在自然语言处理领域大显身手,改变着我们与计算机交互的模式。从生成文案到解答疑问,从对话交流到内容创作,大模型的能力令人惊叹。但想要充分挖掘大模型的潜力,提示词的运用就成了关键。它就像是开启宝藏大门的钥匙,合适的提示词能让大模型精准输出符合我们需求的结果。例如,简单输入 “写个故事”,模型给出的故事可能千篇一律、缺乏重点;但要是输入 “以未来城市为背景,创作一个 2000 字左右的科幻故事,主角是一名勇敢的城市探索者,要突出城市的奇异景观和主角的冒险经历”,模型生成的内容就会更贴合我们的期待。这其中,“指令”“上下文”“输出格式” 作为提示词的核心三要素,对大模型的输出质量起着决定性作用。接下来,我们就深入探究一下这三个要素。
二、指令:明确任务的核心
2.1 指令的重要性
指令是提示词的灵魂所在,它明确地向大模型传达我们想要它执行的任务。大模型就如同一个等待指令的执行者,没有清晰的指令,它就会像无头苍蝇一样,不知道从何下手。比如,我们让大模型 “写一篇文章”,这样模糊的指令,模型很难确切知晓我们期望的文章主题、风格、受众等关键信息,输出的内容自然难以符合预期。而要是指令是 “以‘人工智能在教育领域的应用挑战与解决方案’为主题,写一篇面向教育工作者的议论文,阐述应用过程中遇到的技术、观念等方面的挑战,并提出切实可行的解决方案,字数在 1500 字左右”,大模型就能清楚任务方向,输出更有针对性的文章。
2.2 指令的撰写要点
- 清晰明确:指令不能含糊不清,要让大模型能准确理解。像 “分析一下市场情况” 就太过笼统,市场涵盖的范围极广,到底是哪个行业的市场、分析市场的哪些方面,模型无从得知。应改为 “分析当前智能手机市场的竞争格局,包括主要品牌的市场占有率、产品特色以及未来半年的市场趋势预测”,这样模型就能明确任务细节。
- 具体细致:指令越具体,大模型输出的结果就越精准。比如,在让大模型创作诗歌时,若指令是 “创作一首关于爱情的诗歌”,模型创作的空间很大,可能生成的诗歌风格、形式多样。但要是指令为 “创作一首七言绝句形式的爱情诗歌,每句诗都要包含一个与爱情相关的典故,语言优美典雅”,模型就能按照特定的诗歌形式和内容要求进行创作。
- 避免歧义:指令的表述要准确无误,不能有多种理解。例如,“给我介绍一下最近的科技产品,要有趣的”,这里 “有趣” 的定义就很模糊,是产品功能有趣,还是产品设计有趣,或者是产品的使用体验有趣呢?模型可能会给出不同侧重点的介绍。应改为 “给我介绍一下最近半年内发布的,具有独特创新功能,能让人感到新奇有趣的科技产品,重点阐述其创新功能及带来的新奇体验”。
2.3 指令的示例分析
- 文本创作类:指令 “假设你是一位旅游博主,写一篇介绍成都旅游景点的攻略文章,重点介绍武侯祠、锦里和大熊猫繁育研究基地,要包含景点特色、游玩路线和美食推荐”。在这个指令中,明确了大模型需要扮演的角色(旅游博主),任务内容(介绍成都特定景点的攻略),以及具体的景点范围和需要涵盖的信息点(景点特色、游玩路线、美食推荐)。大模型会根据这些指令,生成一篇详细的成都旅游攻略,如介绍武侯祠浓厚的历史文化氛围,锦里古色古香的街道与特色小吃,以及大熊猫繁育研究基地可爱的大熊猫们和参观注意事项等内容。
- 问题解答类:指令 “结合当前全球经济形势,解释一下黄金价格波动的原因”。此指令让大模型结合特定的背景(当前全球经济形势),完成解释黄金价格波动原因的任务。大模型可能会从全球经济增长趋势、通货膨胀情况、地缘政治因素、货币政策等方面,分析这些因素如何影响黄金的供需关系,进而导致黄金价格的波动。
- 数据分析类:指令 “根据以下某电商平台过去一个月的销售数据表格,分析各类商品的销售趋势,计算销售额占比,并找出销售额增长最快的商品类别”,同时附上销售数据表格。这里指令明确了数据来源(给定的销售数据表格),任务内容(分析销售趋势、计算销售额占比、找出增长最快的商品类别)。大模型会对表格数据进行处理,生成各类商品销售趋势的分析报告,如哪些商品销量呈上升趋势,哪些呈下降趋势,各商品销售额在总销售额中的占比情况,以及确定销售额增长最快的商品类别。
三、上下文:提供理解的背景
3.1 上下文的作用
上下文信息为大模型理解任务提供了必要的背景和相关信息,就如同我们在与人交流时,需要了解事情的前因后果才能更好地理解对方的意图。大模型在处理任务时也是如此,合适的上下文能帮助它更准确地把握任务要求,从而给出更优质的输出结果。例如,当我们向大模型提问 “他为什么会做出这样的决定”,没有任何上下文的情况下,模型根本不知道 “他” 是谁,在什么事情上做出了决定,自然无法给出有价值的回答。但如果补充上下文信息,如 “在公司面临重大项目决策时,公司的 CEO,一位向来以稳健决策著称的领导者,他为什么会做出这样冒险的决定”,大模型就能结合这些背景信息,从项目的潜在收益、市场竞争压力、公司的战略布局等方面分析该领导者做出冒险决定的原因。
3.2 上下文的类型
- 文本背景:当我们需要大模型对某段文本进行总结、分析或改写时,提供这段文本作为上下文是必不可少的。比如,要求大模型 “总结以下关于人工智能发展的文章的核心观点”,并附上相关文章内容。大模型就能基于文章中的具体论述,提炼出人工智能在技术突破、应用拓展、面临挑战等方面的核心观点。
- 事实描述:在涉及特定领域的问题时,提供相关的事实描述作为上下文能帮助大模型更好地作答。例如,在询问大模型 “某种新型药物在治疗癌症方面的效果如何” 时,补充 “这种新型药物是由某知名药企研发,经过了临床试验阶段,其作用机制是通过抑制肿瘤细胞的特定生长信号通路来发挥作用” 等事实描述,大模型就能依据这些信息,结合医学知识和临床数据,更准确地分析该药物的治疗效果。
- 场景设定:对于一些需要创意或情境理解的任务,场景设定的上下文很关键。比如,让大模型 “创作一段两个人在未来太空站中相遇的对话”,给出 “未来太空站中,资源稀缺,不同星球来的宇航员肩负着不同的任务,他们在一次资源采集任务中偶然相遇” 这样的场景设定,大模型创作的对话会更贴合未来太空站的环境和任务背景,充满科幻色彩。
3.3 上下文的添加要点
- 相关性:添加的上下文必须与任务紧密相关,无关的信息会干扰大模型的判断,增加其理解任务的难度。例如,在让大模型分析一部电影的剧情和艺术价值时,提供电影的拍摄地点、导演的个人生活琐事等不相关的上下文信息,就会让模型偏离重点。应提供与电影剧情、拍摄手法、演员表演、主题表达等相关的信息作为上下文。
- 充分性:上下文信息要足够充分,以确保大模型能全面理解任务。比如,在要求大模型对一个历史事件进行评价时,只说 “评价一下某历史事件”,大模型可能因缺乏信息而无法深入评价。但如果提供该历史事件发生的时代背景、主要人物、事件的详细经过等充分的上下文信息,大模型就能从多个角度对事件进行全面评价,如分析事件的起因、过程中的关键转折点、产生的影响以及在历史长河中的地位等。
- 简洁性:虽然上下文要充分,但也要避免冗长繁琐,应简洁明了地传达关键信息。过多冗余的上下文信息可能会让大模型难以快速提取关键内容,影响处理效率和输出结果。例如,在描述一个产品的相关问题时,简单说明产品的主要功能、出现问题的具体表现即可,无需详细阐述产品的研发历程、市场推广细节等无关紧要的内容。
3.4 上下文的示例分析
- 文本分析类:任务是 “分析以下文本的情感倾向和主要观点”,上下文为 “这是一篇消费者对某品牌手机的评价:这款手机外观时尚,屏幕显示效果出色,运行速度也很快,但是电池续航能力较差,充电速度也不尽如人意”。大模型根据这段文本上下文,能分析出情感倾向既有对手机优点的肯定(积极情感),也有对电池相关问题的不满(消极情感),主要观点是该品牌手机有外观、屏幕和运行速度方面的优势,但电池续航和充电速度存在不足。
- 创意写作类:要求大模型 “创作一个童话故事”,提供的上下文是 “在一个遥远的魔法森林里,住着许多可爱的小精灵,他们拥有神奇的魔法能力,但最近森林里出现了一种奇怪的黑暗力量,威胁着森林的和平与安宁”。基于这个上下文,大模型创作的童话故事可能围绕小精灵们如何运用魔法对抗黑暗力量,保护魔法森林展开,故事情节中会融入森林的神奇场景、小精灵们的魔法技能以及与黑暗力量的激烈对抗等元素。
- 问题解决类:问题是 “如何解决某工厂生产效率低下的问题”,上下文是 “该工厂采用传统的生产工艺,设备老化严重,工人工作积极性不高,生产流程存在较多繁琐的环节”。大模型结合这些上下文信息,可能会提出升级设备、优化生产流程、采用新的生产工艺、建立激励机制提高工人积极性等解决方案。
四、输出格式:规范结果的呈现
4.1 输出格式的意义
输出格式决定了大模型输出结果的呈现方式,它能让结果更符合我们的使用需求,便于阅读、理解和进一步处理。不同的任务可能需要不同的输出格式,明确输出格式可以让大模型的输出更有条理、更具针对性。比如,在进行数据分析时,我们希望结果以表格或图表的形式呈现,这样数据对比一目了然;在撰写报告时,我们可能要求输出内容采用特定的章节结构和排版格式,方便后续编辑和展示。如果不指定输出格式,大模型可能按照默认方式输出,结果可能杂乱无章,不利于我们获取和使用信息。
4.2 常见的输出格式要求
- 文本格式
-
- 段落结构:要求大模型输出的文本按照一定的段落进行组织,每个段落表达一个清晰的观点或内容。例如,在写一篇论述文时,可要求 “文章分为引言、主体论述(分三个段落分别阐述三个主要观点)、结论三个部分,每个段落逻辑清晰,内容完整”。这样大模型生成的文章结构会更加严谨,便于读者理解文章的脉络。
-
- 标题设置:对于较长的文本,设置合适的标题能增强内容的层次感。比如,在创作一篇技术教程时,可规定 “教程内容分为‘基础知识’‘操作步骤’‘常见问题及解决方法’‘总结’等几个部分,每个部分设置相应的二级标题,突出重点内容”。大模型会按照要求设置标题,使教程内容层次分明,读者能快速定位到自己需要的信息。
- 列表格式
-
- 无序列表:当需要列举一些事项时,无序列表格式很实用。例如,“列出五种常见的水果”,大模型可能输出 “- 苹果
-
- 香蕉
-
- 橘子
-
- 葡萄
-
- 草莓”,这种格式简洁明了,各项内容清晰呈现。
-
- 有序列表:在描述步骤、流程或需要强调顺序的内容时,有序列表更为合适。比如,“请按照步骤说明如何制作一份简单的水果沙拉:1. 准备好所需水果,如苹果、香蕉、橙子等;2. 将水果洗净并切成适当大小的块状;3. 取一个碗,将切好的水果放入碗中;4. 加入适量的沙拉酱,搅拌均匀”,有序列表让制作流程一目了然,方便读者按照步骤操作。
- 表格格式
-
- 数据对比表格:在进行数据对比分析时,表格格式能直观地展示数据之间的差异。例如,“对比某公司过去三年的销售额、利润和市场份额,以表格形式呈现”,大模型生成的表格可能如下:
| 年份 | 销售额(万元)| 利润(万元)| 市场份额(%)|
|----|----|----|----|
|2020 年 | 1000|200|15|
|2021 年 | 1200|250|18|
|2022 年 | 1500|300|20|
-
- 信息汇总表格:对于一些需要汇总信息的任务,表格也能很好地呈现内容。比如,“汇总中国四大名著的作者、成书年代、主要人物和故事梗概,以表格形式输出”,大模型生成的表格可以清晰地展示四大名著的相关信息,方便读者查阅和比较。
- 其他格式
-
- 代码格式:当要求大模型生成代码时,指定代码格式能确保代码的规范性和可读性。例如,“用 Python 语言编写一个计算斐波那契数列的函数,代码格式要符合 Python 的 PEP8 规范”,大模型会按照规范要求生成格式正确的代码,便于程序员直接使用或进一步修改。
-
- 图表格式:在数据分析任务中,图表能更直观地展示数据趋势和关系。比如,“根据以下某城市过去十年的气温数据,生成折线图展示气温变化趋势”,大模型可能会生成一个以年份为横轴,气温为纵轴的折线图,清晰地呈现出该城市十年间气温的变化情况。虽然大模型自身可能无法直接绘制图表,但它可以生成用于绘制图表的数据或指导使用绘图工具生成图表的相关信息。
4.3 输出格式的设定要点
- 根据任务需求选择:要根据具体的任务性质和使用目的来选择合适的输出格式。如果是对一些知识点进行总结,列表格式可能更合适;如果是展示复杂的数据关系,表格或图表格式会更直观;如果是创作一篇完整的文章,就需要规定好文本的结构和格式。例如,在做市场调研分析时,对于不同品牌产品的性能、价格、用户评价等数据对比,使用表格格式能清晰呈现各品牌之间的差异,便于分析决策;而在撰写一篇关于市场调研结果的报告时,则需要按照报告的格式要求,设置标题、段落结构、图表编号等,使报告内容完整、格式规范。
- 明确格式细节:在设定输出格式时,要尽可能明确格式的细节要求,避免大模型产生误解。比如,在要求生成表格时,要说明表格的列名、数据类型、是否需要对数据进行排序等;在规定文本格式时,要明确字体、字号、行距、缩进等排版细节。例如,“以 Word 文档格式输出一篇报告,字体为宋体,字号为小四,行距为 1.5 倍,段落首行缩进 2 个字符,标题采用三号黑体加粗”,这样详细的格式要求能确保大模型输出的报告格式符合我们的预期,减少后续格式调整的工作量。
- 考虑模型能力限制:虽然我们可以设定各种输出格式要求,但也要考虑大模型的实际能力。有些复杂的格式可能大模型无法完全准确地实现,或者实现起来效果不佳。比如,对于一些需要复杂图形绘制和交互功能的图表格式,大模型可能难以直接生成。在这种情况下,我们可以适当调整格式要求,或者结合其他工具来实现最终的格式需求。例如,大模型生成了用于绘制复杂数据可视化图表的数据,我们可以使用专业的绘图软件(如 Excel、Python 的 Matplotlib 库等)根据这些数据来绘制图表,以达到更好的可视化效果。
4.4 输出格式的示例分析
- 报告撰写类:任务是 “撰写一份关于某产品用户体验调查的报告”,输出格式要求为 “报告分为封面、目录、引言、调查方法、调查结果分析、结论与建议、参考文献几个部分。封面要包含报告题目、作者、日期;目录自动生成;各部分内容层次分明,使用三级标题进行区分;文中如有图表,要进行编号并在图表下方注明图表名称;字体为微软雅黑,标题字号为小三加粗,正文字号为小四,行距为 1.25 倍”。大模型按照这些输出格式要求,生成的报告结构清晰,格式规范,便于阅读和存档。报告的引言部分会简要介绍调查的背景和目的,调查方法部分详细说明采用的调查方式(如问卷调查、用户访谈等)和样本选取情况,调查结果分析部分通过数据和图表对用户体验的各项指标进行分析,结论与建议部分总结调查结果并提出改进产品的建议,参考文献部分列出引用的相关资料。
- 数据整理类:要求大模型 “整理以下某电商平台不同品类商品的销售数据,包括商品名称、销量、销售额、好评率,以表格形式输出,并按照销售额从高到