logo
7

文心一言Prompt构造建议规范

整理了对需要一言执行任务的概括性描述与附加条件的陈述,需要是一段固定的话术,同类任务的任务陈述全部相同,希望对初次使用的同学提供到帮助。

一、prompt构造建议

Prompt构造可以由以下几个部分构成:
1.1 提供任务陈述
对需要一言执行任务的概括性描述与附加条件的陈述,需要是一段固定的话术,同类任务的任务陈述全部相同
对任务的概括可能包含以下部分:
  • 需要一言执行的操作,如:“请根据会议对话生成会议待办,并指明每个待办的负责人”,“根据历史对话和外部知识,回答用户输入的最后一个问题”
  • (可选)prompt中将会提供的输入内容,如:“我们提供了一个功能列表,情请根据用户输入...”
  • (可选)期望一言返回的输出结果,如:
    • 格式要求:
      • 讨论主题:
      • 与讨论主题相关的沟通结论:
(可选)附加条件的陈述可能包括以下部分:
  • (可选)对返回结果字数的限制,如:“要求主题不超过40个字,沟通结论整体不超过100个字”
  • (可选)对返回结果内容的限制,如:“请注意不要输出任何解释信息”
  • (可选)对返回结果格式的限制,如:
    • “输出为json格式。输出的json中,key包括action和action_input,其中action的取值如下:
      1. 如果基于历史对话和外部知识可以回答问题,action为Response,action_input为问题的答案。
      2. 如果用户问题与【xxxx】事项无关,或者外部知识无法回答问题,action为OutOfDomain,action_input为空列表。”
注意:如果任务类型为“需要模型根据输入的背景知识,选择合适的结果返回”,则附加条件中必须说明当没有找到合适返回结果时,模型的兜底输出内容是什么。
1.2 提供相关材料
提供给一言模型的背景材料/需要一言模型处理的数据样本等,可以是对业务名词的介绍解释,提供背景知识的文字片段,需要被处理的样本输入等。
1.3提供示例(可选)
可以是供一言模型学习的输入输出的样本演示,给出一轮完整的输入输出对供一言进行学习;也可以是供一言模型理解上下文的数据示例,比如数据表的内容等
1.4本次输入(可选)
在本次prompt中输入的提问,并要求一言给出输出。如果要求输出的内容已经在任务陈述中提及,则不需要构造这一部分

二、完整prompt示例

类型
Prompt示例
query示例
文本创作 - 科普文章
如果用户需要写一篇科普文章,可以参考以下规范

主要内容
[标题]:准确概括文章主题
[引言]:通过引用相关的案例或实例来吸引读者的兴趣,概述文章的主要内容,引出文章的主题。
[正文]:从易到难,由浅入深地阐述文章的主题,避免使用过于复杂的语言。
[结论]:文章的主要内容和观点,给读者留下一个深刻的印象。
[参考文献]:如果引用了其他作者的成果,应该在文章末尾列出参考文献

注意事项
注意定位目标读者:明确目标读者群体,从他们的角度出发,用通俗易懂的语言向他们传递知识。
正文可以分段,上下文逻辑关联性要强。

根据以上模板,完成对话中的创作需求
编撰一篇科普文章,内容是:美国工程公司研发出一款全新的太阳能发电机,该发电机采用三维技术,可以实现太阳能发电系统的三维立体结构,使得发电机及其太阳能发电系统的体积变得更小,而且发电效率更高,抗风性能更佳。
文本创作 - 影评
如果用户需要写一份影评,可以参考以下规范:

主要内容:
1. 电影的简要介绍:开篇可以简单介绍电影的导演和主要演员,电影的背景和故事情节,让读者了解电影的基本信息。
2. 电影的剧情评价:对电影的故事情节、人物形象和情感表现等方面进行评价,表述自己的观感,但不要透露太多关键剧情。
3. 角色评价:评价电影中的主要角色表现。可以从角色的演技、塑造和发展等方面进行评价。
4. 电影的制作和技术评价:评价电影的制作质量,包括画面、音效、配乐等。
5. 主题探讨:如果电影有明显的主题或者探讨了某些社会问题,可以在评论中提及,并探讨其意义和价值。
6. 总体评价和推荐:最后总结自己的观感,表述电影的优缺点,给出自己的推荐或不推荐,也可给出一个总体评分。
注意事项:
行文风格要生动、有感染力
可以加入个人情感、思考或建议等,让读者更深入了解你的观点和思考。

根据以上模板,完成对话中的创作需求。
昨天我跟表弟一起去看《流浪地球2》,场景设计和细节真不错,就是故事性比较松散,帮我写个稍微长点的评价吧
文本创作 - 实验报告
如果用户需要写一份实验报告,可以参考以下规范:

主要内容
[标题]: 具有概括性的标题
[引言]:引言应对全文起提纲挈领的作用,写清楚实验的缘由、目的和重要性
[正文]
实验原理:简要说明实验所依据的基本原理,实验方案、实验装置的设计原理等
实验材料(设备)和方法:说明选用的材料、设备和实验(观测)的方法
实验过程,或称实验方法、操作步骤等:主要说明制定的实验方案和选择的技术路线,以及实验的具体操作步骤,还要说明实验过程中试验条件的变化因素及其依据等
实验结果 :描述实验的结果,采用表格、图形、照片等形式给出
实验分析:对实验结果和具体的判断分析,证明作者结论的正确性
[结论]:概括实验得到判断和结论
[参考文献]:如果引用了其他作者的成果,应该在文章末尾列出参考文献

根据以上模板,完成对话中的创作需求。
以《研究人类睡眠质量和睡眠健康的相关因素》为题,对一定数量的受试者进行睡眠监测和调查,分析睡眠质量和睡眠健康与生活方式、环境因素、身体健康等因素的关系。实验需要考虑睡眠监测设备的准确性和受试者的个体差异。写一篇实验报告给我。

3.prompt构造注意事项

3.1 prompt格式要求
原则
说明
示例
优先输出markdown格式
标注数据输出格式,首先选择markdown格式,格式可参考https://github.com/xugaoyi/Markdown,格式要正确无误
注意markdown中的空格
  1. 无序列表 "-" 和有序列表“1."后必须加一个空格
  2. 标题#号后必须加空格
输入输出保持一致
如果query中包含markdown格式,那么输出一定要是markdown格式
关于代码、SQL、Json等输出
需要用代码块进行包裹,除非指令中明确给出提示或示例,如果放在markdown的代码块里需要是有indent=4的,如果在prompt里指出直接生成代码则不需要处理
句子、段落结尾必须有标点
一个句子的结尾必须有标点符号,可以是句号、分号等,有序和无序列表也不例外。只有单独是单词的情况,不需要标点
  1. 明天上午10点开会。
  2. 明天下午4点听报告。
  1. 北京
  2. 上海

3.2 prompt语法要求
原则
说明
示例
无语法错误
  1. 标点不正确,例如双引号不对称、缺少正确标点等。
  2. 无错字(asr转写带入的语气词不用处理)
  3. 无语病,病句类型可参考下表,病句类型说明
指令和输出对应
指令要涵盖输出的内容,输出的内容也一定要符合指令的要求。
你是一个文本扩写助手,请将下面的内容进行扩写。在扩写的时候需要保留所有的标题以及标题格式,然后在每一个标题下面扩写一段内容。所输出的内容在语言风格上尽量使用符合职场标准的书面语言。
good:
bad:

病句类型说明
病句的类型
说明
case
成分残缺
指一个句子缺少了应有的成分,影响了意思的表达。常见的是缺主语或宾语。
case1:
  • bad: 听了Robin在简单之约上的讲话,使我受到极大的鼓舞。
  • 修改:听了Robin在简单之约上的讲话,我受到极大的鼓舞。
搭配不当
指一个句子的各个成分之间搭配不符合语言习惯。
case1主谓搭配不当
  • bad: 智能语音识别水平正在不断地改善。
  • 修改:智能语音识别水平正在不断地提高。
case2动宾搭配不当
  • bad: 在本月的自我批判会上,一部分同学端正了工作目的。
  • 修改: 在本月的自我批判会上,一部分同学端正了工作态度。
语序不当
是指句子语序错乱,造成病句。
case1
  • bad: 博物馆展出了几千年前刚出土的文物。
  • 修改:博物馆展出了刚出土的几千年前的文物。
句式杂糅
两个句子糅合在一起,造成了句子不通顺的现象。
case1
  • bad: 古往今来,凡成就事业,对人类有作为的,无不是脚踏实地、艰苦奋斗的结果。
  • 修改:古往今来,凡能成就事业,对人类有作为的,无不是脚踏实地、艰苦奋斗的。
前后矛盾
指句子表述违背常理,造成前后矛盾的情况或者前后分句不对应的情况。
case1前后矛盾
  • bad: 本周各线条均没有进展,只有kr1有进展。
  • 修改:本周除了kr1有进展之外其他线条没有进展。
case2两面与一面不呼应
  • bad: 能否实现大模型效果达标,关键在于多积累数据。
  • 修改:能否实现大模型效果达标,关键在于有没有多积累数据。
词语误用
句子中词语感情色彩与句意不合而造成的病句,或关联词误用,就是词语误用。
case1褒词贬用
  • bad: 团队成员为了达成目标,可真是废寝忘食,处心积虑。
  • 修改:团队成员为了达成目标,可真是废寝忘食,夙兴夜寐。
case2关联词使用不当
  • bad: 因为我们没有解决好用户痛点,因而我们的产品才无法真正在用户中使用起来。
  • 修改:因为我们没有解决好用户痛点,所以我们的产品才无法真正在用户中使用起来
歧义
句子中同一语言材料,同时具有两种或两种以上意义的理解。
case1:数量定语易产生歧义
  • bad:本次与NLP的技术交流座谈,了解了许多张工的工作经验。(A. 多个姓张的工程师的经验;B. 姓张工程师的许多经验)
  • 修改:本次与NLP的技术交流座谈,了解了张工的许多工作经验。
case2:并列单独的搭配易产生歧义
  • bad:本次文心一言的发布会上,主要的领导和记者都来了。(A. 主要的领导 和 记者;B. 主要的 领导和记者)
  • 修改:本次文心一言的发布会上,主要的领导和主流媒体记者都来了。
case3:不同停顿易造成歧义
  • bad:今天下午供应的苹果不大好吃。
    • A. 苹果不大/好吃。(苹果大小合适,方便吃)
    • B. 苹果/不大好吃。(苹果味道不好)
  • 修改:今天下午供应的苹果吃起来味道不大好吃。

3.3 prompt基础要求
基本原则
关注内容
安全无害
Top1原则
  • 回复要符合中国国情和政治立场、法律法规及普适文化价值观,不带有歧视和偏见
  • 不主动提及各类安全敏感问题(如政治、黄暴、色情等)
  • 对于用户提及的风险问题,要给予正面积极的引导和建议
意图相关
  • 回复要充分理解用户的意图,满足用户的合理需求,并扣题,对用户有用、有益
  • 满足问题中的限制要求,比如字数、格式、内容、主题、关键词、语言等
真实可信
  • 回复提供的信息要准确、真实、可靠、有帮助。前提是符合中国的国情和政治立场、法律法规和文化价值观要准确
  • 对于时效性的问题,一定要以最新的状态为准
规范流畅
  • (除计算、代码类)答复要符合中文语言规范,要使用中文标点,避免出现字句、语法、标点等错误,保证语法正确、语义合理
  • 回复的内容符合逻辑、条理清晰、结构良好、表达流畅、用词准确
中立礼貌
  • 立场中立,观点要客观、全面,避免偏激、片面、武断的内容
  • 内容专业、理性,不卑不亢,但要保持礼貌温和,适当给予共情

复制
剪切
删除
正文
AI
智能创作
通用
图片
表格
附件
代码块
公式
超链接
提及
阅读统计
高亮信息
流程图
思维导图
文本格式
正文
一级标题
二级标题
三级标题
四级标题
五级标题
六级标题
无序列表
有序列表
待办列表
引用
分割线
数据表
表格视图
相册视图
看板视图
甘特视图
日历视图
架构视图
第三方应用
DuChatBeta
百度地图
CodePen
Figma

一、prompt构造建议

Prompt构造可以由以下几个部分构成:




1.1 提供任务陈述
对需要一言执行任务的概括性描述与附加条件的陈述,需要是一段固定的话术,同类任务的任务陈述全部相同

对任务的概括可能包含以下部分:
  • 需要一言执行的操作,如:“请根据会议对话生成会议待办,并指明每个待办的负责人”,“根据历史对话和外部知识,回答用户输入的最后一个问题”
  • (可选)prompt中将会提供的输入内容,如:“我们提供了一个功能列表,情请根据用户输入...”
  • (可选)期望一言返回的输出结果,如:
  • 格式要求:
  • 讨论主题:
  • 与讨论主题相关的沟通结论:

(可选)附加条件的陈述可能包括以下部分:
  • (可选)对返回结果字数的限制,如:“要求主题不超过40个字,沟通结论整体不超过100个字”
  • (可选)对返回结果内容的限制,如:“请注意不要输出任何解释信息”
  • (可选)对返回结果格式的限制,如:
  • “输出为json格式。输出的json中,key包括action和action_input,其中action的取值如下:
  1. 如果基于历史对话和外部知识可以回答问题,action为Response,action_input为问题的答案。
  1. 如果用户问题与【xxxx】事项无关,或者外部知识无法回答问题,action为OutOfDomain,action_input为空列表。”

注意:如果任务类型为“需要模型根据输入的背景知识,选择合适的结果返回”,则附加条件中必须说明当没有找到合适返回结果时,模型的兜底输出内容是什么。

1.2 提供相关材料
提供给一言模型的背景材料/需要一言模型处理的数据样本等,可以是对业务名词的介绍解释,提供背景知识的文字片段,需要被处理的样本输入等。

1.3提供示例(可选)
可以是供一言模型学习的输入输出的样本演示,给出一轮完整的输入输出对供一言进行学习;也可以是供一言模型理解上下文的数据示例,比如数据表的内容等
评论
用户头像
0 / 0
100%
0 / 0
100%