所有文章 > AI驱动 > 大模型Prompt技巧
大模型Prompt技巧

大模型Prompt技巧

提示工程(Prompt Engineering)

提示工程不仅仅是关于设计和研发提示词,还包含了与大语言模型交互和研发的各种技能和技术。提示工程在实现和大语言模型交互、对接,以及理解大语言模型能力方面都起着重要作用。提示工程可以赋能大语言模型,比如借助专业领域知识和外部工具来增强大语言模型能力(例如RAG)。

链式思考(CoT)

链式思考是提示通过中间推理步骤来实现复杂的推理能力,以获得更好的更正确的推理结果。

思维链的主要思想是通过向大语言模型展示一些少量的 examples,在样例中解释推理过程,大语言模型在回答提示时也会显示推理过程。这种推理的解释往往会引导出更准确的结果。

论文地址:https://arxiv.org/pdf/2005.14165

零样本思维链(Zero-shot-CoT)

在问题的结尾附加“Let’s think step by step”这几个词,大语言模型能够生成一个回答问题的思维链。

Zero-shot-CoT 是一个 pipeline。也就是说“Let’s think step by step”这句话,只是通过这个 prompt 让LLM 尽可能生成一些思考过程,然后再将生成的 rationale(理由) 和 question 拼在一起,重新配合一个answer 指向的 prompt 如“The answer is ”来激励模型生成答案。

自动思维链(Auto-CoT)

Auto-CoT 主要由两个阶段组成:

  • 阶段1:问题聚类:将给定问题划分为几个聚类
  • 阶段2:演示抽样:从每组数组中选择一个具有代表性的问题,并使用带有简单启发式的 Zero-Shot-CoT 生成其推理链

CBR模式(Case-Base Reasoning)提升任务成功率

核心思想:他山之石,可以攻玉。利用以往解决类似问题的经验来解决新问题。

  • 首先检索出与任务相关的人类专家知识,并获取对应详细的案例。
  • 根据详细案例,进行新的任务推理。

基本结构

[任务]
{}
[解决方案]
{}
现在请根据上述文本洞察解决以下任务。
[任务]
{}
role:你是一个客户端高级测试工程师,能够对客户端UI界面的各种问题进行判断,这里是一些发生过问题页面的例子,能够帮你完成页面显示问题的分析任务:

[任务]
你是一个客户端高级测试工程师,下面是之前发生过UI问题的例子描述,请按图片顺序进行分析。
内容要求:
1.分析传入的图片,识别出页面中所有的控件和文本,忽略顶部系统通知栏和底部菜单栏。
2.对每一个控件元素和文本元素都进行判断(顶部的通知栏和底部的菜单栏不需要参与分析),分析元素本身的问题,一般存在的问题是缺失、不完整、展示不全、颜色过浅、没有单位、小数点错乱等,
3.基于整个UI界面的布局进行分析,一般存在的问题是按钮未对齐高度不一致、元素位置错乱、元素之间遮挡、整体布局错乱等
4.按顺序分析每张图片,后一张图片的分析需要借助之前的图片分析结果,很有可能出现类似的问题,保证你的判断结果准确,并且给出对应的判断理由,当判断为符合时,需要说明符合的校验条件是什么,当判断为不符合时,需要说明不符合的校验条件是什么。如果无法从给定的图片中判断出结果,判断结果为不符合
5.你需要在判断结果中,输出以下信息:
a.判断结果:
b.判断理由:

格式要求:
请按照如下json格式输出,reason使用中文,不要输出其他无关内容:
{
"result":"pass/fail/error",
"reason":"...."
}

如果没有问题,result=pass,有问题result=fail,如果无法进行准确判断或者依据不足,则result=error
6.请分步骤思考这个问题
7.你要对输出结果认真检查,对你的答案负责,其中大概率不会发生UI问题,所以一定要仔细判断,给出足够可信赖的判断依据,如果如法判断,就将结果置为error,只需要输出一条结果


[解决方案]
第一张图片分析后组合成JSON结果输出
{
"result":"fail",
"reason":"识别到右下角两个蓝色按钮,都存在问题,第一个按钮的红色标签没有显示完全,第二个按钮的文本存在缺失问题,没有下发券后价"
}

现在请根据上述文本洞察解决以下UI问题分析任务。
[任务]你需要分析的图片是输入图片的最后一张,需要借助之前的图片分析结果,很有可能出现类似的问题,保证你的判断结果准确,并且给出对应的判断理由,只需要给出最后一张图片的分析结果,
格式要求:
请按照如下json格式输出,reason使用中文,不要输出其他无关内容:
{
"result":"pass/fail/error",
"reason":"...."
}

如果没有问题,result=pass,有问题result=fail,如果无法进行准确判断或者依据不足,则result=error

特点

CBR模式基本还是一个方法和策略,需要配合其他prompt工程一起使用。

参考

  • 提示工程指南:https://www.promptingguide.ai/zh
  • 大模型思维链(Chain-of-Thought)技术原理: https://zhuanlan.zhihu.com/p/629087587
  • 智能体DS-Agent基于案例推理:https://www.jiqizhixin.com/articles/2024-03-27-4

原文转自 微信公众号@MagicMirror魔镜

#你可能也喜欢这些API文章!