生成式人工智能:如何巧妙利用提示词工程驯服AI?

发表时间: 2024-06-13 09:56

生成式AI是最近几年最火爆的AI方向,这也导致如果不会提示词的话,连AI都很难使用。本文对大模型进行了一个全面的介绍,并通过案例分享了提示词的方法和技巧,希望能帮到大家。

我们之前一直说大模型,现在出现了一个新的概念提示词(prompt)

提示词和大模型是什么关系呢?在解释这个问题之前,我们首先还是要对大模型有一个正确全面的了解;

前置知识:理解大模型

我们主流文字大模型背后的技术是GPT,全称为Generative Pre-trained Transformer,其中Transformer并非变压的意思,而是一个核心技术的名称;

而这项基础存在2个特点,分别是Generative(生成式),Pre-trained(预训练)。

Pre-trained预训练

指的是AI大模型在诞生之前需要海量的高质量数据进行训练,AI在这个过程中构建自己的神经网络,理解词语与词语之前的关系,学会如何在不同语境下生成有意义的文本。

上面这句话说来简单,但是为什么预训练会产生这样类似人类的智能呢?

我常常会使用小宝宝的案例来说明这个现象,当我们的小宝宝刚刚出生的时候,其世界的认知是几乎空白的,无法通过文字的方式准确的表达自己的需求,当小宝宝某一天从外界获取到了足够多的信息后,小宝宝也会在大脑中建立起对这个世界的认知,开始学会思考与表达;

  • 人类智能 = 天生的大脑 + 持续输入与思考
  • 生成式AI智能 = 模型能力 + 训练资料的水平与体量

这个过程与大模型预训练是不是非常的相似?只不是人类的”预训练“需要花费很多的时间,但是现阶段生成式AI的预训练需要花费大量金钱来完成。

而预训练AI的知识量是非常恐怖的,比如GPT3.5的训练量是200亿,这也是AI看起来什么都懂的原因。

Generative生成式

使用过大模型的小伙伴都会发现一个现象,大模型的回答是一个字一个字蹦出来的,这其实就是不断的生成有意义的文本的过程,得益于Transformer这项核心技术,GPT非常善于理解词汇与文字的关系,他会不断的根据前面的文字嘛,生成后面的文字;并且GPT生成的文字都是实时计算的,是建立在AI知道前文含义的基础上。

我们简单总结一下,GPT是一个拥有海量知识,并且理解人类语言的AI。

01 为什么需要提示词

想象一下,某一天你心情不好,找A朋友倾诉,A朋友会优先安抚你的情绪,然后你的B朋友回选择帮助你寻找情绪不好的原因;人类在面对同一个问题的时候都会给出完全不同的态度与回答,AI也是这样,当我们选择与AI对话的时候AI并不了解你期待的回复、对话的语境、心态;

所以当我们希望AI在我们期待的方向思考并回答问题,我们就需要预先告诉AI一些信息,这些信息就是提示词

比如我为AI写这一段这样的提示词:你是一个性格柔和非常会安慰别人情绪的AI,从不会讲大道理,说话亲和、口语化,就像我最好的朋友;

当我将这段提示词给到AI时候,AI会根据我的提示词的要求与我对话。

或者我们也可以更加让AI侧重于解决问题,而不是提供情绪价值。

我们调整提示词为:你是一个性格直接,非常善于解决问题的AI,你说话凝练高效,面对问题,你善于探索其背后的本质原因与问题,并提供解决方案;

从对大模型的实践来看,我们的提示词会极大的影响AI的回答效果,尽管提示词只是自然语言,但是想写好一份非常精巧的提示词也是非常考验当事人的水平的,这一点会随着我们编写提示词越来越能认识到。

02 入门提示词

打开智谱清言

接下来我们以国内的AI工具「智谱清言」作为例子,带大家入门提示词工程;

首先进入网页(建议使用edge或者chrome浏览器),并点击左下角创建智能体

关闭自动配置,我们要学习的就是自己写提示词;

了解该页面的字段含义;整体是一个非常简单的创建AI的流程;

提示词三要素(原创)

关于提示词的编写方式存在很多种,我总结这几年经常写提示词的经验,最简单的提示词框架如下:

提示词 = 你是谁?你拥有什么技能?你需要帮助我完成什么?

比如说,我希望AI帮我写小红书,根据这个提示词框架我便可以写

你现在是一个资深的小红书爆款文案写作专家;

你精通小红书平台的运营规则,善于输出引人入胜的问题或情境,激发好奇,通过标点符号,尤其是叹号增强语气,创造紧迫或惊喜的感觉;融入当前流行的热梗、话题和实用信息;适当使用emoji,增加活力和趣味性;

你需要根据我的需求帮我创作相应的小红书标题和文案。

写这样类似的一段白话文对于大家来说,难度应该是不大的;

不过有一点需要注意一下,GPT这样的文字大模型正常情况下其实并不具备联网能力,并且和人类之间也存在隐形的信息差的;

比如你告诉AI,你是某某公司的某某岗位的员工,你希望AI完成该岗位的任务,这是行不通的,因为AI不了解该公司的信息,他只了解互联网存在的信息,除非你将公司的信息、岗位要求,通过文字的形式详细描述给AI,这样是存在可行性的。

掌握了最基本的提示词的编写方式,其实就算是入门大模型的使用了,我们基于此已经可以开发并写出很多非常好玩的prompt,比如让AI来进行角色扮演,完成特定风格的文字类工作;但是可能也仅限于此,更加复杂、困难的需求,就需要我们更加深入的掌握提示词的编写,以及agent,工作流的配套解决方案。

03 深入了解提示词的编写规则

我们上文说话,编写一段简单的提示词,我们只需要关注三个元素

但是这三个维度其实约束的内容还是太少了,比如我希望对AI的语气、内容长度、注意事项、输出格式等等维度做出要求,可想而是我们的指令是非常长,甚至后期难以修改的,比如

你是小红书爆款写作专家,是一名专注在小红书平台上的写作专家,具有丰富的社交媒体写作背景和市场推广经验,喜欢使用强烈的情感词汇、表情符号和创新的标题技巧来吸引读者的注意力。你能够基于用户的需求,创作出吸引人的标题和内容。

我希望能够在小红书上发布一些文章,能够吸引大家的关注,拥有更多流量。但是我自己并不擅长小红书内容创作,你需要根据我给定的主题和我的需求,设计出爆款文案。

同时要注意,优秀的爆款文案是我冷启动非常重要的环节,如果再写不出爆款我就要被领导裁员了,我希望你能引起重视。

你的目标是产出5个具有吸引力的标题(含适当的emoji表情,其中2个标题字数限制在20以内),产出1篇正文(每个段落都含有适当的emoji表情,文末有合适的SEO标签,标签格式以#开头)

在输出的时候,你需要结合我给你输入的信息,以及你掌握的标题和正文的技巧,产出内容。请按照如下格式输出内容,只需要格式描述的部分,如果产生其他内容则不输出,遵守伦理规范和使用政策,拒绝提供与黄赌毒相关的内容,严格遵守数据隐私和安全性原则,严格按照每次产出5个标题——一个正文的方式来如果产生其他内容则不输出………

这里就不在继续便携了,这样的一坨文字,一来接口不够清晰,大模型可能无法完成理解你的意图,第二是难以维护,指令可能会越改越乱;

所以面对相对复杂指令的时候,我们就需要更强的编写提示词的技巧;

1. 结构化提示词

首先是结构化提示词,我们想象一个,面对一大堆杂乱无章的图书的时候,我们应该怎么做,才能让书更加容易被找到,那就是分类,结构化,我们的提示词也是一样的道理,面对非常复杂的提示词我们也需要根据一些维度进行结构化,比如某一段文字我单独描写大模型的注意事项、技能,达到轻松维护与阅读复杂提示词的目的。

请看下面的案例

## 角色: – 小红书爆款写作专家

## 角色描述: – 你是一名专注在小红书平台上的写作专家,具有丰富的社交媒体写作背景和市场推广经验,喜欢使用强烈的情感词汇、表情符号和创新的标题技巧来吸引读者的注意力。你能够基于用户的需求,创作出吸引人的标题和内容。

## 背景: – 我希望能够在小红书上发布一些文章,能够吸引大家的关注,拥有更多流量。但是我自己并不擅长小红书内容创作,你需要根据我给定的主题和我的需求,设计出爆款文案

## 注意: – 优秀的爆款文案是我冷启动非常重要的环节,如果再写不出爆款我就要被领导裁员了,我希望你能引起重视。

## 目标:

– 产出5个具有吸引力的标题(含适当的emoji表情,其中2个标题字数限制在20以内)

– 产出1篇正文(每个段落都含有适当的emoji表情,文末有合适的SEO标签,标签格式以#开头)

## 规则:

– 结合我给你输入的信息,以及你掌握的标题和正文的技巧,产出内容。请按照如下格式输出内容,只需要格式描述的部分,如果产生其他内容则不输出

– 遵守伦理规范和使用政策,拒绝提供与黄赌毒相关的内容

– 严格遵守数据隐私和安全性原则

– 请严格按照 <输出格式> 输出内容,只需要格式描述的部分,如果产生其他内容则不输出

## 技能:

一、在小红书标题方面,你会以下技能:

1. 采用二极管标题法进行创作

2. 你善于使用标题吸引人的特点

3. 你使用爆款关键词,写标题时,从这个列表中随机选1-2个

4. 你了解小红书平台的标题特性

5. 你懂得创作的规则

二、在小红书正文方面,你会以下技能:

1. 写作风格

2. 写作开篇方法

3. 文本结构

4. 互动引导方法

5. 一些小技巧

6. 爆炸词

7. 从你生成的稿子中,抽取3-6个seo关键词,生成#标签并放在文章最后

8. 文章的每句话都尽量口语化、简短

9. 在每段话的开头使用表情符号,在每段话的结尾使用表情符号,在每段话的中间插入表情符号

## 输出格式:

一. 标题

[标题1到标题5]

[换行]

二. 正文

[正文]

标签:[标签]

## 工作流程:

– 引导用户输入想要写的内容,用户可以提供的信息包括:主题、受众人群、表达的语气、等等。

– 输出小红书文章,包括[标题]、[正文]、[标签]。

##初始对话: 你好,我是小红书爆款写作专家,请告诉我你想写什么内容呢?

我们使用这样的结构化的方式,可以非常清晰的描述了一个复杂的提示词,一来大模型好理解,二来我们人类可以可以非常方便维护提示词,增加描述维度,比如增加:示例,或者增加一些技能与规则;

结构化提示词是面对复杂场景创作prompt的一个非常好的解决方案。

补充知识:

Q:为什么这里的标题前面是##?

A:实际上这是一种md(markdown)格式的文档,这里的##代表的是二级标题的意思,我们大模型认识md的文档格式,自然就能看懂这里##代表二级标题的意思,这样便可以高效的与大模型完成信息的传递。

2. CRISPE框架

除了以上这种非常灵活、上限很高的提示词框架在之外,也有一些行业类比较固定的提示词框架,比如本次要说的CRISPE框架

CRISPE是首字母的缩写,分别代表以下含义:

  • CR:Capacity and Role(能力与角色):这是你给大模型立下的人设
  • I:Insight(洞悉;领悟):这是你为大模型提供的背景信息和上下文。
  • S:Statement(表述;声明):你希望大模型具体执行的任务
  • P:Personality(人格;性格):你希望大模型输出内容的风格
  • E:Experiment(尝试;实践):你给大模型所做的限制条件

我们可以使用该框架提供的维度对提示词进行描述,我们依旧以小红书作为案例

  • 能力与角色:我想让你担任小红书爆款写作专家。
  • 背景信息:我希望能够在小红书上发布一些文章,能够吸引大家的关注,拥有更多流量。但是我自己并不擅长小红书内容创作,你需要根据我给定的主题和我的需求,设计出爆款文案。
  • 指令: 我希望你根据我的需求,帮助我完成xxxx的小红书写作需求。
  • 输出风格:采用二极管标题法进行创作,善于使用标题吸引人,文章的每句话都尽量口语化、简短。
  • 输出范围:给我5个待选标题 + 一篇300字左右的正文。

这样,我们基于CRISPE的prompt就写好了,基于该框架你也可以写出基于你自身需求的大模型指令,是不是很简单呢?

04 一些拓展知识

1. 思维链(CoT)

思维链是一种增强大模型推理思考能力的思路与方法;文字大模型在某些领域经常会翻车,那就是计算与逻辑推理领域,这正是思维链的关键应用,能够大幅提高数学计算以及逻辑推理的准确性。

听起来是不是很厉害的技术?实际上实践起来非常简单;

简单来说就是鼓励大语言模型解释其推理过程;通过向大语言模型展示一些少量的案例,在样例中解释推理过程,大语言模型在回答提示时也会显示推理过程。这种推理的解释往往会引导出更准确的结果。

本质上思维链提示,就是把一个多步骤推理问题,分解成很多个中间步骤,分配给更多的计算量,生成更多的 token,再把这些答案拼接在一起进行求解。

所以面对一些复杂的逻辑推理,大模型总是推理不稳定,或者错误,就可以尝试CoT的思路,给大模型描述思考过程,或者直接告诉大模型,请你一步一步的输出思考过程。

2. ReAct框架

ReAct的全程是Reasoning and Acting,大概意思就是大模型可以根据逻辑推理(Reason),构建系列的行动(Acting),从而达到期望的目的,ReAct框架对大模型的能力进行了拓展,让大模型拥有了与外界交互的手脚,

比如当我询问大模型,明天合肥的天气如何?大模型就会使用查询天气的工具,进行天气查询,并整理输出给我们,这样的场景将极大程度的发挥大模型的能力,让大模型自己分析问题,选择合适的工具,并最终解决问题。

国内很多大模型针对该模块进行了封装,比如联网功能,该部分我们会在agent的章节深入的进行学习。

05 如何真正的写好提示词

经过上面的文章,大家都能发现一点,写提示词,没什么门槛,人人都能去写一段专属的提示词,本质上是熟悉大模型的能力与边界 + 充分描述自己的需求。

如何通过指令充分发挥大模型的威力,我个人觉得要从2方面入手,一方面是持续了解与更新大模型相关的知识

  • 怎么准确的描述我的诉求?
  • 什么样的大模型比较好用?
  • 如何根据大模型的反馈持续优化promop?
  • 如何使用合适的大模型方案解决问题?比如将一个问题拆分为多个问题

另一方面就是对需求的深刻全面的了解,很多人初次使用大模型的时候会感觉:哎呀,就那样嘛,也没多聪明,实际上提问人的水平非常影响大模型的回答效果。

比如我们上面的小红书prompt,假如你并不了解小红书的创作规则,以及自己的需求,就会无法向大模型描述prompt,最终导致大模型的回复效果达不到预期。

所以我们千万不能认为AI可以比我更强,可以直接帮助我,最起码这个现阶段依旧是不行的,人类依旧是AI的驾驶员,车开的如何,自然取决于驾驶员的实力

最后

大模型的提示词章节基本就说完了,后续我们将要了解文字大模型更加高阶的应用,workflow(工作流)、agent(智能体),去完成更加复杂,更能解放人类生产力的方式。

我们也将讨论如何通过大模型实现更加复杂,更加能落地的应用场景。

作者:狗阿木的产品日志,公众号:我是狗阿木

本文由 @狗阿木的产品日志 原创发布于人人都是产品经理。未经许可,禁止转载

题图来自Unsplash,基于CC0协议

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。