NewBranding
牛/白/丁
欢迎来到「牛白丁」,在这里,你将听到来自华创资本和我们的朋友们,一起聊那些跟创业、投资、科技、消费、互联网......相关与不相关的人和事,回忆片段与瞬间,剖析认知和思考。
这是「牛白丁」对话AGI系列第一期,做客嘉宾是天旦网络联合创始人、CEO杨光辉。
欢迎听友们关注「牛白丁」喜马拉雅、小宇宙官方账号,与我们一起用耳朵感受「时常有趣、偶尔深刻」。
“我宁愿活着见证 AGI,而不是活在没有它的过去。”最近,发表这一言论的马斯克也加入了AI 战局,并预测2029年将会实现通用人工智能(AGI)。
在天旦网络联合创始人、CEO杨光辉看来,2029 年,很多没听说过的公司,或者今天行业里的第四、第五名甚至第九名的公司,会因为应用了 AGI 而一跃成为行业里的第一、第二名,使得所有公司一致认识到原来 AGI 的应用可以如此深刻地改变生产力。“很多聪明人会投身在那些改变迅速的行业里面,这也是每一个浪潮来临的特征。”
为抓住这股浪潮,7月初,天旦正式发布业界首个运维大语言模型 OpsGPT,这是一款具备运维专业知识的大语言模型,它能够解答复杂的运维技术知识点并进行推理分析,就像 ChatGPT 为用户提供各种信息和建议一样,OpsGPT 也希望能满足运维工程师们借助人工智能高效解决复杂技术问题的需求。
尽管还在摸索技术的工程边界,但站在今天设想未来,杨光辉会去拥抱那些最愿意接受改变的细分领域。因为很多时候世界的变化,通常不是由于每个人自发意识到了未来很重要,而是彼此比较才会产生变化。而他觉得一个细分领域的改变需要时间,“有的时候甚至是要消耗一代人的。”
您将在本期节目中听到以下内容:
运维领域的通用模型 OpsGPT:缘起与商业化应用的思考
大语言模型领域发展的两种思路:从头训练和增量微调
软件业五年内将发生的变革:后开发时代,AGI Ops
GPT 技术演变对人类社会的影响:又一个Java时代,“Prompt Once,Solve Everyting”
Prompt Engineering:软件开发的新范式
AI Agents 与软件开发:goal-oriented 与 function driven
AI-Native 的核心使用场景:AI Replacement
科技公司创始人如何使用GPT:商业决策的探讨、客户分析与模型本身的学习
嘉宾介绍:
杨光辉: 天旦网络联合创始人、CEO
主播:
谢佳: 华创资本合伙人
候晓雯: 华创资本投资人
以下为节目内容,经过 CGCVC 编辑——
谢佳: 大家好,这里是华创资本的播客节目「牛白丁」,我是华创资本投资人谢佳。这期节目的主题是 AI 在运维行业的应用,很高兴邀请到了华创派企业天旦网络的联合创始人、CEO 杨光辉。
候晓雯: 我是华创资本投资人候晓雯。
杨光辉: 非常高兴有机会跟大家连麦探讨关于 AGI、AI 的话题。天旦网络是一家智能运维公司,我们主要的产品是针对大型企业的复杂业务系统出现了问题,做实时的故障定位分析,以及提出进一步的建议,快速地恢复或修正。我们目前主要的客户是大型金融机构,包括国内 100 多家银行、几十家券商、保险公司。我们也试图给大企业交付标准化的产品。跟运维、业务的特征相关,原本可能有一些个性化的需求,我们试图把它产品化。所以一定程度上我觉得叫智能运维,也代表着这个产品本身必须有相当强的适配能力。
谢佳: 天旦在运维领域是很知名的企业,天旦在7月份推出了业界首个 IT 运维大模型 OpsGPT,请光辉简单介绍一下 OpsGPT 的产品形态,比如它能做什么呢?
杨光辉: OpsGPT 实际上是源于一个内部探讨。ChatGPT 等开源的大模型,有非常多有创想的部分,大家都很兴奋。但具体到一个特定的领域、业务场景,它到底能做到什么样的程度?
我们首先模拟了一个客户视角的思维,到底有没有可能将来的工作依赖于某一个大模型?我们的客户动作也非常快,这两个月跟一些客户交流,他们其实已经搭起了类似于 ChatGPT 的内部模型,但是稍微深究一下就会遇到一个问题,由于大模型本身有一些知识的预训练,语料的版权或者选材的限制,导致缺少一些领域当中的知识,缺少正确的回应或者识别。日常对话当中也许没有被发现,但在一个特定的领域当中,一交流就会漏洞百出。打个比方,今天拿任何一个大模型,不管是 Llama 2、LLaMA,还是 ChatGPT、GPT-4 ,如果问我们这个细分领域的一些专业问题,甚至很简单的问题,比如 IP 地址分成了 A 类、B 类、C 类,问某一个 IP 地址到底是哪一类?因为不同的 IP 地址类型会导致配置需求不一样。想象中大模型应该读过很多 IT 行业的书籍,对此应该了然于胸,但实际上错误率非常高,大约有 90% 的错误率。所以,如果要在这个领域中真的把技术落实下去,就要解决好这个领域当中一些特定的技术,能够让大语言模型用非常高的正确率,非常好的理解方式掌握下来。有了这个基础以后,我们的用户才有机会把大模型的技术推广到更多使用场景当中。
如果将来一个客户可以非常信赖这个体系,它会怎么评判?第一部分是知识的角度,有一个很好的数据来源,就是企业在招聘运维岗位的要求,岗位需要有什么样的知识?我们汇总了不少的岗位要求、招聘要求,在这当中去找到共性。比如 CCNA、CCNP、CCIE 或者华为、华三(H3C)的各种认证,还有一些网络经验或者排障经验等等,这是针对网络岗,我们把这样的一些要求提取出来。当然系统岗、监控岗还有不同的要求,我们把这些要求提取出来以后,为它制定了一个学习计划,如果让一个大语言模型能够像人一样把这样领域的知识很好地训练,也许可以帮助到用户在使用场景当中,提出一些建议,给出一些策略,甚至自动化地执行动作。
这是 OpsGPT 的基础定位,首先是增加领域知识,其次是增加推理能力。因为运维行业是一个对 reasoning、对因果推理和关联性推理需求特别旺盛的细分领域,非常注重相关性和因果性,注重可靠性的程度。因为要基于这样的原理去判别、推断,做下一步的排除障碍,或者分析问题的策略。
现在大模型表现出了一些基本的推理能力,但仍然有不少弱点,尤其到了一些细分的技术领域,它很难做出非常准确的推理判断。在大模型里面有一个 Prompt Engineering,有个词汇叫做 CoT (思维链,Chain-of-thought),就是利用了 Prompt 当中的一些技巧,可以让大模型产生一些类似分步推理的输出效果。但我们考虑,如果让这个模型非常稳定地达到这样一个效果,我们把 CoT 不作为一个 Prompt Engineering 上的涌现(涌现能力,Emergent Abilities),而是作为训练语言模型标准的一个非常有可靠的 CoT 的能力,类似组合了知识推理以及专业技能的设计。我们设计了这样一个 OpsGPT 的模型构建,准备了大概 30 万条语料,做了初步的训练,然后它已经能够在一些 CCNA 的考试和网络问题的推理中取得相当好的成绩,达到 93%+的准确性,比原先的标准模型成功率提高了非常多。
当然因为这个领域还缺少论文和更多的实验来佐证,我们也在刚刚起步,在探索运维大模型的过程中,但我们已经在试验怎么整合到现有的产品当中。
谢佳: 年初的时候,我自己会倾向于认为相较于通用模型,领域模型可以更快地聚焦到解决某一类行业或者应用场景领域的问题。但最近,我觉得通用模型 AGI 应该是代表未来的路径,因为足够通用,大到一定规模才有可能有更多所谓的涌现能力出现。领域模型和通用模型也不完全是两条截然不同的路,所以基于未来更强的通用模型的能力之上,再来给予领域的 domain knowledge 就可以生成更加智能的能力。
所以,在运维领域之上做一个领域模型,怎么样来平衡领域模型聚焦行业的 know-how 以及通用底层,它的 reasoning,它的理解能力,如果未来能够有更突飞猛进的各种能力涌现,怎么能把通用的能力给用好?
杨光辉: 你提到了通用模型和 AGI 这两个词,在我看起来这两者的差异还是非常大的。今时今日 OpenAI 和伊隆·马斯克都提到了他们要在 2029 年年底之前实现 AGI 。这其实引用了一个典故——1962 年,约翰·肯尼迪,当时的美国总统在国会宣布十年里面,他们要实现载人登月,这是一个很难的工作,约翰·肯尼迪发动所有人去支持这件事情。在 1969 年,他们完成了这个工作,NASA完成了载人登月的发射,真的在月球上踩下了脚印。
在美国的文化里,当说到 decade,是一个有非常强的文化符号的描述。那在 AGI 里指的是什么呢?这跟载人登月有很大的不同,载人登月很明确,就是让至少一个宇航员在月球上踩下自己的脚印,能不能回来不重要,至少要踩下那个脚印。但在 2029 年要实现的 AGI 到底是什么?其实是不明确的。所以回到原点上,通用领域模型到底跟 AGI 有多大关系?我认为这件事情其实是缺少定义的,最近几年里,大家会去尝试定义它,我看到的AGI,至少它应该满足一些最基本的要求,就是要能够取代大多数人类能够完成的工作,跟人类的表现一样。
在大多数工作里面,不管是搬砖、推理还是完成视觉任务,类似操作鼠标,它完成的是自动化的执行任务,总体上要跟人类达到一个相近的状态。也许到时候会定义出来一些 AGI 的 Test,有点类似于图灵测试,通过了才会被认为是个 AGI 领域模型。
大模型到底在这里面起到什么作用?我认为它只是其中的一部分,就像之后 GPT-5 或者 GPT-6,到 2029 年也许 是 GPT-7、8、9 ,在当时可能已经不是今天看到的 GPT 模型的样子了,至少应该把视觉的、听觉的、很多其他的能力,甚至行动的能力包含在内。
GPT-4 已经用到了MoE(混合专家模型,Mixture of Experts),就是用多种专家模型共同实现一个总体 GPT 效果。我看到的领域模型跟 AGI 未来的变化之间是不冲突的。最后真正的 AGI,可能是组合着几百个领域模型,通用模型可以解决所有的问题。但是重点不在模型本身,重点是最后整体的 AGI 实现效果,今天的 GPT-4 用了 16 个模型,按照各种传闻,它的 16 个模型的结构是一样的,只是训练的语料不一样。所以可以认为它是 16 个不同概念上的领域模型。
我们在做的 OpsGPT 这个领域模型,它在解决网络细分的问题,跟运维更相关的深度解析。起步从网络开始,因为我们的语料在这方面是最多的,之后会把更多的运维语料加入进去,在运维当中形成非常深刻的洞察和解决问题的能力,之后它也可以成为一个 MoE,就是多专家模型的一个组件。如果将来这个模型它既要解决运维问题,又要写诗,还要跟人谈笑风生,讲一些笑话,可能要组合多种模型,形成一个综合体。这个综合体未必是简单的一项。今天大家看到下载模型是一个文件,一个文件不是 AGI 未来的实现方式,它很可能是多个模型甚至无数多个模型的组合。这是我认为 AGI 高概率的发展路径。今天说 2029 年要实现AGI,意味着技术路径今时今日已经大体看明白,也就是不会用一些还没有成熟的或者还没有发现的技术去实现 AGI,是用现有的、已知的技术去实现 AGI,所以这种多模型的模式很可能就是一个终极的企业。在这当中,我觉得大家不用太小看领域模型将来的价值,这是第一个。
第二个,刚才 Jake 提到训练领域模型,会不会因为太偏重于领域导致没有发挥出大模型技术的特征,导致变成了一个很细分的,只解决一个领域的、细分的、特别窄的问题,某种意义上可能它不是一个 AGI,是一只老鼠,只会吃粮食。
我相信很多组织在做领域模型的时候确实有两种思路:一种类似 Bloomberg,训练BloombergGPT,是从头开始训练,准备了全部自己的语料,也准备了一些公开的金融语料,从头开始训练,试图去构建一个好的模型。
另外一种更常见、更普遍的做法就是在现有模型上面做一些增量的微调,这也是我们选择的方式。对于中国大多数组织来说,是不得不选择的道路。在训练微调的过程里面,基于大模型本身的优势,再去增加特定领域的知识。训练的前提就是要发挥出原来基础模型的原生能力,而不是覆盖或者跳过它。直接拿一个单独领域的语料训练模型,根本达不到大模型的效果。但挑战也是有的,因为在我们训练的过程里面确实发现了这个问题,比如你很注重训练一些题目的解题能力,训练完成以后会发现它确实很顺利,问绝大多数问题它都当做是一道题目去解了,不再按照正常的对话或者扩展的逻辑。所以,在这个训练当中有相当多的经验和踩坑的过程。要把这个基础模型的能力仍然保留,但又要增加特定领域当中能够处理和解决新问题或者专业问题的能力。我们做了好多不同的尝试,才找到了一些方法解决了这个问题。他们说这有点像炼丹,原来我没有特别强烈的感受,但是做了一次以后,我发现确实很有炼丹的一些特征。
谢佳: 所以在通往 AGI 的路上,我们还在探索的过程中。MoE 这个方向容易让大家想到人工智能的上一代技术,因为专家模型并没有把我们真正带向更加通用的人工智能。但就像光辉刚才所讲的,通向 AGI 的路上,MoE 可能也是一个正确的路径,还需要很多的探索。关于 OpsGPT 我还蛮好奇的,它会是一个完全不同的独立的新产品吗?还是类似于微软的 Copilot,在它已有的产品矩阵当中可以调用?
杨光辉: 一开始,我们内部也在研讨它究竟应该发挥什么样的作用。实际上每个组织对于 GPT 这样新的大模型技术,到底给现有的技术产品带来多大的影响,都有不同的看法。我觉得 Copilot 总体上代表着用交互式的对话引导一些现有的功能实现过程。Copilot 有基本的诉求,要用来作为新的客户的交互界面,去更容易调动一些复杂功能。这就有两种前提,第一客户需要一个对话的界面;第二这个软件已经相当复杂,它需要用对话式的、非精确的、模糊的语言来实现功能的组合,得到一个目标效果。相当多的企业产品也许没有达到这么复杂的程度,类似于我们这样的公司,我们的使用者使用水平相当高,未必需要一个对话式的界面去解决绝大多数的问题。我们确实也可以提供一个类似 Copilot 的使用角色和使用体验,比如增加新的企业级的 UI 设计来支撑这种模式。但是,跟只是打开一个聊天窗口完成 ChatOps 的工作,可能会有相当大的差异,因为那些工作原本用对话式的窗口,其实它也在寻求确定性,而不是寻求不确定性,它是用一些快速的对话窗口来实现一些命令脚本的执行。这是过去在这个领域当中大家的尝试。但我自己认为 OpsGPT 要承担一个更复杂的角色。
我们看到大模型在软件行业里面,能解决的问题涉及四个主要的能力:第一个能力是它对于任何进来的数据信息,当然是文本为主的,现在也可以演变成图形,去进行有效的分类,把问题归到不同的类别里;第二个能力是提取关键的语义对象,把一些跟分类的问题有关的语义对象进行提取,进行进一步加工的准备;第三个能力叫做规划求解,对于复杂语义和分类,前面的元素都已经准备好以后,它可以提供一个灵活的求解过程,可以做计划,可以做决策的支持,帮助设定一个解决方案;第四个能力是实现一些以前完全没法实现的行动,比如现在可以编程写出一段脚本程序,执行以前从来没有存在过的一段代码,去完成一个特定的操作。
原来我们这个领域想要开发出一些带有智慧的软件是非常困难的。现在大模型提供了可能,把这四个步骤变得相当简单,开发人员不需要有非常复杂的知识、测试,以及预先的、大量的研究就可以迅速构建起一个能够利用分类去提取语义对象,然后规划、求解,最后产生特别复杂的行动的新一代软件。
我们自己对于 OpsGPT 的期待,是让它成为新一代软件的核心。未来的软件本身会有一个自己的思维能力,这种思维能力会变成新软件的一个非常重要的特征。那 OpsGPT 就是这个新软件新的思维能力的表现,它可以表现在类似于 Copilot 这样的 UI 设计上,也可以表现在比如我们这个细分领域当中,看到运维的告警信号产生的一些特定的数据以后,进行分析和产生行动的建议,最后创造一些新的方式方法来解决特定的问题。所以软件的逻辑会被 OpsGPT 大幅度改进,这是我们长期的期待。
短期我们也看到了一些有意义的尝试,我们会拿着 OpsGPT 做一个 Copilot,或者 Copilot plus 帮助客户快速实现一些有效的分析,有点像科研助理的角色。但长期我们是希望它成为新一代带有智慧的软件的真正核心组件。
谢佳: 听到了非常底层的思考。那么一个普通的客户要把 OpsGPT 用起来,需要做些什么样的配合?是否也需要学习一套新的和 OpsGPT 这套软件交互的方式,在理念方面会有一些和传统软件完全不同的使用办法吗?是不是要有相关的配套投入,才可以把这套东西用起来?
杨光辉: 天旦是一家产品型的公司,我们并不想把技术的复杂度留给客户。我们还在产品化过程里,会把一些技术细节进行抽象,给到客户的仍然是非常精简的,也许都没有一个聊天的界面、对话的界面,它体现在一些功能里面,新的工作流程跳转,点击到一个告警以后,下一步的操作并不是预先预置在原来死的代码里,或者配置文件里,会产生 GPT 的引擎推理出来新的结果,是已经封装完毕的实现。
大家对这种技术怎么样应用在企业内部很感兴趣。有个客户甚至提出,既然我们把很多的题目训练已经做进去了,是不是有可能生成一些模拟题、仿真题,帮他们做内部的考试认证?
我觉得我们可能会跟以前时代的软件不一样,也许会帮助我们的客户 enable 起来,让他们一块儿掌握怎么去训练一个模型的能力。我们不认为训练模型能力会是我们未来的核心价值,真正核心的是什么呢?是掌握从模型构建到语料数据的策略,到软件的构建,到 Prompt 的设计,以及整个软件体系当中,怎么样把它的那些能力尽可能发挥出来的整个工艺的流水线——这会是未来公司的真正竞争力。
所以我们积极地帮助客户,把 OpsGPT 用到组织里去生成题目,帮助他们做人员培训、面试等,进行赋能的试点工作。这些试点工作的核心目的都是为了让我们理解 OpsGPT 在哪些方面的训练是足够的,哪些方面可能还有欠缺,哪些方面的推理能力是有用的,哪些方面可能还有不足,帮助我们理解它的局限性。毕竟这个技术从发扬光大到大家开始逐渐考虑怎么样落地,时间还比较短,所以我们需要迅速地摸索它的工程边界。
候晓雯: 你刚刚提到,有客户觉得运维的领域知识可以作为人员培训或者能力验证的方式。我们在关注大模型的时候看到大模型所展现出来的通用能力,以及在未来 AGI 的过程中,越来越发现模型能力是没有边界的,可能真正的边界在于比如工程化或者商业的边界。你之前也提到过,觉得 5 年内软件行业会被彻底颠覆,展开阐述一下?
杨光辉: 某一种技术产生以后,都会有两个不同的方向去辩论。一种是比较积极、拥护的,另外一种是谨慎的怀疑。每一种技术在一开始都会有足够多的热度,但落实的时候遇到的问题是一开始投入的时候想不到的。
对这一轮的 GPT,很多人有不同的比喻,既有像 Nvidia 的老大老黄说的,这是一个 iPhone 时刻,是一个全新的通用的新交互平台,是一个重大的改变。也有一些投资行业的泰斗说,这是 Internet 重新发明的类似效果,因为它带来了信息的不同组织和提供方式。都非常有道理,但是从我们这个领域出发,会发现有另外一种挑战。
打个比方,尽管 iPhone 已经出现很久了,对企业的运作到底带来什么样的影响?这种影响可以是手机客户端,导致系统访问量上升,数字化程度提高,但是它对企业内部的使用是几乎没有产生直接的影响。所以 iPhone 时刻某种意义上是创造了一个新的颠覆式的,对整个消费领域和日常使用领域,一个重大的使用习惯的改变和新的商业模式。但是具体到一家企业,内部的变革影响其实并没有那么明显。
对于一家企业,用 iPhone 或者 Internet 来比喻 GPT 是不恰当的,因为每一个比喻在定义的时候就会有它的局限性。当然我们并不是严格一定要找到一个类比,因为我们今天可能并不是科学的、严谨的探讨,这只是有助于我们做评判或者推演。GPT 这样一个技术,在企业当中它更像是 1995 年刚刚发布了 Java 的状态,或者更准确的是 2000 年左右的时候,企业级的 Java 技术,真正被开始推动到企业当中,非常像这个阶段。
当时 Java 解决了一个问题,叫做 "Write Once, Run Everywhere",写一遍代码就可以在所有的平台上运行。这跟今天 GPT 在解决的问题,有一些神似的地方,比如 “Prompt Once, Solve Everything”。Java 对于整个企业级的应用信息化程度带来了深刻的影响,不是简单一年两年,带来的是二十几年整个软件业的变革,从过去软件,比如 C 语言、C++语言,必须是由一群智慧超群的优秀大学毕业生才能加入的行业,逐渐转变成非常多不同行业的人也能加入。因为内存不用管理了,很多的安全特征都不需要自己设计了。整个 Java 的体系都已经构建完毕,只要写好以后,也不用担心在平台上运行会有什么样的特征。Java 语言出现以后,哪些公司最受益?开始的第一阶段,是那些硬件公司最受益,因为 Java 非常缓慢,消耗很多资源,所以当时 IBM、Sun Microsystems、HP 等公司都非常兴奋,非常积极加入到了 Java 的大浪潮里,它们原来的服务器内存、CPU 这么多,卖不掉。但是一下子由 Java 应用带来的巨大变革,使得每个企业都需要购买更多的计算资源。
我刚才说 Java 的资源用来消耗并不是一个缺点,而是它用计算资源的方法和软件的优秀设计,取代掉了缓慢的人员培训,取代掉了大量的很难写的程序,维护程序的问题。当然,很多年以后 Java 也很难维护,但是当时乃至现在看仍然是一个很成功的实现。这种技术的演变甚至塑造了互联网。比如淘宝最早真正服务于成千万、上亿用户的系统,是构建在 Java 应用上的,如果当时没有 Java,用 PHP 可能要消耗几倍的开发资源,要消耗更多的人才,更难成功实现一个互联网的通用方式。GPT 非常像这种技术,进一步下降了未来软件开发的门槛。
很多人说,Prompt 就是一种开发软件的方式,我不想简单重复这个观点,我更多想说的是,如果你往后看,Java 也许是帮助这个世界从 30 万核心程序员扩展到 300 万甚至 3000 万人,都能够参与到大规模的企业应用开发的程序员生态的构建中。而 GPT 会让信息化或计算机系统的深入能力的潜力挖掘,从原来 3000 万的使用者,变成 3 亿、 30 亿的使用者,从复杂的软件构建、新的网站、新的业务系统,原来可能 300 万的开发者变成 3000 万甚至 3 亿的开发者。每个人都可以为自己开发,每个人都可以为别人开发,这件事情是 GPT 带来的一个在我看起来真的是巨大的变化。
我们花了挺多的资源想去验证到底离这个未来有多远?因为很大意义上涉及我们当前把这个大模型技术投产,到产生某种意义上的稳定可靠的软件,在软件上实现一层 Prompt ,能够让更多人进行开发调试这样的一个工程的做法,到底有多快的速度可以成熟?
Java 是 1995 年发布的,一开始它倾向于 client,就是在浏览器里面塑造一个 JavaApplet,他的"Write Once, RunAnywhere"一开始是想在网页里面实现,最后失败了,因为 client 没有那么多资源,但是它找到了 Server,就是 data center 这个领域,最后找到了发展的途径。
与之相比,GPT 一开始就没有错过任何东西,因为大家已经有非常多的经验,知道怎么去面对过去的挑战。所以它既提供了 ChatGPT 这样的自我实现,提供给大量用户使用,这种模型本身又能够在企业环境里面解决很多特定的数据训练。它的计算平台已经快速成熟了,不像当年 Java 出来以后,大家在那缓慢地跟踪。
跟 Java 时代还不一样的是开源。最近 20 年,开源行业的演变令人震惊,如果 Java 现在重新发明,可能会在三个月之内出现无数个各种各样的项目跟 Java 抗衡。当年 Java 能够垄断是当时的特征导致的,今时今日,Open AI 不会垄断,它只会带来一种新的技术创想,无数人在这当中可以获得新的机会,构建起一个新时代的软件层。
我们最近试图找到一个真正的验证方式,就是怎么样能够把这样的能力赋能给更多人。第一,遇到了很多挫折和问题,比如让 GPT 编程,结果它的成功率平均只能达到 40~50%;第二,Prompt Engineering 随机性的设置,即便是一模一样的 Prompt,跑出来的结果每次仍然不一样,大家不能准确地把握住里面的差异到底在哪里,所以它在工程上还有很多的问题。
但我现在仍然非常看好,也许实现 AGI 会快于 5 年,但核心在于这个行业竞争是不是过于激烈。开源软件太多以后,很多的项目互相争夺,历史上没有过这种情况。因为以前一家商业公司推出了一个商业产品很成功,比如 Microsoft、Sun Microsystems,做了一个新东西出来到处推广,但现在有太多的类似实现,就会混淆视听,导致大家的选择非常复杂。
所以我认为如果基于 OpenAI 的技术,要去实现软件业的变革,五年之内肯定可以完成,但是 OpenAI 未必商业上一定会成功,或者说如此成功。各种竞争的路线在不断互相取代,有相当多的变数可能会涌现,也许是更好的方法,因为创造力强的人太多了,也许商业竞争会导致有些实现反而因为标准不统一、方法不统一,导致不被主流社会接受,5 年之内仍然举步维艰。但从纯粹的技术和工程角度,我看到的是可能一两年就可以把这样一套工程实践总结清楚。
在我看来未来所有软件里面75%、80%甚至 90% 都会是 GPT 或者这一类的 AIGC 去创建,越来越多的应用逐渐从 Copilot 这种模式,走向完全由 AI 的 Agent 或者 GPT 本身的新的结构去完成。
所以,非常多的软件会在最近几年涌现出来,也许当前这个世界上有 100 万个软件,五年以后也许就会有 1000 万或者 2000 万个软件,而这些软件的制作者很大意义上就完全是 AI,这跟当前软件行业会有很大的不一样。现在的软件由人的团队去制作,所以它的开发流程、需求文档、测试文档,整个过程是比较有序的,同时为了人而进行了一些妥协。但是在未来,如果是由大量 AI 创造应用,人类甚至无法理解,无法掌握这些应用,更不要去谈如何去运维。
未来就会有一个悖论或者矛盾,有相当多的应用被创建出来,但是人类是没法运维的,那一方面开发模式可能会改变,另外一方面运维的模式一定会有深层次的变化。所以在我看起来无论自动化的编程,类似于 GPT Dev 或者 Copilot 的开发的模式,还是更远一点,它是一个 AGI Dev,是一个完全由 AI 来驱动的开发方式,背后都逃不开需要去重新建设运维体系,我们把它称作为 AGI Ops。只有 AGI Ops 被创建出来,几千万个新开发的应用才有机会被良好地应用到人类的环境当中,真正创造长期的价值。否则,那些新开发出来的应用没有办法被人类掌握、推广或者持续使用,甚至它的维护也会带来前所未有的问题,那它某种意义上就是一个新的问题。
AGI dev 的发现、展开、整个行业的演变,会是未来的 AI 软件在之后五年的一个最重要的变化基础。对于我们公司而言,也非常注重在这方面的投资和对未来的塑造。未来五年的这个时代,既可以称之为是一个 AGI Ops 的时代,也可以被称为后开发时代,也就是现有的所有的开发方法很可能都已经淘汰了,大家在努力地寻找新的开发方式。一旦这种开发方式被找到,快速的成熟、工程化,后开发时代会彻底改变现在大家对于应用的理解。应用不再是为了一个广谱的、普适的场景,它可以是为了一些独特、特殊的情况立即开发,现场实时交付,也可以是为了一个长期的架构进行大规模的重构设置,是从头到尾的重写。这些在过去看起来成本非常非常高,但在未来,在后开发时代,都会变成事实。
所以,后开发时代本身也意味着 AGI Ops,全人工智能运维时代的开端,这是我觉得大家可以最期待的一个未来的变化。
谢佳: 确实这轮生成式 AI 的进展,几乎需要以天为单位来去跟踪,去学习,变化非常快,当中也产生了很多新的概念,可能现在对于很多普通人来说仍然觉得很 Confuse。其中一个就是刚才光辉提到的 Prompt Engineering。怎么样简单地理解 Prompt?普通人应该掌握 Prompt 吗?可以把学习和掌握 Prompt Engineering 类比为某一种编程语言的难度和水平吗?
杨光辉: Prompt Engineering 带来的挑战,不光是对于普通人,程序员在看到 Prompt 的时候其实也有点惊呆了,因为这是一个全新的事物。
我们在内部做了一些试点项目,比如自动开发,类似像 OpenAI 的 Code Interpreter 等等。在做这些试点任务的时候,我观察大家的反应,对 Prompt 的理解,对 Prompt 和 software 差别的理解。首先从从业人士观察,再去看更多的人。
对软件从业人士来说,Prompt 跟 software 之间的竞争,会是一代人的竞争。 什么叫做一代人?如果我是一个上了年纪的程序员,已经掌握了相当深刻的软件开发技术,仍然在开发软件,仍然会认为软件的成熟度、可靠度、稳定性、代码的结构,背后设计的思想是最最关键的。GPT 的 Prompt Engineering 是不重要的,会用 Copilot,也就是协助生成代码,作为最重要的一个边界。有了这样的 Copilot 以后,几乎不需要输入太多的 Prompt,有些是自动补全代码,有些是通过对话或者注释增加一些要求命令,他就可以更快地完成任务。所以对他们来说,Prompt 就像注释一样,成为软件工程的一个组件,这是有经验的开发人员可能会看到的改变。
此外,新的时代,新的软件结构跟过去的软件结构很可能是不一样的。过去因为人智力有限,计算一件事情要做各种算法,都是写程序的那个人去完成,但是现在有可能可以让一个运行中的软件自己想办法完成。这种软件结构是过去大家可能没有实现过的结构——把问题拆解,由 GPT 来分解任务,做各种求解的规划、二分法或者任何一种查找、分开任务的方法,让 GPT 自己对每一个子任务再去做求解。最后这个任务也能完成,但是开发者从来没有想过这件事情是怎样完成的,这里面消耗大量的 Prompt Engineering,也就是在这当中甚至都很难把握多少应该由代码来完成,由传统的软件工程来完成,多少应该是由 Prompt 的优化调整来完成。
但这种方式的调试非常困难,软件程序员原来的 Debug 调试流程,没法面对一个不稳定的 GPT 的输出结果来进行。需要可靠的软件设计,这涉及到挺多新的软件构建。
所以 Prompt Engineering 即便对于一个从业人士都是很大的挑战,到底多大程度上依赖它还是掌握它?我觉得这一两年,如果从自己生产力的角度讲,找到一个好的合适的工具,不要把自己陷在太多的 Prompt Engineering 的话题里面,可能是大多数从业人士有效的策略。但如果你真的要去理解大模型技术怎么样应用到软件中,那不对 Prompt 进行深入理解几乎是不可能的。如果再把这个话题推演到更广的范围,就会发现大语言模型的 Prompt 是无穷无边无界的,可以做非常多的探索。
对于普通的用户,确实应该看一下类似像吴恩达的 Prompt Engineering 基本的课程,掌握 zero-shot、one-shot 这些基本概念,利用好这几个能力。有一篇论文说大语言模型就是一个非常好的 one-shot learning,利用好这样的一些基本能力已经可以解决前所未有的问题。在大语言模型没有被预训练的情况下,你告诉它一个 one-shot 的场景,大语言模型就可以帮助实现想要的输出。就像教小朋友,有时你教他一句,希望他模仿创造更多东西。大语言模型很像人类的思维模式,这是一种新的工作方式,一旦掌握,可以大幅度提高效率,不管是 Copilot ,还是将来的一些专用模型,或者是自己做一些调试开发。
所以,对于大多数人,我觉得至少应该积极地掌握一些基本的 Prompt Engineering 的概念和知识,尤其像 one-shot 这样的技术。
对于软件从业人士,其实面临一个很大的挑战,未来的软件跟过去的软件是不一样的,只有一批既掌握了软件工程,又掌握了 Prompt Engineering 非常有想法的技术爱好者们,可以推陈出新,一下子改变行业;对于大模型领域的从业者,或者软件行业里面已经决定参与到大模型开发的人,Prompt Engineering 在我看起来是必备知识,类似于一种标准语言,Prompt Engineering 跟每一个模型的相关度很高,所以就要求掌握好 Prompt Engineering 的知识。
我现在深刻地认为,应该从模型的训练开始,而不是仅仅在 Prompt 以及通过各种调试技巧去找到一个更好的 Prompt 的思路,而是要从语料,从它的训练特征,从模型的构建层的搭建,输出的算法,去理解 Prompt 的构建特征。
真正具体的细分领域里,Prompt Engineering 跟 fine-tuning、training 是紧密挂钩的,我不认为这两者应该完全分开。这个问题可能回答得有点长,因为这个问题很难。大体上我认为每个人都可以找到自己对于 Prompt Engineering 的学习程度,去拥抱它。
候晓雯: 我刚刚听到了和之前我们原以为的共识完全不一样的点,就是你觉得未来真正掌握 Prompt Engineering,可能需要从模型训练,从数据集的准备开始。现在行业的一个共识,觉得 Prompt Engineering 其实给了降低技术门槛的机会,因为它长着自然语言的外形,可能需要有技术编程的思维,但使用会更简单。复杂性和易用性之间,您具体是怎么想的?
杨光辉: 其实刚才的观点跟你的提法不冲突,我更多是说如果真的要做好的 Prompt Engineering,不掌握对模型的基础原理的知识,很难有真正的突破。但是这个世界是开源的世界,是共享的世界,有些人做了发现以后,会通过各种方式分享出来。有点像互联网刚出现的时候,有很多人做安全扫描、安全漏洞探测,一小群真正的 hacker 是从原理级的计算机的硬件软件出发,对互联网理解得非常透彻,可以做很多的创新发明。但是其他人也不是没有机会,你可以参与到很多聊天室,去获得其他人已经发现的知识、脚本。你也能够成为一个运行脚本的hacker,那时候叫做 script guy。所以对大家来说都是有机会的。
但是我认为如果要找到一些真正突破的 Prompt,解决非常有意思的问题,创造新的商业创想,不对大模型的底层机制有深刻理解,会很困难,会举步维艰。因为你没法探知 Prompt 的边界到底在哪里,到底还要不要进一步把 Prompt 优化,或者进一步深挖。同时所有依赖于 Prompt Engineering 的产品都会有一个安全问题,很多 Prompt 都有机会被越狱,如果不掌握更底层的技术,将来甚至连防越狱的能力都很难构建。所以,某种意义上不得不去面对这样的挑战。但是这不影响个人通过共享网站,学习更多有趣的 Prompt。我现在很多 Prompt 也是在一些共享的网站上看到的,很有启发。
谢佳: 我自己对 Prompt 的一个理解是,难的地方并不是在于本身的技术性甚至没有很复杂的语法,难度不在于学习怎么去写一句 Prompt,而是在 mindset 方面完全不同的一种编程思想,如何去和一个不确定性的系统交互,这可能是很难的。
我发现也出现过一些说法,比如有的工程师会觉得 Prompt Engineering 只是一个非常过渡性的现象和技术。也有一些甚至没有编程背景的人,在 Midjourney 或者消费级的应用中,可以把 Prompt 写得非常漂亮,可以得到非常好的 Output 出来。
杨光辉: 确实是这样。Prompt 大家看到的表象就是 Midjourney、Stable Diffusion里的一些效果会更明显,因为 Prompt 稍微做一些调整,增加一些有趣的字段,就可以得到一个完全不同的结果。我仍然认为如果你在 Stable Diffusion 上面,比如做过一次真的 LoRA 训练,把一些特定的图片训练好以后,会更深刻理解这些 Prompt 里面特定的词汇到底为什么会产生作用,也会更有利于做一些更加深刻的 Prompt 的挖掘。GPT 跟 Stable Diffusion 、Midjourney ,它的 prompt engineering 的思想是有差别的。
我的理解是,OpenAI 并不认为大家广泛意义上搞 fine-tune 是一个好的路径,它应该利用一个具备泛化能力的 GPT-3 或者 GPT-4 模型完成非常多的任务。后期的调整主要靠 Prompt Engineering,这是一个设计,by design 想要去这样实现。就像 Google BERT 认为大多数将来调优模型的人都是工程师,所以它设计了很多接口,让工程师去做各种各样的调优和后处理。Prompt 是 GPT 上面一个非常有特色的想法,它简化了很多叫做应用场景构建的工作,也让更多人可以参与到这个工作里面来。
我刚才强调学习 Prompt,学习模型更多是让你更知道怎么去构建更好的 Prompt,因为最后优秀的应用场景还是要靠那些深刻理解的人来构建。而对于绝大多数人,如果你只是想用好它,那我觉得 Prompt Engineering 本身已经足够,而且在 GPT 这个世界里面相当有用。GPT 思想的核心,不是希望大家都参与到 fine-tuning 和插件的开发中,而是用 Prompt 来自由地让模型产生更多的应用场景。所以如果相信 GPT,相信 AGI 这条路径主要是由 GPT 导致,Prompt Engineering 就是真正未来的选择。
软件开发将来也会产生 Prompt Engineering 这样的一个职位,最终有很多的软件开发会被简化成 Prompt 开发,开发工作从头到尾完全是 Prompt,不是说不要模型的知识,而是有模型的知识以后可以更好地完成这个工作,这是我的看法。
候晓雯: 我们确实也看到 Prompt 在塑造一种新的开发范式。关于未来的软件形态,最近 AI Agents(智能体)备受关注。在 Agent 里面大家更多是围绕大模型使用,把周遭一系列的工程汇合在一起的一套开发和运行的框架,包括记忆、长期规划、搜索等,也呈现出人格化(像 Character.AI)和自动化任务处理器(像 AutoGPT)两个方向。那么,您是怎么看 AI Agents?怎么理解它和 Prompt、大模型、未来软件形态的关系。另外,我还看到一个观点,即如果用 Prompt 开发软件,成本几乎为零或者会变得极小,那未来软件本身还有存在的价值吗?
杨光辉: AI Agents 是一个很有意思的话题。过去我们如果给计算机软件一个工作,更多是给它一个任务,下达了参数,让它执行出结果。而 AI Agents 接受的是一个目标,是一个 goal,它自己设法去完成,当然它有可能有一些工具,像刚才提到的记忆,也有一些其他的辅助工具(如网页browser)。OpenAI 的 Code Interpreter 其实也是一个 Agents,它背后不是简单的交互式界面,每一个交互式的对话不再被认为是一句对话,而是一个 goal。当它接受到了对话,就接受到了那个目标,然后设法完成这个目标,这个 Agent 掌握的最重要的工具就是写 Python 的代码,就是一旦能够把任何一个目标定义成一个 Python 执行的行动,最后完成了任务。
AI Agents 其实不是一定的形态,类似于 AutoGPT 是一个独立的程序,只能独立地运行完成一个工作,它可以出现在一个软件当中的任何一部分。而这部分原来是一个 function driven,以功能导向地考虑软件,未来用 AI Agents 这种方式,是以一个目标导向地考虑软件。
所以这两者也不冲突,因为一个软件当中必须要有相当多的是 function driven,要实现很多的功能,这些功能非常可靠稳定,可重复实现很高的性能。同时又有一些 goal oriented,它要实现一个目标,这个目标实现的过程可能很复杂,过去如果要用软件的方式实现各种各样复杂目标的代码,软件本身也会变得极其难以理解,难以管控。所以在这样一个场景当中,AI Agents 跟 function driven 的 code 在我看起来一定是平行的,是合作的。
软件工程我认为会变革,但不是导致软件就不写了,全部让 AI 或者 AI Agents 去写代码,这件事情相当不可行。为什么呢?如果放到 2029 年来看 AGI,它也就能完成大多数人类能完成的任务,比如 75% 或者 90% 的人类能完成的任务。而开发软件,我认为到目前为止,真正复杂的软件只有 5% 或者 10% 的人可以有效地控制复杂的软件,甚至更少,只有 0.5%。如果要做一个宏伟的、宏观的软件控制,对 AGI 来说太难了。真正的下一代软件构建的基础设施,仍然得由人来构建。只是把一些适合 AI 解决的问题留给 AI 去解决,新一代软件真正的结构是里面相当多的功能用 Agent 来实现。
区分到底哪些是功能,哪些是目标,这个目标既可以是软件内部的目标,也可以是通过交互获得的一个新目标。目标一旦建立,以目标为导向的软件的执行就交给了一个Agent,这是我看到的软件的未来。所以即便 5 年之后,软件工程也不会消失,甚至更蓬勃,因为它要解决更复杂的、更广阔的场景当中,怎么样能够让 AI Agents 或者是其他的形式能够更好地实现对应的目标。
但 AI Agents 的调试非常难,调试的成本相当高,我们有一个 AI Agents 调试小项目,一开始让一个没有这方面经验的程序员去调试,用 GPT-4 实现,结果还没调完发现已经用掉 300 美元。当然不能说很贵,因为程序员每个月的工资也不低,但调试这些东西的代价其实并不低,你要调试出一些稳定的 Promt,建立一个有效的策略,它的自动化测试其实很难,不像以前自动化测试在软件行业是一个标准,但是在 Prompt Engineering 时代,测试这件事情其实是一个前所未有的难题。所以在这个领域,会产生新的 Prompt Engineering 这一层的新的创业公司、新的工具,这是必然的。
调试成本在短期里是大幅度提高的,原先没看到过的费用会产生。过去你在笔记本上就能跑完的测试,现在要依赖于 API,要去做各种各样不断的重现,一个有效的 Agent 调试花掉几百、几千美元,在我看起来概率很高。所以它的调试成本没有降低,调试难度也没有降低。但是未来软件的形态会变换,最终的结果是有些代码就不用开发了。从最终的角度看,软件工程是受益的——某些开发量下降,应用场景变广了,使用者变多了,开发人员变多了。
谢佳: 我留意到海外也把 AI Agents 叫做 Promptless,也就是不需要写一堆的 Prompt,就可以让一个程序完成一系列的执行。我们今天所说的 AI Agents,可以简单把它和 AI Application 画一个等号吗?OpsGPT 在客户侧呈现的一个形态,可以算是一个 Agent 吗?
杨光辉: 首先 Prompt OS 是一个很不错的抽象,因为大家现在都试图对于未来的应用结构和软件结构进行定义。国内的开发团队,如果在 Prompt 上开发少,可能对开发成本和开发难度没有感觉。将来大规模开发 AI 的应用,确实需要很好的开发层和 runtime 那一层。在这个前提之下再来看 OpsGPT,OpsGPT 实际上是一个本地模型的构建,跟 OpenAI 的 API 某种意义上是竞争的。如果我们的本地模型可以完成大多数的工作,那我们就可以本地化地交付给客户。我们的 Prompt、AI Agent 可以基于 OpsGPT 去实现,而不需要再利用 OpenAI。OpsGPT 本身应该是 Agent mind,我们现在把它定义成 mind,过去只有人有mind,现在 OpenAI 提供了一个 GPT-4、GPT-3.5 的 mind,我们自己提供了一个 OpsGPT mind,可能有很多个 mind,由不同的公司提供,这是 mind 层。如果操作系统里面有很多的组件调用,里面的很多 mind 就是它的某种计算单元。
如果再往前看,真正的 Agent 开发或者未来的 AI 应用开发,到底怎么样能够实现一个比较高效率而且非常好的状态?我觉得这与在这个领域当中还没有广泛推出的,叫做 framework 的缺失是有关的。现在少数的 frame 类似于 Lang chain,它提供了一个类似于多步执行或者多种复杂任务的 AI 应用构建的基础设施,但这离 framework 的距离还非常远,而且还不成熟,也导致了 AI 应用开发起来很困难。基础应用很容易做,但是复杂应用很难做。
我们今时今日在做绝大多数的 AI 应用,要用到 Prompt 的时候,很多代码还是必须要手写最基础的 API 调用来完成,才能够真正控制那些 Prompt,达到比较精准的效果。
所以在这一层当中,framework 其实可能需要一些实践经验,需要有人去总结。如果有人能够推出一个非常成功的 framework AI 的 application,是一个巨大的演变。这个 Prompt OS,我觉得其实也是另外一种 framework 的抽象的方法。要抽象出一个未来真正垄断市场,或者占这个市场主要份额的框架未知效应很多,很大意义上依赖于有运气、有天才的团队,可能把这些事情能够做透,我非常期待。
我们现在开发 AI 应用的效率非常低,调试、探讨、解决问题、定位都非常困难,现在只有一些基本的 chaser 的工具,比如 Weight&Biases,它们提供了一些不错的 chaser 的工具,但是离真正广泛、大家能开发 AI 应用的距离还相当远。这应该是最近两三年里面我个人最期待的细分技术领域的演变部分。
候晓雯: 我这里插个问题,刚刚提到不同模型的 Prompt 可能会有所差异。所以我在想,即便我们有一个这样中间非常强大的开发框架,模型给它带来的差异性会有多大?我们怎么样通过这个开发框架去管理不同模型的差异性,因为不同模型可能也会呈现出不同的性能、能力以及不同的 Prompt 语言体系。
杨光辉: 我觉得除了少数像 Hugging Face 这样的场景,我还挺难理解用户一个具体的应用需要用到很多个模型建一个统一层,每一个统一层都要用同样一种编程的框架去实现。这个框架把具体的某一个模型涌现能力完善地抽象,以至于无需去理解 Prompt 的 one-shot、multi-shot,或者是为什么会产生涌现,如何控制涌现等,直接调用 framework 里面某些能力,它自己去调度底层的 Prompt,把工作给完成了。这样,开发者就只需要关注那些逻辑,对应的功能和环节。如果有一家公司号称要推出一个平台,支持各种各样的 Prompt,各种各样的 model,好像没有什么应用场景,这样一个 framework 好像没什么价值,至少在我看到的环境里面是没什么价值的。
候晓雯: 那么,刚刚一直反复提到的 2029 年,站在那个时间点,以技术的角度看当下的一些行业怪象或者现象,你觉得哪些是被低估的?哪些又被过度高估了?
杨光辉: 如果站在 2029 年,某种意义上的 AGI 已经实现了。它带来的那个世界在我看起来就是首先有相当多现有的工作真的不用再去做。尤其拿我们这个细分领域,有相当多的从业人士,他做的其实是完成软件之间的粘合,也就是 A 软件产生了一个结果,他通过人的判断,在 B 软件里面产生一个行动,然后在 C 软件里面去进行一次查询,最后得出了一个结论,进行汇总,提交给流程当中另外一个使用者。未来,这些人员的必要性就会很弱,他们会转换成设计新 AI 的能力,或者是其他的一些功能。在我看来以后应该会有一个工种叫做 alignment 工程师或者 alignment manager,就是要确保 AI 的 Agent 不超过授权,不超过限制,或者跟预期的工作的效果是一致的。
在 AGI 实现的过程里面,虽然大家会尝试用一些技术去解决它,但是相当多的职责会被分到人身上,由人来对它进行控制。当然竞争的手段有很多种,因为 OpenAI 也提出了他们训练一个模型,用模型 align 其他的模型。我觉得这可能会是某些场景下的一个解决方法,但在绝大多数企业里面,不得不仍然用人加上算法程序来对整个可靠性进行保障,但这已经是基于整个企业的效率和能力大幅度提升的前提下。所以在 2029 年,工作岗位会发生相当的演变,不是说人员会一定减少,而是职能已经发生演变,工作的主要重点已经发生变化。
真正的难点是什么呢?这个世界变化,通常不是因为每个人自发地意识到了未来很重要,所以我要变化,通常我们的变化是由于比较产生的。你自己可能没有觉得 AI 带来什么样的转变,但是行业里面的第二名、第三名、第四名的公司因为应用到了AGI,一下子超过了原来的第一名,这时就会导致行业里面所有的公司一致认识到原来 AGI 的应用是可以深刻地改变生产力。
所以 AGI 的投产会在不同行业里面用一种浪涌的方式,比如银行业,某些银行投产成功了,非常快地发展业务,取代掉了其他银行的份额,其他银行一下子反应过来,就会一块跟着改变。这种改变是自上而下的,叫做变革,是会非常激进去推动的。但是如果 AGI 的技术在某些行业里面,没有一家先进的企业塑造出非常好的使用效果,创造出非常好的商业成就,那对应的行业变化会相对较小。比如,假设二手房销售的细分领域里面没有一家新的公司把这种技术应用得非常成功,一下子颠覆了原来的市场格局,那这个领域的演变就会比较慢。
所以站在 2029 年,我认为我想象中的那个世界,就是有些领域,有些新的公司,今天没有听说过的名字,或者今天这个公司的名字只是一个第四、第五甚至第九名的公司,一下子成为了行业里面第一、第二名,同时这个行业被深刻地改变了,几乎每个人都相信 AGI 已经彻底改变了这个世界,而另外一些行业跟今天没有实质的差别,因为它们当中没有一个组织成功地在商业上解决掉非 AGI 的问题,甚至是 AGI 本身的法律问题等,就会导致那些行业没有发生颠覆。但就像曾经的互联网,真正能够找到机会的人应该是脱离原来那些不可被改变的行业,加入到这些会积极改变的行业里去寻找机会。很多聪明人就会聚焦在那些改变迅速的行业里面,这也是每一个浪潮来的特征。
但我仍然赞同有些知名投资者的论断——GPT 并没有那么伟大,它如果是一个好的商机,后面 20 年都应该是一个好的投资机会。我认同这一点,一个细分领域的改变是需要时间的,有的时候要消耗一代人。可能 20 个行业变化很快,另外 20 个行业变化很慢。如果站在今天,站在未来的设想上,我们就会去拥抱那些最愿意接受改变的细分领域。
也许游戏行业属于非常积极改变的行业,但是我不知道有哪些行业真的是改变不动。不管互联网、大型的企业,当有一些组织运用起 AGI 的运维方式,配合一个非常强的业务团队,塑造一个前所未有的业务开拓的故事,这个细分领域就会彻底改变,可能是军备竞赛的状态。
谢佳: 赞同,我自己也感同身受。过去几次人工智能技术的进步,大家每次都会说有多少人,什么工种会被替代,我觉得前几次可能都还是一种噱头。这一次我看到的生成式人工智能的进步,如果很多工作不需要太多思考,而仅仅是从一个信息系统到另外一个信息系统之间的桥梁作用,这个信息系统可能是一种泛化、更抽象的信息系统,它很有可能是一个组织、一个工种。如果仅仅是做这么一件事情,而没有太多创造性的思考,那极有可能真会被 GPT 颠覆掉。同样,如果一家企业也处在这么一个很尴尬的位置上,那很有可能会被替代掉。
杨光辉: 有些文字真的很深刻,比如办公的楼叫做写字楼,我以前一直不理解为什么叫写字楼,后来发现大家都是在做语言处理、文字处理。未来很多工作大家都在用 GPT ,以后就叫 GPT 楼。文字和语言在现代工作里起到的作用是非常大的,原先可能真的没有意识到当中的占比是如此之强,写字楼这个名字还挺深刻的。
谢佳: 我们今天处在一个和过去历史不太一样的技术变革的转折点上,也越来越清晰地看到这个技术是在非常 solid 的进步。包括刚才有提到的 Prompt Engineering,相信到头来我们会发现和 GPT 类似,会被证明是一个非常精妙的、非常聪明的、很有创意的发明。
身处在一个信息技术升级范式变迁的节点上,我相信那些充分去拥抱生成式 AI 技术的企业,才能继续成为弄潮儿。我们之前有一个观点——当我们在评估做基于 AI 软件的时候,我们把它简单分成两类,一类叫 AI-Native,是基于生成式 AI,所谓 AI 原生的应用;另外一类叫 AI-Enhanced,仍然还是传统的 Workflow,一个 SaaS 软件在很多关键的环节把生成式 AI 的技术应用上,是AI 增强的定位。我们认为,对于一家在 2023 年才成立的新公司,如果仅仅是做 AI-Enhanced类型的公司,是没有任何竞争优势和机会的,因为有大量比如在 B 轮、 C轮已经成型的公司,有更多的优势来做这件事情,有很多已有的产品、真实的客户和场景,还有已经成型的团队。对一家新的 start-up,你必须要做 Generative AI-Native 的应用才有机会。
今天跟光辉聊之后,我有一个更深的感受,在 ToB 领域,今天很优秀的所谓 incumbent 的公司,大家都在非常积极地学习和实践基于大语言模型这个新的范式来做出下一代的应用,所以对新的创业者提出了更高的要求和门槛。但就如光辉刚才所提到的,我们今天仍然处在 AGI 的早期阶段,即便我们放眼未来到 2029 年,那个时候对 AGI 的定义可能也是比较狭窄的定义。
光辉是 ChatGPT 的高频使用者,那作为一家科技企业的CEO,你日常使用 GPT 来解决哪些问题?有什么例子可以给大家分享一下吗?
杨光辉: 到底什么叫 AI-Enhanced?什么叫 AI-Native?值得仔细考量。今天我相信不会有人反对 ChatGPT 是某种意义上的 AI-Native,但实际上它走得并不远,它提供的是一个交互的过程,提供一些探讨和聊天。
在我看起来,AI-Native 其实也有细分的差别,核心是怎么去用它。我认为最重要的使用场景叫做 AI Replacement。打个比方,智能手机带来的最大影响就是上面的应用,比如移动钱包和微信,它们 replace 了传统的钱包和传统的沟通方式,有了巨大的商业价值,很成功。
怕的是大家说的 AI-Native,可能在讲那些没有 replacement 支撑的 AI-Native。比如当年有一个 Mobile-Native 的应用,叫做 Foursquare,大家可以利用它 check-in,玩一种类似像 check-in 的游戏、推广告,它是 Native,但它不成功,不 replace 任何商业价值和社会价值。
回到 ChatGPT 的使用,我觉得第一,对我而言它取代掉了一个很重要的角色,就是我跟很多商业顾问的探讨。ChatGPT 几乎成为了商业顾问的 replacement,就是战略顾问、人力资源顾问。当然不是 100% 取代,只是取代一些基本的思路、知识和可能性的探讨。
我今天要做一个商业决定,我需要让它来验证一下这个商业决定是不是考虑得足够充分。针对一个假想的市场进行渗透,我希望有一个商业顾问来帮助我一块去探讨进入这个市场可能采取的策略,可能遇到的问题,以及可能遇到的风险,并且可能采取的对策质量的分析。替代掉传统的顾问,是我跟 ChatGPT 交流最多的一种场景。因为好的商业顾问首先很难找,找到了以后他们一般价格也不低,你在问他们问题的时候需要很认真很当心地提出正确的问题,否则可能还会被鄙视。但这些过程在今天的 ChatGPT,是以 talking 作为它的一个度量,这是巨大的改变。当然它的质量比起商业顾问来说还不高,因为真正好的商业顾问,给出的不仅仅是想法和建议,还给出一个叫做对真实世界匹配度的评价。而 ChatGPT 给不出真实世界的匹配度,这需要你自己去进行探索。
ChatGPT 并没有取代所有的商业顾问,取代的是那些很平庸的商业顾问,而最优秀的商业顾问专业团队,仍然是有价值的。就像我们之前试图做收购或者操作试探的时候,有很多商业想法,如果没有一个好的顾问跟你交流,你甚至不敢去往前推进。但有了这样一个商业顾问,可以对很多你不熟悉的领域进行探讨,这样你就敢于去做一些尝试。后来我也接触了一些专业顾问,跟他们探讨我跟 ChatGPT 交流的一些想法时,他们也觉得非常有意义。因为原先很多组织因为找不到合适的交流资讯来源,可能决定不决策,因为没有达到决策的标准。现在因为多了很多商业顾问的 ChatGPT 的能力,让商业决策的标准某种意义上没有降低,但更容易达到了,这是我用的最多的场景。
第二,作为一个科技公司的 CEO,我还用它做很多客户分析。真实世界的客户分析其实还挺不容易的,因为每个人都很特殊,但是 ChatGPT 可以塑造一个仿真的世界,就像生成了一个平行宇宙。我让它为我们公司设计一个 KPI,帮助我推行到各个部门去,我看到效果非常成功,做的设计也挺不错的。所以我也让它为我的客户设计 KPI,更好地帮助我去理解客户侧运作的规律,以及今年要实现一个目标,他可能会怎么进行管理。我也不知道为什么他们掌握的知识那么充分,它对于客户的画像,对于产品的设计起到了至关重要的作用。
当然日常还会有一些技术问题的探索,比如模型本身的学习,我也会跟 ChatGPT 交流,因为它对于模型学习的知识是比较多的,当然我不会仅仅依赖于 ChatGPT,多问几次后,我自己也会去确保这个答案更可靠。这三点是我最频繁的一些使用场景。
谢佳: 非常生动的场景。我们每个人都需要把 ChatGPT 或者类似能力的 chat bot 用起来。就像刚才光辉提到的,它让人不用有太多心理负担,可以问很多问题,而且用极低的成本。非常实时,你可以问很多次,不同角度问同一个问题,通过给你的 feedback,你自己来做一个决策。
感谢光辉给我们上了非常生动的一堂关于 Generative AI 应用的一堂课,不仅仅是 Generative AI 的应用,而是整个相关的思考。关于 Generative AI ,后续我们和光辉、华创派的其他 CEO 也会有更多的对话。我们后会有期。