ChatGPT的基本原则探讨：在通往人工通用智能的征途中，我们能期待哪些系统层面的机遇？

发表时间: 2023-05-29 15:21

5月23日，36氪举办「颠覆·AIGC」产业发展峰会。本次峰会汇聚产业力量，共同探讨企业、行业在面临变革时的应对策略，分享思考，探索和发现产业中最具潜力的企业与最具价值的技术，在激荡的环境中探寻前行的方向。

大会的首场圆桌论坛上，主持人36氪分析师Ben，与乐言科技创始人兼CEO沈李斌、松禾资本董事总经理闫阳、中科智云CTO李源，围绕通用人工智能、AI的第一性原理等广泛关注的问题展开了热烈的讨论。

圆桌论坛：ChatGPT的第一性原理：通往AGI的路上还有哪些系统性机会？

3位嘉宾分别从AIGC+电商行业、AIGC+数字化转型，以及资本视角，对于不同领域如何看待大模型浪潮下的机遇与挑战、如何推动AIGC应用大范围商业落地，以及着眼于未来AI2.0的发展方向充分阐述了各自的观点。

乐言科技创始人兼CEO沈李斌谈到：我们如果要判断是否需要探索一个场景，评估它是否有价值是一方面，另一方面也需要去把握节奏，即判断现在是否是合适的时机、这个技术是否能支撑服务要求的体验，以及率先入场是否能将技术壁垒变成生态壁垒。

乐言科技创始人兼CEO沈李斌

松禾资本董事总经理闫阳认为：纵观全球科技创新数十年的磅礴发展历程，越是颠覆性的创新越需要「第一性原理」的演绎思维与实际行动。毋庸置疑，通用人工智能与AIGC为现今的世界注入了无与伦比的强大科技源动力，希望所有参与这场盛宴的伙伴们都要好奇不息、思考不止、探索不停，寻美而求真，为这个行业的发展贡献积极力量。

松禾资本董事总经理闫阳

中科智云CTO李源表示：机器视觉领域的深度学习模型同样具备智能涌现的可能，而处理大规模样本至关重要。中科智云的X-Brain平台结合预训练模型和小样本技术，可实现强大的样本自标注。我们将继续训练图像领域的大模型，降低大模型的训练和运营成本，为行业应用创造新机遇。

中科智云CTO李源

以下是圆桌论坛实录，经36氪摘编：

Ben：各位嘉宾、各位观众大家好，我是36氪分析师Ben，非常荣幸地介绍本场圆桌的三位嘉宾，也请每位嘉宾做一个简单的自我介绍。

沈李斌：乐言科技为电商行业提供AI SaaS+ 全链路数智化解决方案，包括智能客服机器人、跨境出海电商工具、智能CRM、低代码RPA、电话机器人等AI产品。我们近期也推出了原创研发的国产行业大模型体系。很多人问我，ChatGPT是否会给客服机器人带来冲击，我觉得其实并不会，这部分之后我会详细谈。

闫阳：大家好，先简单介绍一下我们的团队，松禾资本成立于1996年，到现在已经有27年的历史。松禾资本早期以科技投资、产学研孵化、科技成果转化为特色，启航于深圳，目前在上海、北京、广州、深圳和川渝都有办公室。我们团队早期成员的背景也比较多元化，早期基本都是围绕大型企业和高校院所做一些孵化投资，同时也做一些陪伴。

李源：大家中午好，中科智云是一家人工智能科技公司，专注提供数字化生产与运营的行业算法平台，助力建造、交通、工业等领域实现数字化转型。我们围绕公司的核心平台X-Brain，进行模型训练。比如在工业领域，我们提供人工智能巡检、自动化机械操作、设备无人化操作等方案。我们是图像赛道，AIGC其实给我们很多启发，我们认为GPT这样的大模型，其中的思维和实践经验也可以应用到机器视觉上面。早在2年前，我们就在机器视觉的工具平台上提供大规模预训练模型，并实现了小样本标注，达到主动学习的标注，取得了不错的效果。

Ben：今天这场圆桌的主题是用第一性原理来看实现AGI的路径上存在哪些系统性的机会。作为终端消费者的立场来看，虽然大模型已经火了半年时间，但是我能够用到的还是简单对话和简单绘图之类的功能，希望各位从自己身处产业一线的经验来谈一下，目前大模型和AIGC可能给行业带来哪些变量？

沈李斌：谈到大模型应用，我觉得可以分To C和To B两个方向来谈。大家目前对于通用应用的关注会多一些，国内陆陆续续有大厂和创业公司在做通用大模型，赛道竞争比较激烈。反观深耕行业大模型应用的垂直赛道，现在可能是一个暗流涌动的状态，实际上在一些领域已经取得了非常大的进展，包括法律、金融等。我分享一下在电商赛道，我们所做的一些事情。基于乐言电商GPT大模型，我们已经开发五到六个AIGC应用，目前使用这些应用的商家有上千家，实现了在日常工作中将大模型能力整合至业务里。

对企业来说，大模型应用可以分为两方面，一方面是用于提升C端消费者体验，另一方面是提高运作效率。

首先，从C端体验来说，本来就有数万商家在使用我们的客服机器人，基于判别式AI技术做的客服机器人性能还不错，至少能回答70%的问题，但是针对一些开放式问题和生成式问题，原先的模型很难进行处理。目前我们补上了这块短板，生成式能力的提升使得以前回答不了的问题得到了解决，目前也已经看到了比较好的反馈。

其次，从提高内部工作效率的方面来讲，我们有一部分业务是做出海电商。对商家而言，制作商品详情页的难度较大，一个原因是拿到的中文素材比较简短，其二是将这些素材转换为泰语、英语等外语时存在翻译上的困难，其三是呈现的素材需要符合电商平台的调性。针对以上问题，我们基于大模型的语言能力为商家提供了AIGC解决方案，现在只需要由一个运营花费一两个小时就可以搞定商品详情页。诸如此类提升效率的应用还有很多，比如商家话术生成、卖点生成、买家评论回复等方面。而这些应用的普及速度也已经超出了我们的预期，我能感受到行业模型上是暗潮汹涌，有能力入场的公司都在飞快演进。

闫阳：在回答主持人这个问题之前，我想强调一下「第一性原理」在AGI/AIGC上的重要性。「第一性原理」现在被很多人提起，它是一种源于物理学与哲学的思维方式，也是一种非常有意思且极为重要的思维方式，与传统的归纳思维不同，它强调极致深入的演绎推理。越是颠覆式的创新，越需要「第一性原理」的思维，而传统的归纳思维只能实现在现有状态下的改进和优化，对应到科技创新领域，就是围绕着他人的成果修修补补，做一些扩展或者延伸，不可能有颠覆性的自主原创，这一点特别重要。

结合「第一性原理」与AGI，大模型今年火了，但这是对绝大部分公众层面的“火”，而藏在高校院所、行业巨头和一些优秀创业公司里的资深技术专家，已经在几年前、十年前甚至十几年前就开始寻着人工智能技术的演变路径做AGI相关的积累和贡献。相比这些技术专家，我相信很多政府机构管理者、企业经营者、C端用户、B端甲方客户，以及投资人们，对短时间内火起来的AGI大模型等新鲜事物实际上是陌生的，那么面对这样一个颠覆性的大模型技术所带来的变革新浪潮，更需要大家用「第一性原理」的思维去思考问题，而不是简单的用已有的经验和认知去归纳、总结甚至决策，这一点极为重要。我想再次强调的是，这场宏大盛宴的所有参与方都应利用「第一性原理」去思考问题并指导行动，要好奇不息、思考不止、探索不停，否则大概率会成为过眼云烟，抓不住时代赋予我们的宝贵机会。

回到具体问题上，在当下AGI颠覆性变革时代，主要有三点重要的变量。一是大幅提高了生产力水平。举个例子，互联网中出现了很多可以帮助我们解答各种疑问，以及在学习或工作中能够提升效率的新工具，如大家熟悉的OpenAI公司的ChatGPT和GPT-4、谷歌的Bard，以及百度的文心一言等，这些工具可以帮助大家提高生产效率及质量；另一方面从我日常的投资工作来看，与松禾资本很多优秀被投企业沟通下来，其实他们都已经不同程度的将大模型技术应用到实际的产品研发中，加速了各自在新材料、新药物、新工艺研发工作中的效率。

第二点是极大降低了AI的应用门槛。举个例子，B端产业客户一个比较共同性的问题就是“AI不好用”以及“AI用不起”。过去若干年中，传统AI平台化解决方案的交付模式是，AI公司拿到B端客户的需求后进行定制化开发，最终以集成训练模型的形式给到客户。这种模式最大的弊端就是需要客户具备较强的对AI技术的理解和开发能力，并且IDC机房的搭建十分消耗成本。大模型下的算法生成模式不需要额外编程和调试，可吸引更多下游用户投入模型迭代，可以更有性价比的去使用AI技术，对其业务进行赋能。

第三点是全面革新用户的交互与体验。比如前面嘉宾提到的交互聊天问答模式、设计类工具交互模式、汽车智能座舱中的人车交互系统，以及数字人·虚拟人在服务场景中的应用等，这些都是C端用户能比较直观感受到的新事物。回到B端领域，举个例子，松禾天使基金被投企业「识渊科技」将深度学习应用到智能制造行业，利用通用人工智能技术打造了无代码的交互式平台，使得工业客户仅通过文字和图片对业务场景进行描述，几轮对话和交互下来，就可以生成准确的任务流程，效果非常好。

李源：主办方提的第一性原理很重要，我们公司主要重点放在机器视觉应用领域。chatGPT大模型首先是很令人震撼的，它向通用人工智能迈了很大一步。另外我们也看到背后的东西，在2020年6月份GPT3发布的时候，我们就开始研究它，实际上最让人震撼的是它揭示了量变到质变的过程。

我们认为这是一种涌现现象，即本身这个模型很简单，但是所表现出来的性能是让人吃惊的。至于从GPT3到现在，这一年为什么会有这样的结果，这里面就是一个从量变到质变的过程。

我们在机器视觉领域，也在想有没有这样的可能性。前不久有一篇论文，facebook发布的 Segment Anything 再次验证了原理，即深度学习模型同样具备这种量变导致质变的能力，其中大篇幅是在分析怎么标注样本，怎么处理大规模样本，这说明了样本的重要性。

中科智云很早便认识到样本的重要性，我们的X-Brain平台结合预训练模型和小样本技术，可实现泛化能力很强的样本自标注，只需不到传统模式的10%样本，即可达到同等精度的算法提升，算法所需训练时间也缩短到传统模式的10%。中科智云将会沿这个思路，继续训练图象领域的大模型，降低大模型的训练和运营成本，为行业应用创造新机遇。

Ben：通过各位嘉宾的分享，我们可以看到大模型带来的变化确实在发生。基于这些变化，请各位嘉宾分享一下，下一阶段哪些领域可能发生更大的突破，这样的突破可能会给哪些创业公司带来一些比较系统的机会？

沈李斌：我联想到了1997、1998年互联网早期发展的时候，当时存在各种机会，只要你想做并且有能力去做好，把控节奏就有可能创造历史。我们当下的大模型发展带来的机会也是系统性的，我觉得每个能创造价值的场景都是值得做的，所以我们如果要判断是否需要探索一个场景，评估它是否有价值是一方面，另一方面也需要去把握节奏，即判断现在是否是合适的时机、这个技术是否能支撑服务要求的体验，以及率先入场是否能将技术壁垒变成生态壁垒。从生成式的角度来说，生成质量的可控性和安全性以及公序良俗的对齐比较困难。特别是国内的To C应用没有想象中发展那么快速的情况下，To B应用在目前的状态下机会反而更多，通过短期迅速发展来积累技术和能力，可以反哺到C端场景。

To B 这块需要关注质量的可控性。对于生成式模型来说，大家后面的焦点是做可控生成，包括文字、图片、视频如何结合行业内部知识去可控生成，我觉得无论从技术还是应用场景的角度而言都是一个系统性的机会。

闫阳：我认为预先落地的行业机会和应用，是要以受众对象比较能接受的方式，可以真正走进大众视野的机会和应用，比如设计或文本类生成式工具、智能问答客服等，这些领域的应用近期会先落地或者先加速迭代，使其成为一个强有力的产品。大模型实际上成为了AI时代的操作系统，而从“为人类提供及时准确的价值”这一范畴来讲，下一阶段的突破应该在各种工具类软件方面。

国内创业公司在利用技术革新，打破传统场景下的同质化竞争方面具有比较大的机会，主要体现在基于大模型这一新的基础设施，针对中间层和应用层的开发，将大模型技术快速抵达垂直场景，例如自动驾驶（仿真引擎、AIGC模拟场景）、金融科技（欺诈预测、交易预测）、医药健康（药物中间体、蛋白质结构、基因等预测）、工业智造（虚拟工厂、生产过程模拟测试）场景中的合成数据，以及数据内容（文本、图片、音频生成）的构建。此外，我们认为一个特别有意义的机会是AIGC对各种工业仿真/设计软件行业的巨大变革，大模型对于CAX的效率提升将会非常显著。

大模型时代下，我们如何打破长期以来国外巨头在工业软件赛道中的垄断格局，需要中国企业充分利用AGI等带来的技术革新机遇，加速追赶，一举弯道超越。松禾天使基金在CAE领域的被投企业「十沣科技」便是物理仿真+AI这一交叉领域的优秀代表，我们对其充满期待。

但这几个月以来，以ChatGPT为代表的AI大模型给大众留下的一个显著印象是“交互感带来的直观冲击大于绝对的使用准确”，也就是“能用、有趣”。未来所有领域的突破应该真正实现从“能用+有趣”到“好用+准确”的革新，这一点对于创业公司的长期发展至关重要。

李源：无论生成式模型，还是大模型，对于创业团队来说既是机遇，也是挑战。机遇在于，原先很多人希望是通过算法或技术解决AI的落地难题，现在我们可以很明确，通过大模型或多模态模型也可以解决。但也是一个挑战，因为现在技术对资本很依赖，要想自己训练一个大模型的投入成本非常高。虽然很多打补丁技术可以降低训练成本，但要完全掌握它，还是需要比较高的投入。

那从技术角度来看，研究如何低成本训练和运用这样的大模型，也是一个机会。具体应用可以有很多层次，比如刚才提到的生成模型，我们可以用在各个行业。中科智云是一家ToB的企业，我们很多客户是工厂建筑工地等，比如在建筑领域，我们可以通过生成模型快速地构建建筑效果图，原来一张效果图需要花费一周时间，现在10到20分钟可以生成多张效果图；也可以用生成模型生成建筑的BIM。很多场景都可以尝试，但核心底层基座必须自己能够掌握。

Ben：现在大家看待大模型类似于“iphone时刻”，让人觉得很兴奋，那相较于去年很火的元宇宙和web3，大模型的商业化前景现在能否被明确判断？

沈李斌：我觉得大模型的商业化前景本身不存在疑问，相较元宇宙来说，大模型能被大家看到的应用更加切合实际，我们能切实地感受到大模型在替代生产力这方面的能力。但是在诗和远方之外仍然有很现实的问题，比如生成式模型存在天然的弱点，其可控性差、安全性差、前期投入比较巨大，这些都对技术路线和商业路径的选择提出了非常大的挑战，对商业化前景的担忧也集中于此。我觉得两三年之后，大模型能力达到一定程度时，其对生产力的替代所创造的价值是没有疑问的，但困难的是在当前阶段每个行业、每个赛道状况都不一样，融资情况不一样，潜在竞争也不一样，所以需要结合每个行业的具体情况去把握，比如这个赛道是否有大厂入场、投入什么样的资源在做、作为初创企业在这个赛道上能够根据天花板、团队能力，筹到多少钱，在大模型上可以花多少钱做到什么样的程度等等，无论在商业上，在技术产品前瞻性的预测把控上，要做出正确的判断，都是非常大的挑战。可能在2月份的时候我们会有一些想法，我们看到一些非共识的东西，我们抓住机会去行业赛道进行布点，但到4月份之后，我们之前说的东西现在变成了一种共识，大家对垂直赛道的理解促使比赛立刻进入了下半场状态。上半场是发展特别快的，可能因为大家受过移动互联网的熏陶，对商业认知会更充分一些。但在后面半年到一年的时间，大家面临的挑战会更大，如何识别出赛道的进入方式、这个进入方式在短期内能否有现金流支撑、资金支撑、前期投入能否转换为后期的竞争优势，这些都是需要关注的点。

闫阳：这是一个非常有趣的类比。在「第一性原理」的演绎推理思维指导下，我们也需要一定的类比归纳思维，两种思维相互结合、相互补充。曾经繁荣蓬勃的移动互联网时代，以iPhone为代表的智能终端，准确的说是从中衍生出来的各种应用软件（APP）无疑是引爆行业巨大发展的源动力；而现在通用人工智能技术的出现，使AI赋能千行百业变为可能，极大降低用户的使用门槛，可以以最符合用户直觉的方式来使用AI类型的产品。通用人工智能技术可以理解成对软件形态的一种巨大重构，使其成为AI时代的操作系统，从这个角度来说，移动互联网时代下的iPhone APP完全可以和现在以AGI大模型为基础的各种应用相类比。

回想当年调研和投资移动互联网时代下的创业项目过程中，我发现很多APP创业公司存在三个主要的问题。第一个问题就是“伪需求”，第二个问题是产品的深度和广度不够，而第三个问题是公司整个商业模型中的“赚钱账”没算清楚。现在大模型时代下的行业机会，上面这些问题毋庸置疑同样是需要创业者重视的。

AGI行业的先行者在未来商业化进程中，要像iPhone APP开发者一样，以实际行业问题为导向否则会产生伪需求。AGI中把“G”去掉本质上还是AI，而这些年AI在C端和B端的一些行业落地已经显现，并且产生了很好的实际效果。我们认为AGI绝对是技术上的颠覆，但不是行业场景上的颠覆，而是再加速和再赋能。因此。AGI的出现并不需要创业者急匆匆的去创造一些“新需求”，因为新需求大概率不是“真需求”，把已经存在的真需求做的更好似乎是正确的方向。

同时，创业者要兼顾好产品与服务的深度（例如进入核心场景，真正有效的解决行业关键问题）和广度（例如更多的用户使用到更多的设备上），这样才能让AGI技术真正落到实处，赋能千行百业。最后就是“会算账”，以B端为例，创业者要在AGI大模型、中间层和应用层开发，以及场景数据提供、相匹配的硬件设备等不同部分之间做好平衡，既能保持技术和产品的领先势头，也能赚到钱。

李源：我还是从技术角度，我觉得大模型的商业化肯定没有问题，机会也很多。但我们要搞清楚是谁的机会，谁的商业化产品是谁的问题。现在来看,创业公司要打造自己的AGI产品门槛很高。从我们的技术路线角度来看，研究如何低成本训练和运用这样的大模型，恰恰是一个机会。中科智云从2014年起，便在AI行业模型以及行业预训练模型下的小样本学习领域进行深耕，已经积累了丰富的行业经验，特别是在图像自监督模型领域也有着丰富的积累，为构建行业大模型打下了坚实的基础。目前我们基于公司X-Brain平台已建成了建筑、航空等多个行业的专有模型，也在与各行业的合作伙伴携力打造更多行业大模型。

Ben：非常感谢三位嘉宾精彩的分享，也感谢台下的各位观众，今天圆桌论坛就到这里，谢谢大家。

ChatGPT的基本原则探讨：在通往人工通用智能的征途中，我们能期待哪些系统层面的机遇？

以下是圆桌论坛实录，经36氪摘编：

热门阅读

推荐阅读