OpenAI的追随者:探索人工智能的新领域

发表时间: 2024-10-21 09:00



智谱对OpenAI的追赶,至少持续了4年。这是人工智能大模型爆发的4年。


智谱,是中国的大模型创业公司之一,也是截至目前,从技术、产品到生态全面对标美国OpenAI的公司。当人工智能大模型的热潮袭来,热钱卷入,这条赛道迅速变得拥挤,大家普遍都在焦虑,那款super App到底在哪里?商业化怎么做?能不能赚到快钱?像寻找武林秘籍一样,于是,江湖中出现了「百模大战」、降价之争……


智谱的CEO张鹏倒不太焦虑,有人形容他「情绪稳定得像一个AI机器人」 。智谱现在做的,就是全力在技术上追赶世界顶级的OpenAI,至于商业化,那就「沿途下蛋」。


大模型相当于给这个世界在换引擎,这是一场巨大的、未知的变革。这个变革需要漫长的时间,不会是要么速胜,要么速亡。


很多时候,答案要靠时间一点一点揭晓。这同样也是张鹏冷静的原因。如果不是把大模型压在一两年的时间密度里,很多事情会看得更清楚。





文|郑思芳

编辑|李天宇

图|(除特殊标注外)尹夕远




生死决策


一个决策会,能如此轻描淡写。


要不要做千亿参数的大模型?要在2021年12月的一天定下来。这是智谱自创业以来的第一件大事,事关生死的那种。


在公司CEO张鹏的印象里,「我们那天觉得必须讨论一下这件事」。来讨论的是这家创业公司的技术委员会成员。


决策会开了多长时间,具体多少人参加,张鹏都记不清了。他记得的场景是,沉默占据了决策会的大多数时间。「对于工程师来讲,不说话已经是最大的反抗了。」


反抗源自风险。投入至少是千万元人民币量级,想做成,至少八九个月。举全公司之力,把所有时间、资源都砸进去。


如果没干成呢?这家成立刚两年多的创业公司「就啥也剩不下了,可能就挂了」 。


如果干成了呢?「那至少证明中国的大模型公司,技术能力也能达到世界级水平。」清华大学计算机系教授、智谱创立发起人唐杰说。


决策会最终全票通过:干。


为啥要干?「刺激」源于这家公司1岁生日那天。智谱创立于2019年6月11日,创立之初想法很明确,做下一代的人工智能,也就是清华大学人工智能研究院名誉院长、中国科学院院士张钹所说的,要发展第三代人工智能——认知智能。


2020年6月11日,智谱1周岁生日,美国人工智能公司OpenAI上个月刚刚发布了GPT-3大语言模型。这个大语言模型如同一个巨人般出现,轰动了全球人工智能的产学研各界。它的参数规模达到了惊人的1750亿个。此前两年流行一时的BERT模型,有3亿个参数;英伟达的Megatron-BERT,80 亿个参数;同年2月发布的微软Turing NLP,也只有170 亿个参数。


参数规模,决定了大模型的智能能力。通俗地说,这个自然语言处理模型中的「庞然大物」,不仅能做语言生成,而且阅读理解能力有了很大提升,能让人联想起学生时代《语文》课本里的一幕:「阅读全文,并总结段落大意。」这一点GPT-3能轻松自动完成。


GPT-3还能生成新闻报道的样本,人们很难区分这文章是机器写的,还是人类写的。


在智谱1岁生日这天,大家都在研究着这个庞然大物。当天,张钹院士也在智谱的庆生会上组织讨论:「GPT-3为代表的大模型,是不是我们所追寻的认知智能可能的解决方案?」


张钹院士出席2021年北京智源大会。

图源视觉中国



GPT-3的出世,把生成式AI带入了全新的时代。从学术界或者产业界的角度来看,2020年可以称之为大模型元年,标志着大模型的研究进入到全新的阶段。


可这个时候,中国人工智能大模型的技术水平,与GPT-3有相当大的差距。但如果大方向是对的,无论差距多大,都要追赶。


1岁的智谱迈开了追赶的步子,当时,张鹏还是这家创业公司的CTO(首席技术官)。在一年半的时间里,他带着智谱先后做出了十亿、百亿级参数的模型,这还不够。要不要把稠密的语言模型再扩大10倍,做一个对标GPT-3的千亿级参数模型?但是从百亿到千亿参数的研发,难度不是乘10倍那么简单,财力、资源的投入,对中国当时任何一家独立创业的AI公司都可以用倾家荡产来形容。所以才有了这次事关生死的决策会。


张鹏说,「不做,不追,你永远不知道你能跑多快,跑多远。」 智谱董事长刘德兵也支持这个冒险,「如果明摆着资源来做,哪里还轮得到你来做?」智谱选择在最艰难的时间开始全身心投入到大模型的研发中。国外已经做出来了,但在国内,智谱即将踏入的是无人区,一旦踏进去,将会完全改变智谱的发展轨迹,甚至命运。


决策会后的第九个月,2022年8月,智谱联合清华大学打造了高精度双语千亿模型GLM-130B,参数规模1300亿。在GPT-3发布26个月之后。


说到研发的困难期2020年年底、2021年,张鹏说,算力就像粮草,是最大的资源。算力不够,我们就只能东一家西一家地去借,借到的算力,要一点一点抠出来,省吃俭用地分给工程和研究。


「穷人的孩子早当家。」张鹏说,要加快训练大型深度学习模型的速度,最快的办法就是用上高端的GPU芯片。GPU是专门用于高效处理图像和图形的处理器。2020年时,智谱终于等来了一批GPU芯片。这批芯片的参数和张鹏的需求相差了10%左右,但也能帮上大忙,原本是给视频游戏公司提供算力的芯片,被智谱以「捡漏」的方式得到。


为了更省,工程师们把模型压缩、量化、加速,让模型可以在更低的成本下运行。张鹏曾经算过一笔账,一项计算任务原本需要8张高端GPU卡,总价约100万元人民币,经过工程师们的努力,只要10到20万元的硬件就能同等效率地跑起来。正是这样的精打细算,让智谱挺过了创业早期的困难时刻。


理工男的记忆里,对重要时刻的印象,远不如技术指标的曲线来得深刻。张鹏说,他人生很多非常重要的决策都是这么过来的,平静,没有争吵,没有「激情澎湃」,甚至当时「没什么感受」,回头去看,哦,这件事情还是一个非常关键的点。


当然决策会上也有人在问,现在(在GPT-3发布一年半之后)才去做这么一件事情有没有意义?


千亿参数的大模型,放在2024年的今天,能跑出来的机构也非常少,在张鹏和智谱起跑追赶的时候,国内甚至还没有多少人知道OpenAI,更少有人知道大模型是什么。


人工智能大模型,是2023年的年度十大科技热词,指拥有超大规模参数、复杂计算结构的机器学习模型。它能够处理海量的数据,完成各种复杂任务,如自然语言处理、图像识别等。张鹏笃信大模型能改变人们的生活,改变世界。这是他和智谱当初选择追赶的意义。


大模型的出现,真的改变了普通人对人工智能的认知。以前是人想让机器学什么技能,就教它什么技能。教过的有可能会,没教过的就不会。现在,以前没教过的技能,它也开始「无师自通」了。有研究机构认为,在未来10年,知识工作者的效率可以提高4倍。你可能永远不知道,将有哪一篇文章、图片、报表、视频,是出自大模型之手。


创业初期近百人团队的智谱,人员构成也很「质朴」,以工程师居多,都是「技术特种兵」,其他部门的配置还不完备。GLM-130B发布会前,这个研发团队干了不少杂活儿:新闻传播稿是研发人员自己写的;产品需要一个logo,没这方面的专职人员,一位工程师就找了自己的女朋友代劳,临时设计出来一个。发布会当天,张鹏也没有和团队一起庆祝这重要时刻,他在深圳出差,因为疫情隔离没能回到北京,发布会也是在线上。


GLM-130B发布至今,收到了70余个国家、1000多个研究机构的使用需求,也成了全亚洲唯一入选斯坦福评测的主流大模型。更大的意义在于,它拥有与国际顶级机构不一样的技术路径——GLM(General Language Model通用语言模型),一个独属于中国的自研路径。自成一派,不会被「卡脖子」。


就在GLM-130B发布的三个多月后,2022年11月30日,又一枚「炸弹」来了,投放者还是OpenAI。


图源视觉中国


大模型的「核弹」


有必要介绍一下智谱追赶的对手,OpenAI。


它是当今人工智能领域的领头羊,历史上崛起速度最快的初创企业之一。这家美国公司于2015年12月成立,最初是一家非营利组织,创办者包括今天大家熟知的埃隆·马斯克。后来随着马斯克的退出以及大模型对资金超预期的需求,2019年3月,公司的性质从非营利性转变为「封顶」的营利性。


人工智能大模型太烧钱了。根据Tracxn(初创企业投资分析平台)的数据,截至2024年,OpenAI已经完成了7轮融资,累计筹集超过110亿美元。仅在人工智能训练方面,OpenAI的投入就达70亿美元,另外还有15亿美元用于人员配备。


公开资料显示,至2023年,智谱获得了累计25亿元人民币的投资,不及对手的1/30。一位中国的投资人透露,现在中国在人工智能投入的资源,可能都不如美国的一家公司多。


但它取得的成绩和这25亿,也足以让智谱成为当下中国的明星企业。投资者名单上,集合了一众互联网大厂,还有红杉资本、高瓴资本、启明创投、君联资本等。


在中国人工智能领域的新晋势力中,有着大模型「四小龙」的说法:智谱、月之暗面、百川智能、MiniMax。2024年2月,月之暗面获得了目前国内大模型公司单轮最大金额融资,超10亿美元,由阿里领投。市场估值上,智谱和月之暗面率先进入了「200亿人民币俱乐部」。同期,OpenAI的估值是800亿美元。


成为明星企业的智谱,却没有像其他「小龙」一样,CEO也有明星的光环加持。百川智能创始人兼CEO王小川,互联网江湖中的「大咖」,曾任搜狐CTO、搜狗CEO,后凭借技术实力和昔日积累的人脉,开始独自创业,百川智能的最大能量,来自王小川本人;月之暗面的杨植麟也是明星创始人,出生于1992年,是「四小龙」的CEO中最年轻的,他此前就在AI学术圈很有名气,清华90后学霸、AI天才这些标签,也让他成为大模型创业者里的新锐代表。


相比于这两位的名气和个性,张鹏显得很普通。清华本、硕、博出身,很多熟识的人对他的第一印象,是「没什么印象」。「从他的脸上,你看不到什么喜怒,情绪稳定得像AI机器人一样。」一位熟悉他的人说。


就连OpenAI投出那颗炸裂的「核弹」,张鹏的脸上也没见太大变化。2022年11月30日,OpenAI发布ChatGPT,这个全新聊天机器人模型,是一款革命性的产品,刚一上线便引爆全球,成为用户破亿速度最快的消费级应用。仅仅两个月,ChatGPT的月访问量就超过了6.7亿次。


ChatGPT的出现,标志着人工智能大模型在全球范围内真正「出圈了」,它从研发实验室或行业领域,跳跃到了普通大众的消费应用范畴。在行业里一直以来看不清前路的商业化,也在模糊中有了方向。


图源视觉中国


对于OpenAI投出的这枚「核弹」,人工智能领域一位专家的震惊在于,以前是猴子爬树,ChatGPT突然出现,让「猴子不知怎么就爬到月亮上去了」 。


张鹏的反应倒出奇地平淡,「技术不是魔法。对于做技术的人来说,没有什么震惊的」 。连「好神奇啊,怎么做到的」都不会有,技术都是有迹可循的,都是从以前积累下来的。


当然,ChatGPT刚出现时,张鹏和技术人员也会问它一些问题,常识性的、专项能力,甚至是很荒诞的问题,比如问它「太阳有几只眼睛?」主要观察它对人意图的理解,以及逻辑性。


智谱最初的研发重点是数据挖掘与科技情报分析。其实在ChatGPT出现之前,团队就做过预测,预计未来的3到6个月内,OpenAI会拿出一些东西来。「具体拿出来啥我们不知道,因为它那段时间动静就很少,信息保密已经很严格了。」张鹏说。


ChatGPT产生的爆炸力和之后产生的影响力,张鹏和团队也预测到了。于是,第二次追赶也开始了。


立刻集结队伍,调动所有的研发资源,把力量全部集中在这件事上。研发时团队的紧张程度,张鹏没有过多描述,只说「团队连年都没有过」。2个多月时间,智谱的对标版本就已经出现,可以对外去做测试了。在ChatGPT发布后的4个半月,智谱千亿基座的对话模型ChatGLM发布。


和「上一次GLM-130B发布会」一样,张鹏又没有和同事们一起,共同感受这重要时刻,他正在河北,从机场往高铁站的出租车上,赶着回北京。而此前的一天,他还在南京,去见自己的一位师弟——李智星。从CTO变成CEO,角色的转换意味着张鹏需要为团队挖掘更多独当一面的人才。


李智星,现任智谱政府客户事业部技术副总裁,为了延揽这位师弟,张鹏花了5年时间,可以说是三顾茅庐。


两人相识于2012年,李智星在清华攻读博士后,在东主楼的205实验室第一次见到张鹏。那时都是理工男,两人一起出国做项目,穿着都很随意,饿了就买三明治顶饥,吃腻了就买罐辣椒酱,自己煮饭拌着吃。张鹏是湖北人,爱吃辣,肠胃又总不太好。从实验室走出来之后,李智星先是在重庆的一所高校教人工智能,后又任职互联网大厂的部门负责人。


张鹏第一次找李智星,是在智谱刚创立的2019年,当时李智星回绝了。第二次是在2021年,李智星从阿里离开,原本是加入智谱的最好时机,当时张鹏和智谱的创立发起人唐杰还和他吃了一顿饭,连待遇都谈好了,但想到家人还在杭州,李智星又一次拒绝了。第三次是在2023年的3月13日,那天是周一,李智星在南京的一家咖啡厅里见到了从深圳赶来的张鹏。


「哟,你这穿的。」李智星和张鹏打招呼。南京的3月还有点凉,那天,张鹏穿着一件商务夹克,连头发都打理得很精致。第二天他计划要赶回北京参加ChatGLM的发布。


「其实不用他说,我也早就想来了。」李智星在等待一个时机,现在,时机到了。


这是李智星看到的第三波机会。第一波是21世纪初前后的互联网兴起,只要会写一个GSP(Generalized Sequential Pattern,一种常用的序列模式挖掘算法)或是ASP(Active Server Pages,动态服务器页面),门户网站就起来了,所有的草根都有机会。第二波是二零一几年,那时都在说「大众创业、万众创新」,移动互联网开始爆发,信息技术、计算机技术渗透到生活的方方面面。大模型对他来说就是第三波机会,而这次,机会正好被摆在了他的眼前,之前也有过很多人脸识别、智能客服的小创新,但都不像大模型这样渗透到生活的方方面面。


「对于我们做 AI 的人来说,这其实是一个非常积极的信号。以前我们觉得这个天花板非常矮,很快就触碰到了,也就变成了传统工程的东西了。但是ChatGPT出来之后,我们发现大模型的天花板一下子被提得很高。这中间有很多事可以做了,那这个时候肯定要上嘛。」李智星说。


和以前的待遇比,是降薪,原本近在身边的妻子和女儿,也变成每半个月从北京飞杭州才能见到一次,但李智星还是来了,重新回到了曾经求学时的北京五道口,随张鹏一起,在大模型这个时势下,寻找更大的空间。


像这样怀揣着技术理想主义的人,智谱还有很多。


受访者供图



「爆发后」的大模型江湖


彼时正处在ChatGPT发布后的震动期、中国的大模型热潮之前。


回顾人工智能的发展史,从20世纪50年代人工智能技术诞生至今,先后四次引发大规模的关注,分别是专家系统时代、机器学习时代、深度学习时代和大模型时代。前三个时代,由于数据、算力、场景落地和投资回报等方面的原因,没能形成AI产业的商业闭环。到了现在的大模型时代,基于通用性、涌现性、强算力的特征,大模型时代最有望形成商业闭环,有技术的可行性和未来巨大的想象空间,众多玩家涌入大模型赛道。


ChatGPT更是给这个赛道朝天空打响了信号弹。正是在2023年,大模型热潮席卷全国,也被媒体称为「百模大战」。


亿欧智库发布的《中国「百模大战」竞争格局分析报告》显示,截至2024年,国内公布的大模型数量已经超过300个,一个显著特征是:各互联网大厂纷纷挤上赛道。百度的文心一言、阿里的通义千问、腾讯的混元大模型、抖音的云雀大模型、美团大模型……不但自己的大模型产品落了地,而且在投资市场上,也对AI创业公司广撒网。


以大模型「四小龙」为例,智谱的投资方有阿里、腾讯、美团,百川智能背后站着阿里、腾讯、小米,月之暗面是阿里、美团,MiniMax是腾讯。


一个背景是,由于近两年的经济形势,投资市场相比于几年前更加谨慎,大模型突然间成了所谓的「风口」,也迅速卷进来热钱。如同其他行业的风口一样,各大公司想迅速彰显影响力,抢占市场。「百模大战」越来越热衷于「刷榜上位」。


「从数量上说,国内的基础大模型研发机构已超过全球其他国家的总和,但在『质』的飞跃上与世界级产品还有很大距离。」王延峰说。


王延峰是上海市人大代表、上海交通大学人工智能研究院副院长。2024年5月,他对媒体说出了当下中国大模型热潮中的「水分」。几个月前,中国人民大学与伊利诺伊大学厄巴纳-香槟分校的研究揭露了大模型评测中的漏洞,即一些模型在训练过程中直接使用「测试集的数据」进行训练,导致评测分数的虚高和直接「通关」。


「这种五花八门的测试方法可能会导致技术的过度包装,进而造成市场化的混乱。」王延峰接受媒体采访时说。


「竞争乱战之下,整个行业都非常焦虑。」 在《人物》访谈中,多位大模型业内人士都表达了类似观点。


张鹏觉得,「其实没必要那么焦虑。让子弹再飞一会儿吧,刚刚出枪膛的,你说它能不能打中那个目标?」


张鹏对焦虑有着不一样的理解。他把焦虑分为外源性和内源性两种。「内源性的压力来自对自己更高的期待,我有没有找到正确的方向?有没有找到正确的路径和节奏?离目标是不是越来越近?」张鹏确信他和智谱走在自己的步调上,这样的压力不至于让他焦虑。外源性焦虑是来自大环境变化给的压力,情绪的波动也主要来自外界各种信息的干扰。这时候即便大模型一般的大脑,也会有人体生理上的局限。「人的大脑强就强在是一个物理整体,不能切割,弱也弱在这儿,很容易受到其他东西的干扰。」


技术的迅速演进,吸引了原本不在这条道路上的人涌入,同时影响着整个行业的风向、资源。事实上,在「百模大战」开始之前,融资就是智谱的一大挑战。后来关注的人多了,可以融到钱的机会也更多了,张鹏要找的是信念、认知一致的同行者,他们要携手一起长期奋斗。


最频繁的时候,张鹏一天要见三四位投资人。最开始,他和团队需要和对方解释大模型到底是什么。ChatGPT出现之后,所有人都看到了它比以前的任何人工智能都更接近一个「人」。他不是苹果Siri、微软小冰或者天猫精灵,而是可以实现多轮对话的聊天机器人,可以写代码、写营销文案甚至生成图片和视频,虽然并不完美,但看起来无所不能。这也减轻了张鹏的沟通成本,他不用再和所有人解释什么是大模型了,只需要说,「我们要做的事情就是和OpenAI对标。」


后来,投资人问得最多的问题则是「大模型怎么挣钱,商业化怎么做?」有的投资人问得更直接:「OpenAI一年要亏50个亿(美元),你亏得起吗?」张鹏回答:「那你先给我50个亿。」


对大模型这件事情,长期的确定性,大家是一致的,没有人质疑这是一件革命性的事。但对于短期的确定性,大家是不一致的。很多人都想通过它赚快钱。如果没有实现赚一票就走,他们自然会更焦虑。


于是出现了很「分裂」的场景:投资人开会,主题是长期主义,但是同时也在催企业去挣钱。这样矛盾的事情在这个领域里经常出现。张鹏理解这种分裂,「时间是容易被很多人忘记的尺度。过去可能需要花10年甚至20年来投入的事情,在大模型这件事情上被压缩到了两三年,大家很难不焦虑。」


比消除焦虑更要紧的是,怎么能够在有限的时间尺度里把认知的差距拉齐。2023年下半年,一些消极的声音开始出现,争论「到底需不需要通用大模型」。这样的声音越大,越是挤压了大模型领域的空间。在一次公开场合,张鹏也发表了大模型走向分层的看法。没多久,张鹏在机场的摆渡车上,接到了一通老熟人的电话,对方正是有段时间没联系的王小川。电话里,王小川赞同了他那次公开的言论,「他说这个挺好的,大家应该一起来推这样的事。因为他可能也碰到了这样的一些问题,市场的声音很杂乱,大家认知不一致,其实对于我们这种大模型创业公司来说,是不太友好的」 。两人都希望,能够从创业者的角度统一一个专业的认知,把明显看起来有问题的概念驱逐出去,不要让劣币驱逐良币。


一边清除「杂音」,一边全力追赶,刚刚花4个半月标齐ChatGPT的智谱,在ChatGLM发布会的当天,就遭遇了「暴击」,这条跑道上,对手又一次「提速」了。



更重大的命题


也就相差几个小时。


2023年3月14日,智谱发布千亿基座的对话模型ChatGLM。深夜,张鹏还在出租车上,用手机刷着关于智谱ChatGLM的动态。15日凌晨一点,OpenAI发布了GPT-4。消息瞬间淹没了手机,按美国当地时间算,发布日期和ChatGLM(发布)都是在14日。


不只如此,就像事先约好了一样,Anthropic也发布了对标ChatGPT的Claude,谷歌推出对抗OpenAI和微软组合的PaLM API服务(Bard)。这一天堪称「大模型里程碑日」。


回到那天,出租车在高速公路上飞驰,暗夜里,手机屏幕的一点光亮把张鹏脸上的表情照得清晰可见,看着GPT-4的技术报告,张鹏苦笑着自言自语,「我们好不容易花了几个月,年也没过,把这事弄出来了,结果『砰』一下,人家又放这么一个东西出来。」


「我们甚至还没来得及庆祝,对手就又给你立了一个更大的目标。」


要继续往前看,智谱又开启了第三次追赶。


2024年1月,智谱迭代新一代基座大模型GLM-4。同样对标OpenAI的GPT-4。


今年1月,智谱发布基座大模型「GLM-4」。


3和4两代大模型,GLM对GPT的追赶,从26个月缩短到了10个月。至于那款ChatGPT核弹级应用的追赶,则是4个半月。


追赶的同时,张鹏也背负着一个更重大的命题——公司的商业化。2023年3月,智谱开始组建商业团队。


现在,张鹏的很大一部分精力,都花在公司的商业化上。这是一个CEO必须做的。但在最初,他的理想只是做一名工程师。参与创办智谱之前,张鹏已经在实验室里待了15年。


那是清华大学计算机系知识工程实验室(KEG实验室),成立于1996年,是张鹏的老师王克宏从国外回来后,力主建设的。清华本科毕业后,张鹏作为硕士研究生进入了KEG实验室,他也是后来才知道,自己研究的知识图谱,祖师爷是美国国家科学院院士、图灵奖得主、入选IEEE智能系统首届「人工智能名人堂」的爱德华·费根鲍姆。那时,他就感受到国内外人工智能领域的巨大差距。


导师王克宏很务实,比如,他在1996年就给实验室的所有学生提出了「P to P」的理念,「Paper to Project」(从论文到项目)。「单纯做理论研究不做工程,这件事情是没有未来的。」导师的话,他到现在都记得。


那时,张鹏性格有点内向,不善于跟大家打交道,他喜欢实验室清静的氛围和环境,天天跟聪明的人在一起,接触世界最顶级的研究成果和信息,对于工程师来讲,这是最好的地方。


爬山时的张鹏

受访者供图




李智星也记得实验室里的张鹏。话不多,对生活上的要求更不多,但他有自己的执着。实验室开发了XLORE和AMiner两套系统,前者是一个跨源的知识图谱,后者是一个科技知识挖掘平台。很多时候实验室的产品和工程可能由学生来开发,张鹏作为实验室老师,只需要设计架构和定期规范,但当学生开发得不尽如人意时,张鹏什么也不会说,直接下手亲自搞定。


实验室不是完全「闭关」,也会承接一些社会上的项目,比如政府侧的需求和企业客户的订单,到后来,实验室不但自给自足,而且有了盈利。可以说,智谱商业化的资源,最初是从实验室积累的。2019年公司成立,算是AI创业公司的先行者。


工程师和CEO的不同?2024年8月,在接受《人物》访谈时,张鹏笑了,比如,做技术的人和外人讲起本行来,可能很少考虑对方听不听得懂。最开始,解释这个工作让张鹏很不适应,「这都不是常识吗?」很快他就感知到,听完他探讨技术,对面的眼神中都充满了迷茫。「有九成以上的人听不懂,但又对此充满好奇」,他意识到,这就是AI真正走进人们生活中的认知差距。


一个工程师,一个搞技术出身的人,很多时候相当理想化。「你说让我拿个半成品跟客户去讲,嗯,根本做不到,我一定要基本上是 perfect 这个状态才可能拿出来去说。」可问题是,技术等不到(perfect)那一天,技术也在不断演进。当下的市场环境也等不到那一天。「只能一边追赶,一边沿途下蛋。」


沿途下蛋,也是智谱的商业化策略。因为毕竟不是纯研究机构,而是创业公司,从这个角度讲,与工程师相比,CEO做的事可能更复杂。「赚钱这件事情是很复杂的。」


一家创业公司会议室的样子,大概能体现这个公司的风格,比如传媒公司会把会议室叫 「百万+」,新闻机构给会议室起名「光明顶」,智谱的会议室名称,是以AI历史上关键的产品命名,其中两间是以智谱最重要的两个产品GLM和ChatGLM命名。和公司里其他科技感、未来风的透明办公室相比,这两间会议室都有深褐色的木质长桌,同色系的木质椅子,椅座配有黑色皮质靠垫和坐垫,会议室的装修风格沉稳厚重。访谈当天,其中一间会议室被预留,客户是政府部门的。


全方位地认知市场和客户的需求,也要时刻判断哪些是有问题的,或者是伪需求,是张鹏作为CEO的必修课,有时他会引导客户用更好的方法解决问题。


有一次见客户,飞机落地时就已经是晚上八九点,张鹏拉着行李箱直接杀到了客户的办公室,客户也很热情地准备了咖啡、蛋糕、水果,看这架势张鹏知道,客户不会那么早就放他走。深夜,在办公室的白板上,张鹏画了一圈又一圈的演示图,解释为什么要有一个基础设施,再有一个平台,才能赋能所有的业务。又讲到大模型和传统智能模型之间的差异,它最大的特点是泛用能力比较强,如果不利用这种特性的话,ROI(投资回报率)是一定不好的。


客户却并不这么认为,对方并不想一开始就有太多投入,只想让张鹏先做一个东西来验证。张鹏知道客户的顾虑,但也提醒一点,验证是可以,但做出来的东西仅限于验证,验证出来ROI也是不通的。最后客户还是同意了张鹏的方案。


如果从客户合作案例观察,智谱明显是一个to G、to B的企业,在业内人士看来,它在to C端的产品,还没建立起明显的竞争优势。有人认为,「智谱从出生的那天起,好像就缺乏to C的基因」 。在国际上追赶OpenAI,并不代表他们在国内就一骑绝尘。众多大厂挤进赛道,一边成为智谱的投资方,一边又成了他的竞争对手。这些大厂,拥有雄厚的资金实力和广泛的C端基础。这些巨头对任何一家创业公司来说,都是一个危险的存在。


面向C端,智谱也早就建立了智谱清言APP,截至目前,C端用户在智谱清言上的应用,大多是免费的。


智谱并没有公布C端的用户数量。但有另一个数据可以参考,Questmobile的AI智能体应用洞察半年报显示,今年7月,豆包占据AIGC APP月活跃用户规模榜首,而智谱清言以245万月活用户排名第八。


「to B和to C之间的界限已经被打破了。」张鹏说,企业无非两大部分组成:人和组织。服务好企业里的每个人其实就是在服务这个企业。组织跟个人不一样的地方是多了流程、协作和组织架构,其实也是人和人之间的关系。


每一次发布,智谱都会优先把产品放到清言这个平台来让用户体验,第一个目的就是能够快速让大家可用。发布即可用,这是张鹏一个很重要的理念。后来他在分享的内部文章中写了一句话:不完美但可用的东西,比完美但不可用的东西更有价值。这是张鹏在成为CEO之后的一个最明显的变化。


大模型技术的创新依旧突飞猛进,而飞速变化的不只是技术,还有价格。智谱也成了今年最早一批降价的大模型创业公司之一。


5月11日,智谱宣布入门级产品 GLM-3 Turbo 模型调用价格从5元/百万 Tokens 降至1元/百万Tokens,降至原本的1/5。3天之后,OpenAI发布最新模型GPT-4o,定价比GPT-4 Turbo减半,并且应用端向所有C端用户免费开放。实际上,每次推出新模型都比上一代模型价格减半,几乎是OpenAI的固定操作,不过这一次常规降价,却成了国内大模型价格战的一个引子。整个5月份,不下7家大模型企业加入到这场混战中,包括字节跳动、阿里云、百度、腾讯云等互联网大厂以及垂直赛道头部玩家科大讯飞,降价动作最接近也就相差几个小时。


「降价是智谱持续在做的,不是为了应对市场压力,或者跟竞争对手打价格战。」张鹏表示,「作为一家初创企业,我们烧的是投资人的钱,我们没有资本去打价格战。所谓的价格战不是我们发起的,我们只是正常地根据技术进步迭代把价格往下放,因为我们的成本已经降下来了,就不用坚持原来比较高的门槛。」





「把它秒了」


2024年9月初,智谱刚刚完成最新的一轮融资,金额数十亿元,领投方为中关村科学城公司。


在接受《中国企业家》的访谈时,张鹏介绍了这轮最新融资。他说,「我们有自己的融资节奏,在不同阶段为不同目标去融不同的钱,跟不同类型的投资人接触。这次融资由中关村牵头,也有一些其他的投资方,因为到了现在这个阶段,需要各方的支持,包括市场化的基金和官方(资金)。」


和世界顶级大模型公司的追赶和比拼,让张鹏意识到,「我们面临着可能是一个跨阶梯的阶段。我们可能要把自己的整个能力提升到另外一个level上去,这个时候可能就不是单纯靠技术,或靠自己自然增长的产品能力,去做(成)的一件事情。」


「沿途下蛋」,是商业化策略,但张鹏站在全局的战略思考是:需要更多撬动战略性力量来参与这件事,因为它已经上升到更高层面。


「百模大战」仍在持续,有风口就会有人跟风,有跟风就会有摇摆。哪怕是一个小小的震荡,也会引发蝴蝶效应,去年,ChatGPT的流量增速出现下滑,国内立刻出现悲观的论调,很多企业融资随即遇到困难。截至目前,全球范围内,对大模型还没摸索出一套成熟的、行之有效的商业模式。这个突破口,至今没有找到。中间会发生什么样的变数,不知道。


对于张鹏和智谱而言,外界也有一些疑问:和OpenAI的实力差距是多少?还需要追赶多久?


张鹏会想起小时候玩过的一个游戏,打砖块:屏幕上端是堵砖墙,下端是一个小球和挡板。


用挡板拦住小球,弹射砖块,目标是把砖墙全部击碎。随着关卡难度的上升,砖墙越来越厚,这时候需要找到突破口,一旦小球进入突破口,就会加速破壁。


在张鹏看来,创新这件事和打砖块一样,先易后难,关卡的障碍越来越多,突破口也越来越小,有时只是一条缝隙。难就难在很少有人去真正地找那个缝隙。或者像挖井一样,挖了几锹,走了,其实水就在下面。


对于差距的问题,张鹏说,「工程师就这么讨厌,需要特别讲逻辑,尽量保持严谨。就看你从哪个层面上说。单从技术上说,我觉得这种代差或者时间差上,我们已经追到非常接近了,半年到一年」。


智谱的科学家许斌,更愿意把两家公司做的事比喻成登山。就像南北两面攀登珠穆朗玛峰的两支登山队,不同的是,有人提前用自己坚信的技术路线登上了珠峰的山顶,而有的人还在山腰上,山腰上的人已经知道自己不是攀上珠峰的第一人了,虽然遗憾,但同时还有一种信号被释放出来,珠穆朗玛峰不是真的高不可攀,人类可以攀登上去。


至于是不是第一名,当然很重要,但更重要的是,在过去几十年里,期待和失望反复交替出现在人工智能历史中,现在反而让他们能百分百确定,现在是认知智能登顶的时刻了。


智谱有着自己的定力和底气,它和其他公司最大的不同就是:「含清率」。


当年高考,张鹏没有跟家人征求意见,只填报了一个志愿:清华大学。他和公司创立发起人的唐杰、科学家许斌、董事长刘德兵、投资人李家庆、师弟李智星,都是出自清华。


现在,智谱也有很多毕业于清华大学的员工。如果你来到智谱位于11楼的办公室,可能会看到这样一幕:一个男生穿着睡衣和拖鞋,从你身旁慢慢走过,晃晃悠悠像是在梦游。随便一问,这个年轻人可能就是一个研究员,再问履历,不是哪个省的高考状元,就是哪个地区的高考第三名。


着装对这些年轻人来说不重要,重要的是:把它秒了。


这是这家公司的专属语,通常语境是,哪个技术难关需要攻克,有人头都不抬应一句:「哦,那把它秒了吧。」年轻人晚上睡不着觉聊天,聊出好点子,「明天把它秒了」,第二天就能见成果。外面的人们看不到的是,但凡遇到重大的挑战,这些年轻人,大年三十也会在工位上「秒」。


在这些年轻人中间,你可能听不见有什么多余的话,但是张鹏说,这里的所有人心里都有技术理想,也相信总有实现的那一天。「理想」这两个字大家嘴上从来不说。任何行业都不缺理想,但这里的每个人都见过清华大礼堂前日晷上的四个字,「行胜于言」。现在出了校园,铭言也在智谱出现,只不过换成了「do it now」。


团队中极少有人见过张鹏发火,唯一的一次,是一件事情大家在犹豫做不做,放在时间维度上,还真的不是所有事都能「do it now」。那次,张鹏这个身材清瘦的CEO气得直接拍了桌子,在他的逻辑中,一件事要么做,要么不做,但是不能在团队里出现内耗。


其实公司离校园并不远。2024年1月,智谱搬了新家,在搜狐网络大厦,办公区占据大楼7—11层的空间,离清华大学不到3公里。这原本还是搜狗公司的总部。大厦正好站在一个「AI的十字路口」,原本王慧文的光年之外占据了大楼的三层,路的另一侧有 「清华系」 代表团队聆心智能和深言科技。


站在智谱7层的落地窗前,往西远眺能看见颐和园的万寿山,往北366米是清华大学FIT楼,也就是清华大学信息技术研究院院楼。张鹏在清华度过了将近20年的时间,FIT楼建成以后,他的时间基本是在这里度过。现在,智谱GLM大模型的图文介绍被张贴在FIT三楼的宣传栏中。


某种程度上,清华大学撑起了当下人工智能大模型的「主力阵容」。


有一次张鹏和几个师兄一起吃饭,琢磨这一波技术浪潮里面清华做对了什么,让清华这一批人能够在AI这件事上占得这么多先机。讨论来讨论去,都没讨论出什么新的东西,最后大家还是回归到最原始的本质,清华的环境培养了一拨踏实务实又具有创新精神的人,他们觉得这个是最关键的。「人工智能的创新,首先它不是一个纯学术的东西,它是学术、工程、市场化方方面面综合起来的事情,所以你要成功,不是一两个人就能做成的,得有这么一帮人有同样的信念、价值观、行事的方式,而且都要高度一致。符合这些要求你才能成功,而这些恰恰是清华这个环境造就的。」


就像张鹏和他的伙伴们回忆起当年做决定的那一刻,张鹏承认,「也是脑子一热」。这是积累多年的相互信任,也是对技术最原始的相信。





理想和支点


2024年7月26日,智谱的产品版图中增加了对标OpenAI视频生成模型Sora的一员:支持文生和图生的视频生成产品「智谱清影」。


这是智谱对OpenAI的第四轮大规模技术追赶。从GLM-3、ChatGLM、GLM-4到如今,这家中国的大模型独角兽,几乎每发布一次技术重大突破,都和OpenAI的举动密切相关。


但今年,这场赛跑似乎进入到一个新的拐点,张鹏说,「OpenAI公布的技术细节越来越少,但好处是,我们不可能永远跟在它后面,总有一天要用自己的路径跑到前面。」


OpenAI不是目标,而是赛道里身位靠前的那位选手。「创业是一场马拉松,不是冲得越快越好,你是需要坚持的。」张鹏说。


那目标到底是什么?


智谱把2024年定义为AGI元年。AI技术增长进入到了一个全新的阶段,「技术曲线的陡峭与让更多人享受到AI强大的生产力之间还有非常大的差距」,如何把强大的大模型能力真正用来帮助人们的工作、学习和生活,其中还有很多工作要做。


AGI,全称为Artificial General Intelligence,通用人工智能,它被认为是AI的更高层次,可以实现自我学习、自我改进、自我调整,进而解决问题,而这个过程中,不需要人为干预。通俗地说,AI有自我意识,可以自主行动了,真正的从工具转变成生命。


让机器像人一样思考,是智谱的创业理想和目标,是这场比赛的终点,也是他们一直追赶的支点。


图源视觉中国


智谱的投资人、君联资本总裁李家庆也意识到了这个节点,「当数据量、算力、大模型达到一定程度的时候,就会发生一些我们意想不到的东西」 。


3年前,君联资本领投智谱,开始时李家庆不是奔着大模型去的,而是智谱早期研究的知识工程,他对这件事本身充满了兴趣,当时投资的报告书上也几乎都是和知识工程、技术信息、知识图谱相关的内容,对大模型的描述反而没有什么篇幅。李家庆只是知道,张鹏及团队已经在探索和研发一些跟基础预训练大模型相关的东西了。「但那件事到底有多大,是不是完全能够走得通,我们并不清楚。当时只是看见在碗里的东西,但大模型就像是种在田里。」


而仅仅是3年过去,技术的爆发,行业的巨变,反而让李家庆更冷静,他把今天看成白垩纪时代,「行业的整个地壳都在发生变动,所有人看到的都是陆地上的一角,当有人觉得地壳稳定下来了就马上开始跑马圈地盖房子,结果海平面一上来就把地壳顶掉了,现在的当务之急是观察地壳的运动趋势和规律」 。


他又打了一个比方,大模型相当于给这个世界在换引擎,这是一场巨大的、未知的变革。这个变革需要漫长的时间,他说,不会是要么速胜,要么速亡。


很多时候,答案要靠时间一点一点揭晓。这同样也是张鹏冷静的原因。如果不是把大模型压在一两年的时间密度里,很多事情会看得更清楚。


不稳定的地壳上还是有坚定的理想主义者。李智星更愿意用一句古话来形容对AGI的期待——「朝闻道,夕死可矣」。他想起刘慈欣的小说《朝闻道》里,有一群知识分子,他们在宇宙排险员到来后,愿意以死换取自己研究领域的终极真理。AGI对李智星来说就像终极真理一般的存在,「以前不温不火,现在突然有一个东西给推上了潮头。我现在跟着张鹏站在潮头上,虽然要维持平衡保持方向还是挺累的,但是你站在上面还是很刺激的」 。


张鹏也表达了同样的感慨,「能生在这个时代很幸运,一辈子几十年的时间,可能就赶上这么一波技术的潮流。」


在这波潮流之上,张鹏变得比以前更忙了,他一度每天只睡5个小时,身边人总能看到他浓浓的黑眼圈。后来听从医生的建议,才保证每天7小时的睡眠。可睡眠之外的时间,是高速运转的。多年的好友兼同事何芸想要向张鹏请教技术上的问题,都要「插队」抢在其他人前面才有机会见上一面。


偶尔也有停下来的时候。他给初中的女儿讲功课、习题,有一次把女儿「讲哭了」,从习题本身,到原理,到道理,不厌其烦地全讲了个遍,而女儿有点不耐烦,她只想知道答案,最后心急得哇哇大哭。第二天,女儿从学校回来以后,走到张鹏近前:「爸,你说的那个确实有道理,我突然一下子就通了。」


可在自己的事业中,有些事情,没办法那么快得出标准的正确答案。


他心目中那个理想,实现之后,是什么样的状态?


张鹏愿把AGI做一个更简单的描绘:拿人做对比。像图灵测试,通过行为学的定义,用对话的方式让人分辨机器和人,如果人分辨不清哪个是机器,哪个是人,那就表明机器通过了测试。


在现实生活中,他的理想抵达的状态是:人感受不到机器的存在。


张鹏曾看过一部电影,《her》,2013年上映的,斯派克·琼斯编剧并执导。


该片讲述了西奥多离婚后,偶然接触到最新的人工智能系统OS1的化身萨曼莎,发现彼此如此投缘,而且存在双向的需求与欲望,人机友谊最终发展成为一段不被世俗理解的奇异爱情。


「这怎么可能是一部爱情电影?」在张鹏眼中,主人公和人工智能的交流、交互是无比自然流畅的,也没有区分工作状态、生活状态或是娱乐状态,「我可以跟你是工作的同事,下班之后,我们俩可以一起去酒吧,或者去餐厅吃饭」 。 他不认为这是一部机器,而是亲近的朋友。


张鹏觉得,他离这样的世界越来越近了。