时间拉回到 2023 年初。
GPT-4 还没有问世,但是 22 年底的 ChatGPT 已经给了世界一个巨大的惊喜,那天 OpenAI CEO Sam Altman 在推特上写下了:“今天我们推出了 ChatGPT,尝试在这里与它交谈”。很快几乎人人可以轻松人手一个的“聊天机器人”带着“大模型”这个名词被人人传唱。
但是那时关于生成式人工智能(AIGC)的一切还尚不清晰,国内的舆论尚且停留在拿“弱智吧”的问题逗 ChatGPT,大家惊异于如此直观的“AI”体验,脑海里多少都会浮现“这个东西可能会火”的念头,甚至于构思想到一个点子“这东西可以用在xxx上!”,虽然很快这些想法就被巨大的不确定性淹没,但是朦胧中似乎有航向告诉我们的的确确,未来已来。
2023 年 4 月,胡润研究院发布了《2023全球独角兽榜》,统计了成立于 2000 年之后,价值 10 亿美元以上的非上市公司。在人工智能这一分类下,排名第一的是刚刚给世界带来一点“GPT-4 震撼”的 OpenAI,在过去的一年里 OpenAI 估值暴涨 7 倍,从全球第 272 位飙升至 17 位。
而随后,我们正式见证了大模型浪潮为世界带来的“iPhone 时刻”,整个 2023 年,生成式人工智能与大模型赛道创业称为国内唯一一个逆势上扬的赛道,百模大战打响,投资雪花般落下,接近 80% 的一线投资机构都在这个领域有所出手。
跨越一整年,厮杀到下半场,根据《智东西》的统计,2023 年新晋的生成式 AI 和大模型领域相关独角兽达 23 家,国内新晋独角兽有 6 家,分别是智谱 AI、MiniMax、百川智能、零一万物、智元机器人,以及已被收购的光年之外。
事实上,国内这 6 家突出重围的新晋独角兽经历的,并不是一个“大模型火了”,“现在是风口”,“咱去创业吧”的轻松写意的过程。在大模型爆火之初,大家拍脑袋都可以想到“大模型重塑一切行业”,从金融科技到航空航天,从商务办公到购物零售,向上向下,似乎可以衍生出无穷的商业机会。
但是大模型,GPT,毕竟也只是一项技术,而技术必然有其局限。好比盲人摸象,在初碰大模型无穷的潜力后,我们很容易把它想象的无所不能,而在摸爬滚打之后,我们才能逐渐认识到它的形状它的边界它的逻辑它的症结。
在这 6 家公司中,背靠清华知识工程实验室的智谱 AI 和 MiniMax 可能是最早开始“摸象”的企业。
由清华大学知识工程实验室主任唐杰教授领导成立于 2019 年的智谱 AI 最早主要开展实验室科研成果应用转化与算法研究工作。作为一个学院派的创业企业,智谱 AI 的发展与整个人工智能行业的变革息息相关,2020 年,点燃 NLP 领域的 GPT-3 模型为智谱 AI 发送了信号——生成式的语言模型可能不再只是论文中的实验和小圈子内的狂欢,这个时候,智谱 AI 做出了一个现在看来非常正确,但是在当时又需要承担极大风险的决定——着手投身大模型,训练通用的基础模型。
这个“领先版本”的决策让智谱 AI 成为了目前“基础模型” Tier 1 级的公司,是国内首个估值过百亿人民币的大模型创业企业,也是目前国内估值最高的大模型独角兽。由于其优异的背景,智谱 AI 的投资方团队堪称豪华,其中包括美团、蚂蚁、阿里、腾讯、红杉、高瓴等多家知名机构。其产品 ChatGLM 也成为目前国内最强的 ChatGPT 开源平替。
而同样目前属于基础模型 T1 级的 MiniMax 发展经历又有所不同。MiniMax 成立于 2021 年,那时 GPT-3 方兴未艾,GPT-3.5 还在酝酿。MiniMax 的创始人是前商汤科技副总裁、通用智能技术负责人闫俊杰。
闫俊杰博士毕业于中科院自动化所,他在商汤成功搭建了商汤人脸识别和智慧城市相关的整套技术体系,在顶级期刊发表过 100 余篇论文,论文引用 10000 余次。对比作为互联时代风云人物的王小川、王慧文等人,闫俊杰可能是 AI 这个行业内的自主创业者中布局最早,技术背景最深的人。
2022 年中,MiniMax 已经迭代两代大模型产品,彼时离 Altman 发出让大家一起来使用 ChatGPT 的推特还有近六个月。不同于扎根学院背靠清华的智谱 AI 被时代推送的是否跟进大模型的“选择题”,MiniMax 是大模型创业中更加主动的那一群人,23 年 6 月,MiniMax 拿到一笔总规模超 2.5 亿美元的融资,一举估值超过 12 亿美元。
依托基础模型,MiniMax 同时发力 B 端与 C 端,不仅与金山 WPS 合作发布办公文档大模型解决方案,还自研推出了角色扮演类的 AI 聊天应用 Glow,上线仅4个月时间后用户数量便已经接近 500 万。
2008 年的王小川,由于搜狗输入法的成功,成为搜狐最年轻的副总裁。王小川身上有互联网人的创新与颠覆精神,此外,王小川身上也有互联网人的敏锐与出色的商业嗅觉。2023 年 1 月,在卸任搜狗 CEO 一年多后,王小川试用了 ChatGPT,并马上做出了判断:“强人工智能时代到来了”
与深耕 AI 领域的智谱 AI 与 MiniMax 不同,尽管背景资历出众,但 4 月才堪堪放出消息要成立的百川智能无疑在 AI 领域是一个新人,但是王小川如此描述这一点:“可能有人比我先淋到雨,但有可能他不觉得在下雨。但当雨滴滴下来之后,我第一个意识到,变天儿了!”
很快,百川智能捷报频传,在 4 月 10 日官宣加入大模型创业后的仅仅一个月,百川智能就拿到了来自腾讯、小米、金山、清华大学资产管理有限公司、好未来等十余家机构的联合投资,整体估值超 10 亿美元。而从 6 月份开始,百川智能更是开启了“大模型月更”模式,6 月发布第一个 7B 参数模型,7 月 推出 Baichuan-13B 大模型,8 月发布 530 亿参数的 Baichuan-53B,9 月又直接将 Baichuan 升级为 Baichuan2,宣布其能力已经以绝对优势领先 LLaMA 2。
而同样大佬带队的大模型“新生力量”还有零一万物。
每一个计算机领域以及创业投资圈的人都不会对李开复这个名字感到陌生,作为前谷歌全球副总裁,微软亚洲研究院的创办者,现在 AI 投资机构创新工厂的创始人,李开复在 2023 年 3 月宣布瞄准大模型与 AI 2.0 再次创业,并亲自下场抢人:“在全球范围号召世界级人才”
而在闭关整整 8 个月后,在 11 月 6 日,零一万物推出了大模型 Yi-34B,可支持 200K 超长上下文窗口,处理约 40 万汉字超长文本输入。Yi 这个取名来自汉字“一”的拼音,而如果将 Yi 中的 Y 上下翻转,那么就形容汉字“人”,而 Yi 中的 i 又是 AI 中智能的首字母,这个巧妙的取名寓意着 Human + AI。
除了模型外,这个同样亮相的还有“新团队”,零一万物组成了一个由前阿里巴巴副总裁、前百度副总裁、前滴滴/百度首席算法负责人、前谷歌中国高管等一众“高手”组成的顶级团队,并且在投资方面,由阿里云领投,零一万物估值已超 10 亿美元,成为“最快独角兽”
但是很快,零一万物就迎来了自己第一个挑战,在大模型 Yi 发布仅仅十天后,就有开发者质疑 Yi “完全的使用了 Llama 的架构”,一时间掀起了舆论风暴。随后就是漫长的发公告澄清,解释……而历经过微软的 PC 时代,谷歌的移动互联网时代的李开复,也将在大模型开启的新时代迎接自己的新挑战。
大模型的“基础设施”,除了显卡还有框架。
目前深度学习的框架可以说是谷歌公司的 TensorFlow 与 Meta 的 Pytorch 两极争霸,此外还有 MXNet,Caffe2 等群雄环伺。
而师从张钹院士的清华大学博士袁进辉在 2017 年创业,成立了一流科技(OneFlow)公司,志在打造新一代开源深度学习框架及开发平台,而那一年 《Attention is all you need》才刚刚发表,人们惊讶于 Transformer 这种技术对机器翻译带来的巨大提升,但是关于大模型的一切还没有开始转动。
而三年后,美团的联合创始人,王兴的舍友王慧文从美团退休,开始关注人工智能、加密货币与 Web3 等科技前沿。而伴随着 ChatGPT 一炮打响,王慧文也第一时间意识到了大模型的价值,马上宣布设立光年之外,打造“中国的 OpenAI”
但是王慧文的打法与王小川又有所不同,他选择了收购一家“建制成熟且价格便宜的初创企业”,最终目光锁定在了已经成为国内知名的开源深度学习框架 OneFlow 背后的一流科技。
王慧文以 2 亿美元收购了当时市面估值不到 1 亿的 OneFlow,收购方式是现金加股权置换。通过收购,王慧文让自己用于了可以在大模型界打拼的核心技术团队,很快 6 月份,光年之外完成融资晋升独角兽。
但是和顺风顺水的百川智能不同,光年之外的境遇可谓一波三折。创始人王慧文很快病退,美团以 20.58 亿完全收购光年之外,一流科技也转归美团。
很快,一流科技创始人袁进辉单独创业,瞄准 AI Infra 商业化方案创立新公司硅基流动,获得由创新工场领投的 5000 万天使轮融资。其中,新公司硅基流动的 35 人悉数来源于光年之外。
与其他五家做“基础模型”的新晋独角兽不同,由大名鼎鼎的华为天才少年稚晖君联合创立的智元机器人是国内唯一一个垂直领域的独角兽企业。
作为 B 站的“顶流 Up”,从 2023 年 2 月稚晖君(原名彭志辉)官宣成立智元机器人,投身人形机器人创业伊始,智元机器人就成为了国内的明星创企。
也许不像智谱 AI 与 MiniMax 那样提前布局与行业深度绑定,也不像百川、零一万物与光年之外那样由知名企业家登高一呼,众山响应。智元机器人似乎与稚晖君“高度绑定”,带着“天才式创业”的感觉。成立不到一年,智元机器人就已获得 5 轮融资,投资方包含百度、比亚迪、奇绩创坛,并在 23 年 12 月完成 A3 轮融资,金融直超 6 亿。
区别于其他领域与行业,人形机器人拥有着几乎是最高的行业壁垒,从技术来看,人形机器人需要具有拟人化的身体,关节需要灵活移动,能够适应复杂地形甚至模拟人类的运动和表情,从产业链来看,人形机器人上下游供应链非常复杂,包含控制、伺服、传感、交互等供应系统,涉及数百家零部件厂商。
但巨大的技术与商业难点下,智元机器人 23 年交出了一份不错的答卷,4 月 1 日由稚晖君发布 neZHa(哪吒),被认为是智元机器人新产品的雏形,8 月 18日,智元机器人发布首款产品“远征A1”,在基于大语言模型的机器人控制与自研的视觉控制模型上完成了一系列创新,并且设定 24 年也就是今年开展商业化落地,而今年初 1 月 2 日智元机器人联合北大成立“北大-智元机器人联合实验室”,将与北京大学紧密配合,实现研发成果落地,推动具身智能和通用机器人产业的发展和迭代。
值得注意的是,国内这 6 家突出重围的新晋独角兽,有 3 家均来源于“清华系”,分别是扎根清华的智谱 AI,清华大学计算机系王小川的百川智能以及电子工程系校友王慧文的光年之外。
而除了这 6 家 AIGC 独角兽,在新一代人工智能的创业界,清华系也傲视群雄,独领风骚。
在互联网浪潮刚刚席卷全国时,清华系创业团队也如同当下在人工智能领域一样热闹,美团的王兴(王慧文),搜狐的张朝阳(王小川),爱奇艺的龚宇,豆瓣的杨勃,虎扑的程杭……每一个名字背后都有一段传奇的创业故事
十余年过去,清华系又在大模型中站上时代的舞台。相比互联网在商业上的竞争,大模型更是一场在技术与尖端科技之上的竞争,游戏的玩家有深耕行业的技术大牛,有成名大佬亲自下场二次创业,也有天才少年异军突起广获关注……
伴随着 2023 年的过去,上半年的百模大战已然打完,大模型格局初步确立,而市场的大浪淘沙却在 2024 年才刚刚开始,在关于生成式人工智能“不确定的海洋”上,中国的创业者与清华系的校友们,已经为我们探索出了一个“可预见的岛屿”,但是旅程尚未结束,大海依旧广阔,我们靠着“摸着石头过河”究竟能把大模型描绘成什么样,就交付时间给予我们答案吧!