中美在人工智能领域的差距有多大?
抛开清华博士割韭菜这件事,差距还是挺大的。
大语言模型其实早在几年前就提出来了,直到去年才被谷歌和OpenAI玩出了突破,随后整个市场就如黄河之水一发不可收拾,各种的语言模型和生成式人工智能开始野蛮生长,接着就是技术上的频繁迭代,迅速锁定了海量的付费用户和白嫖党。
如果简单把人工智能理解成一台电脑,英伟达显卡是基础设备,算力是消耗,原创大模型相当于Windows或者macOS这样的底层操作系统。
OpenAI的最大贡献就是给技术指明了方向,大家不用耗费人力财力开盲盒,只要拿着开源的训练框架修修改改,就能做出了一个自己的大模型。
道理和今天的手机系统类似,除了华为的鸿蒙,其他底层代码几乎全部来自开源的安卓系统。
说的再直白点,中国没有自己的原创语言大模型,像什么文新一言、通义千问都是靠着美国开源模型训练出来的本地化模型,如果GTP4是100分,国内的模型也就六七十分,差距明显,但勉强凑合也还能用。
对于中国企业来说,大模型不是障碍,真正卡脖子的是算力。
那什么是算力呢?
简单来说,算力就是计算机系统或者设备进行计算任务时的处理能力和效率,放在物理世界,那就是水电煤气这样的能量消耗。
大语言模型这玩意儿狂吃算力,也就是算力越多,训练越多,结果就越好。
咱们就拿GTP-4来说,它的训练成本大约是2150万美元,这是在使用了8192个H100 GPU的情况下进行了55天的训练成本。
如果想要升级到GPT5,Open AI则需要5万张H100显卡,按照一张2.5万美元来计算,也就是125亿美元。
不过需要注意的是,训练大模型最重要的不是钱,而是显卡,这里就不得不提英伟达。
早些年,英伟达的主攻方向是游戏,后来发现他们研发的AI芯片也适用于挖矿、自动驾驶,特别是在大语言模型AI上格外好用,于是便在这个领域不断发力。
经过十年打磨,英伟达将芯片的计算速度提高了1000倍,股票在一年的时间内暴涨了近450%,不仅垄断了95%的专业AI芯片市场,公司总市值更是一路飙升到了2万亿美元。
英伟达的芯片拥有三大优势,它们分别是:并行处理能力、深度学习性能优化以及多GPU协作下的极致性能输出,放眼全球,短时间内没有一个能打的。
所以英伟达的H100就成了生成式人工智能领域里的硬通货。
根据市场研究公司Omdia Research的报告,截止到2023年12月底,Meta和微软两家公司分别购买了15万块H100,谷歌、亚马逊、甲骨文以及腾讯以5万块并列第三,百度、阿里巴和字节分别购买了3万、2.5万和2万块。
H100囤的越多,代表企业算力越强大。
但自2023年12月开始,美国政府已经限制英伟达向中国出售高端显卡,中国企业只能购买专供的H20和A800,性能只有前者的20%左右。
这也就意味着,中国的人工智能发展再次被美国卡了脖子,美国企业可以通过堆显卡的方式不断升级自己的大模型,而中国企业就只能拿着煤油灯去烧水,很难在短时间内弥补算力上的不足。
另外从人才和企业数量上来看,中国虽然和美国同在第一梯队,但在绝对数量上却被拉开了差距。
根据2023年发布的《全球最具影响力人工智能学者》报告来看,美国的入选人数最多,达到了1079人次,占到全球总数的54.4%;其次是中国,共有280人次入选,美国的人工智能学者数量是中国的近4倍。
在美国217位顶尖的AI研究员中,有70%来自美国以外的国家,其中来自中国的人数达到了50人、其次是印度和英国。
在OpenAI发布GPT-4时公开的贡献者名单中就有33位华人员工。
也就是说,中国并不缺少AI顶尖人才,只是大部分都跑到了美国。
再看全球人工智能企业的格局。
截止到2023年6月底,全球人工智能企业共计3.6万家,已经到了“万模大战”的阶段,美国的企业数量大约是1.3万家,全球占比33.6%,中国紧随之后超过了5700家,差不多只有美国的一半。
融资方面,2023年,全球AI初创公司的融资总额约为425亿美元,中国AI领域的投融资数量约为232笔,同比下降了38%,融资总额约为20亿美元,同比下降了70%。
整体上,亚洲、欧洲地区的融资规模都在下降,只有美国保持了14%的同比增长。
这说明热钱都在向头部明星公司集中,而那些中小初创公司却连汤都喝不上,因为随着模型越来越大,烧钱的速度也在呈指数级增长。
咱们还是拿OpenAi举例,在它成立的七年里,前后几轮一共融了140亿美元,未来还计划融资7万亿美元重组全球的芯片产业链。
由于训练大模型不亚于造车、造火箭,Open AI光是每天的运营成本就要达到70万美元,这还不包括公司旗下的其他AI产品。
2023年OpenAI的营收超过了16亿美元,同比增长了56倍,但亏损也在翻番,预计达到5.4亿美元,等到山姆奥特曼实现盈利,估计全球90%的AI公司,坟头草都长到两米高了。
目前的绝大部分AI公司完全依靠资本输血,初创公司不是圈钱就是陪跑,最终活下来的还是那几个互联网大厂和一个手都能数得过来的头部明星企业。
人工智能的上半场,中国企业无论在算力、人才还是融资能力方面已经完全落后于美国,有些人甚至认为,随着马太效应的叠加,这种差距只会越拉越大。
那问题就来了,中国企业还没有弯道超车的可能呢?
答案是必须有。
如果大家复习一下中国移动互联网的发展路径就不难发现,美国人的优势在于从0到1,而中国人则善于把1做到100,全球AI竞赛说白了就是中美两国的竞赛,其他国家根本没有形成相关的产业。
前面咱们也说了,因为大模型开源所以研发不是难点,如何与场景结合实现商业化才是人工智能必须解决的问题。
中国拥有庞大的数据和消费市场,互联网大厂的核心优势就是自带应用场景,可以不断通过用户使用和反馈进行训练和迭代。
目前国内互联网公司在人工智能领域的投入有多有少,但思路却出奇的一致,那就是让AI解决自己的业务问题。
比如腾讯早在去年4月就发布了多模态“混元”AI大模型,不过这个模型并没有像GTP一样让大家放开了薅算力,而是广泛应用到了广告创作、广告检索、广告推荐等腾讯业务场景。
具体来说,就是让AI更好地理解广告内容,然后再精确地推送到你的手机上,不得不说这很腾讯。
华为的模型专注视觉,阿里的模型主打卖货,字节则聚焦在文字、图像的生成功能。
总之一句话,在训练数据足够的情况下,通用大模型可能做起来费劲儿,但应用模型却没啥问题,即便算力不足也可以让时间去解决。
人工智能的上半场已结束,下半场却胜负未分,虽然算力上美国拥有优势,但在接下来的应用层面,中国企业大概率会迎头赶上。
此文完。