自从chatgpt横空出世后,中国乃至世界的创业神经又被狠狠撩拨了一下。记得年初的时候,逢人不提chatgpt,不提AI,似乎就落伍了。中国那帮copy to c的“创新”大佬们纷纷入局AI大模型,某团副总裁、某川智能,一时间挖煤的挖矿的摆摊的都开始了AI创业,百模大战让人想起了当年百团大战,有人把2023年称之为人工智能元年,这个说法不为过。
2023年快过去了,是时候总结一下今年这个所谓的人工智能元年了。
雷声大:AI浪潮来袭,大家都说新工业革命到来了
时间的齿轮转动到2022年末,2023年初,没有人会想到一场轰动全球的AI大幕会这么迅速的拉开。chatgpt3.5推出后,短短几天注册体验用户破百万,到了2023年1月末,人数竟然得到了恐怖的1亿人,成为史上增长最快的消费者应用。其逆天的聊天功能打破了传统固有的机器对话方式,使得所谓的机械性之外有了真人的味道,很多人嗅到了新技术革命的味道,各路大佬开始站台(抢麦)入局AI,开始逢人就谈大模型。
2023年3月,退休三年的美团创始人王慧文带资5千万美元,宣布要打造中版ChatGPT。
2023年3月,百度发布文心一言,百度称之为:知识增强大语言模型。
2023年4月,王小川成立百川智能。
后面还有哪些大佬或入局或为了关注度呢?
阿里有AI千问、腾讯混元大模型、京东推出了言犀大模型、科大讯飞发布星火认知大模型等等,除了这些之外,还有很多就不一一列举了,大家看看下面这种图就知道百模大战有多疯狂了。
提到雷声大,还不得不说一件事,就是国人爱干的一件事:刷榜单。
那么多打着大模型的大模型出现了,到底谁厉害呢,那就打榜吧,superclue弄了一个中文大模型榜单,这就给了大家同台竞技的机会,superclue支持多维度能力评测,不是都说自己厉害吗?来试试,结果这帮国内做题家试试就试试了。但是他们玩了一手,就是刷题。
每次看superclue榜单更新,都会发现榜一大哥经常变化,一旦拿到榜一大哥位置,立马做一件事就是宣传吊打chatgpt,尤其是chatgpt4.0,以SuperCLUE、CMMLU和C-Eval三个榜单为例,chatgpt几乎没有拿到榜一位置,很多时候排名接近第十名。
大模型跑分榜单之所以会呈现出“榜一大哥交替”的乱象,原因在于很多大模型通过刷题来应对榜单测试。大模型榜单测试有题库,你没看错,就是题库。各大大模型榜单的题库几乎对厂商是单向透明,也就是出现了所谓的“基准泄露”。例如C-Eval榜单在上线之初就有13948道题目,并且由于题库有限,就出现过直接让某些不知名大模型用刷题的方式“通关”的情况。
这就给国内大模型机会了,打肯定是打不过chatgpt,但是上榜能力绝对超过chatgpt。于是各种榜单榜一大哥不停被刷出来。
大家为什么热衷于刷榜呢,很大一个原因就是人工智能火爆的当下,宣传很重要,第一就是流量啊。至于是不是真的打得过chatgpt,那就不是需要关注的事情了。
不管刷榜原因是什么,从大家热衷于刷榜就可以看出大模型有多么火爆。
这么多大佬站台,这么多公司入局大模型,这么多人刷榜,人工智能一出场算是赚足了关注。
雨点小:忙了一年,动静越来越小,垃圾被逐渐清场
从年初到年尾,作为AI观察者和从业者,笔者算是经历了一个AI小周期。年初一堆人涌进来,又是带资又是要誓言打造中文大模型,到了年底,这些牛气冲天的人似乎有点销声匿迹了,很多大模型也不在宣传了,动静越来越小了。中文大模型除了百度似乎铁了心坚持下去,其他小垃圾逐渐被清理出场。
百度做大模型决心和动作还是很大的,文心开始逐步嵌入到百度应用,举个例子。
图片智能应用
如下图,百度AI图片助手提供了去水印等功能,笔者测试了一下,效果还不错。
目前除了一些带有版权的图片不能修改外,其他图片都可以免费使用百度图片助手修改,非常方便。
再看看operai,推出了chatgpt 4.0之外,弄了一个类似于苹果appstore的gpts,然后就是一波宫斗,总管国内外大模型目前都存在一个问题,雨点小,落地应用场景匮乏,大多集中在:
聊天解闷、写文案(广告生成)、作图、客服(应用较多)、视频生成(比较热的郭德纲说英语)等。
这些领域基本上还是属于chat领域,就是交流沟通,虽然大模型数据越来越丰富,应用越来越多,但是仔细理一理依然还是在说文写字领域多一些,这就使得其应用场景较窄。你问一个科技圈的人都知道chatgpt,知道大模型,你问一个普通人他就完全不知道了。不像支付宝大人小孩都知道。
很多人也逐渐认识到这个问题,开始从产业应用角度审视大模型未来。
未来可期:技术落地,AI未来可期
很多人提及工业革命威力都会讲一个例子,就是马车和汽车的竞争。汽车想对于马车是跨时代的,是革命性的应用,但是汽车的发动机技术单独和马车竞争肯定是不行的。发动机技术落地构建了汽车应用,才打败了马车。对于人工智能也是一样,必须落地到应用场景,形成产业产品,才能在新老竞争中脱颖而出。未来,AI落地应用才是AI良性发展的支撑。下面举一个例子说明一下:
笔者最近接触了一家上海人工智能公司BodyAPT,做AI服装定制生成,通过他们的技术,可以做到用手机扫描人体正面、侧面,只需要两张人体扫描照片就可以根据他们AI算法测算出人体净体数据,而且精准度极高。笔者体验了一下,肩宽数据BodyAPT测量的是46厘米,人工测量也是46.其他胸围、腰围数据误差几乎没有。不仅如此,他们利用采集到的数据可以直接出版,出版意思是服装定制一个术语,把人体数据设计成版型,服装工厂就可以根据版型做衣服。
BodyAPT直接出数字版芯,直接传递到工厂,整个过程全部智能化,无需人工干预。从量体到制版,只需几秒钟。定制一件衬衫,从量体到工厂生产出来只需2小时。BodyAPT这种AI应用打破了之前AI只能应用在说学逗唱的阶段,已经应用到产业实际流程中,对传统服装定制流程进行了智能化改造。真正利用AI技术颠覆了行业。
最近接触了一些人工智能顶级科学家,和他们聊AI,发现他们已经不再纯粹谈技术,而是将眼光投向落地应用,在他们眼里,大模型本身技术比拼不再是重点,应用才是根本。这点和笔者想的一样,在好的发动机技术,不做成汽车,也不可能竞争过马车。
这些顶级人工智能科学家还提到一点就是数据,AI本身是算法集合,但是这些算法模型优化需要实际应用数据去喂,从而根据实际数据不停调整,对齐,优化。以BodyAPT,技术开发出来后,不停进行市场验证,各种人体体型体态数据对BodyAPT模型进行优化,经过实际数据调整,才使得现在BodyAPT测量出来的人体数据精准度极高。
从BodyAPT可以看出,AI大模型+具体行业应用将是未来人工智能良性发展之路。可以遇见的是,未来像BodyAPT这种行业AI应用会越来越多,真正走出目前“说学逗唱”应用瓶颈。
AI未来可期,这是毋庸置疑的,能否像过去20年互联网技术对人类社会改造那样,就要看未来AI在行业实际应用如何了,让我们拭目以待。