揭秘AI高阶模型不开源的幕后原因

发表时间: 2024-06-19 14:25

编辑:编辑部

【新智元导读】深耕科技的早期投资机构蓝驰创投近期将AGI投资观迭代至2.0版本。一些比较亮眼的观点有:未来,软件公司或将消失,GenAI将催生出一大波一人十亿美金初创公司。而且,开源模型的优势也将慢慢褪去,模型应用需要两手抓,还有......


去年上半年,蓝驰创投推出《通向AGI之路》栏目,多篇连载推演了GenAI时代的可能样态,也提出了蓝驰的AI投资观——

AI+新的交互界面+Robotics的三浪叠加,将激荡出崭新的时代。

截至目前,蓝驰创投已经沿着这个思路进行了全面的布局:

过去一年中,蓝驰创投与最优秀的创业者共同描摹GenAI的形状,在前线亲历了最激烈的「炮火」,由此其AI投资观也在不断迭代、细化。

GenAI仍在加速进化中,战事尚未行至中场,蓝驰创投希望在此刻与创业者分享这些思考,激发更多讨论、加速进化。

01 开源优势不会更大:大模型不会被一统天下,既做模型又做应用有何不同


关于开源/闭源、做模型还是做应用,过去一段时间有许多讨论。蓝驰创投有以下判断:

首先,模型要用得起才有可行性,所以基于开源模型做小型化、垂直化是必然趋势。

但对于那些AGI制高点,比如逻辑推理能力、多模态和视频生成模型,未来闭源的趋势预计还将持续。即便开源,最关键的「How」——模型如何训练、关键参数的设置等,也不会被解密,后来者无法复刻。

长远来看,真正能实现AGI的通用模型会非常有限,但基于不同场景的行业模型会百花齐放。同时由于文化差异、地缘政治等原因,不同国家可能会有各自的大模型。

如果不及时投入,可能在竞争中会落下风。

来源:「Open-source LLMs vs closed-source LLMs: An enterprise perspective」

其次,大模型和很多人常用来类比的操作系统,其实在本质上是不同的。

操作系统本质上是一种技术,但对大模型来说,模型即应用,其迭代的过程中会积累数据。

因此,既做模型也做应用的打法是合乎逻辑的。

只有不断收集用户的反馈、积累模型的应用实践,创业者创业者才能深刻认知自己对模型的需求、以及如何迭代模型。

今天的模型数据驱动属性越来越强,如果只是向外部开放API,很难形成用户反馈闭环,远不如同步做kimi chat这样的应用更有效率。

最后,构建基础模型的路径是多样的。

就像同样是做云平台,亚马逊是先通过Amazon.com形成了一定的市场规模,在此过程中构造了AWS的能力,再对外输出;也有科技公司是直接打造云平台,把能力输出给客户。

第一种路径可能对中国市场更为有效,当公司有业务需求、数据反馈,会更懂基础设施应该怎么做。

02 此时宜迭代数据认知:关注数据处理和多模态数据


去年,蓝驰创投提出一边赚钱、一边赚数据、一边赚知识。

今年,打造数据飞轮已经成为市场的共识,蓝驰对于创业者的建议是,继续升级对数据的认知:更多关注数据处理和多模态数据。

数据方面值得关注的有三层重要问题:

1. 有没有拿到海量的公域数据/独特的私域数据?

2. 能不能找到帮助模型持续快速学习、高质量迭代的数据?

3. 能否对数据做妥善的加强,从而构建更高质量的数据结构?

最难的不是收集数据,而是对数据的处理。

对创业团队而言,能否筛选、处理出真正适配场景的高质量数据,是对技术、模型、以及场景理解的综合考验,这最终可能导致用于训练的数据有2-3个数量级的差别。

在更高的维度上,有三个问题值得创业者仔细思考:智能沿着数据生长、还是数据沿着智能生长?增量新数据和存量旧数据的特征分别是什么?新数据产生的场景怎么排序?

互联网时代,人类处理的都是二维空间的数据,但如果我们把世界看作一个模型,数据就不应该局限于文本范畴。

Sora和Gemini是基于什么数据?理想的自动驾驶、Apple Vision Pro、大疆又是基于什么数据?在空间的维度上看,这个世界的数字化程度可能不足5%,剩余95%的世界应该怎样、用多快的速度进行数字化?

蓝驰认为,在人工智能时代,对三维空间数据的获取和处理会是兵家必争之地,这些多模态的数据会催生新的超级应用,后者不一定还搭载在手机上,而会结合其他新的交互界面、具身智能这样的执行终端而产生。

这也是OpenAI投资Figure的原因之一。具身智能赛道中,蓝驰创投也在早期投资了智元机器人、银河机器人等项目。

基于过去沉淀的认知,蓝驰关注AGI的底层逻辑是:AI+3D交互+Robotics的三浪叠加,以Web3作为辅助。三浪实际上是三种技术的driver,对应着不同的空间和执行能力。

Apple Vision Pro带来的空间计算以及此前所说的元宇宙,抽象成第一性原理就是3D交互,新一代的交互界面,Robotics则是具身智能加上执行结构。

03 软件公司或将消失,一人十亿美金公司会批量出现


移动互联网时代,应用占整个市场的大头,算力和基础设施占比较小。

因为互联网的能力在于「连接」,需要通过应用来兑现价值:人与人的连接产生了社交应用,信息与信息的连接产生搜索应用。

但在GenAI时代,底层的占比要更高,因为它的能力是「生成」,创造的价值比互联网更大、更直接。

同时,GenAI时代的长尾可能更为肥沃,因为长尾上的每个小单元都可以自己创造价值。

比如To B市场,长久以来场景高度分化、数据分散各处,导致相当多个性化的需求得不到满足,但GenAI或许能够将这些细分的需求聚合在同一个入口。

大家在讨论的AI Agent、AI Native、Copilot,本质上都是AI-powerd的应用,这些应用会让每个人自主解决问题的能力会大幅提升。

蓝驰创投判断,当GenAI普遍地赋能个体,模式创新随之发生,会有越来越多一人十亿美金公司出现。

过去20年,囿于优质人才的供给不足,法律、医疗、教育这些高端服务行业成本在持续上升。

但GenAI让我们看到了「Do More with Less」的可能:当公司逐渐减少对人的依赖,创造价值的单位成本也会随之急剧降低,这将会催生新一代公司出现,即不再是赋能于垂直行业的软件公司,而是一家AI模型驱动的行业player。

比如,现在创业者想做一家服务于零售行业的SaaS公司,首先要雇人开发软件,再把产品卖给零售公司;但未来,产品开发的工作可能由代码生成工具完成,系统维护也可以交给AI,这样企业实际上雇佣了一群零售数字员工,这家企业本身就是一家零售公司,而不再是「赋能零售行业的软件公司」。

04 GenAI应用创业者的核心关注点


首先,选择data rich的场景,主要指有上下文、或者尚未被数字化的场景。

其次,要一边赚钱、一边赚数据、一边赚知识,形成数据飞轮。

对创业者来说第一关是形成PMF,但GenAI时代的PMF和之前不同。现阶段的产品定义要基于技术的约束条件,创业者无论是不理解技术、还是过度定义产品,都很容易被秒杀。

创业者要去思考:在相应技术分类中,是否适用/仍然适用Scaling Law?技术的上限会在哪里?有什么本质是不会随着技术的迭代而改变的?基于这些技术判断,创业者要决策一些关键问题:产品采用什么技术?是追技术的上限还是抓技术的下限?如何迭代?

来源:「Designing Generative AI Products That Users Will Love」

所以懂AI的产品经理在GenAI产品的PMF阶段就很宝贵,其所构造的反馈机制需要能让用户在使用过程中进一步形成数据,这是最终能形成护城河的关键所在。

这群人往往经历过几轮AI技术的迭代,在GenAI发展过程中经历、参与过模型的训练和对齐,并且尝试过基于AI能力从0到1构建产品。

三是要注意降低成本。

在模型上,创业者要知道不同模型的核心能力是什么,模型能力的差异化如何高效低成本地适配到合适的场景;同时,要借助PMF 形成的数据飞轮来提高收入

要相信大模型的Scaling Law,也要相信大模型的cost down速度是非常快的。所以创业者要去思考,依照新摩尔定律,2-3年后公司的商业模型应该是怎样的?

To C和To B产品在不同阶段应该达成的milestone各有不同,蓝驰创投的思考如下:

toC的产品

「探索期」有细分场景、有细分功能,实现核心用户的留存和付费

「验证中」在原有场景、功能上叠加,用户群泛化,收入能覆盖模型调用的成本

「已验证」产品及场景收敛,用户的规模指数级增长,获客成本大幅降低

toB的产品

「探索期」有产品、有场景、少量试用客户,持续发散

「验证中」有产品、有场景、少量付费客户,尝试收敛、持续的客户成功

「已验证」产品及场景收敛,有商业化客户、有规模性收入(客户复购带来的upscale),有少量续费客户

05 要看清自己的优势,也要具备全球视野


虽然地缘政治会是一个不可避开的主旋律,但AI创业从一开始就需要有全球视野。

我们需要持续吸取全球认知,引入世界级人才和资源,并用不偏不倚、中立、务实的视角去观察世界各国——包括美国、中国的pros and cons,从中思考自身的机会和挑战,以及与这个局势的相处之道。

我们可以开放地去想:中国就算有再多的挑战,自身的比较优势是什么?美国就算有再多的领先优势,有没有阿喀琉斯之踵?

于是,我们在考虑下一阶段的AI应用时,还要考虑一个重要问题:未来市场向何处伸展。

不管是中国还是海外的创业者,要在世界局势中找到自己的站位、资本市场的出口。

蓝驰始终从全球视角来看中国比较优势,基于深耕中国多年打下的基础,希望为AI创业者创造成为全球顶级公司的机会。

06 模型小型化、垂直化与Scaling Law不矛盾,但想探索AGI有难度


蓝驰认为,Scaling Law所带来的模型能力提升还远没有看到尽头,仍能沿着它继续向前。

虽然有的人担心数据有限,但实际上仍有大量的数据没有被应用到模型训练中,比如私域数据,以及更重要的物理数据,这两类数据都会赋予模型更多可能。

一些学者、创业者尝试用更小的、端侧的模型去探索AGI。

这个路线和Scaling Law并不矛盾,它希望用更低成本、更快速度实现上升曲线更陡峭的智能提升。就像是我们发现一个炼丹炉已经能产出成果了,现在希望它更高效地运行起来。

不过,这条路线非常考验团队的能力,涉及到上面说的对数据的处理、选用,对超参数的设置等等。

未来这条路线的难度会逐渐加大,如上文所说,市场上关于高阶模型训练的公开信息会越来越少,再想复刻、调优是更难的。

与此同时,作为投资人,蓝驰会始终保持开放心态,对可能的路线保持关注。人类对AGI的探索尚处早期,并不是没有新路线出现的可能。

蓝驰创投「不鸣创业营2024」正在招募


如果你是位创业者/连续创业者,融过资、做过产品、甚至公司已经有了收入;或者你并没开始创业,仍在大厂中,用智慧创造覆盖全社会的To B/To B产品;或者你是在这些领域持续钻研的学术人才,希望用实验室中发现的技术改变世界;哪怕你是没有任何创业、工作经验,但痴迷技术,对技术如何落地有想法的年轻人。

https://mp.weixin.qq.com/s/TfGibKx18OMMjfQw4txB1g?scene=25#wechat_redirect