揭秘AI高阶模型不开源的幕后原因

发表时间: 2024-06-19 14:25

编辑：编辑部

【新智元导读】深耕科技的早期投资机构蓝驰创投近期将AGI投资观迭代至2.0版本。一些比较亮眼的观点有：未来，软件公司或将消失，GenAI将催生出一大波一人十亿美金初创公司。而且，开源模型的优势也将慢慢褪去，模型应用需要两手抓，还有......

去年上半年，蓝驰创投推出《通向AGI之路》栏目，多篇连载推演了GenAI时代的可能样态，也提出了蓝驰的AI投资观——

AI+新的交互界面+Robotics的三浪叠加，将激荡出崭新的时代。

截至目前，蓝驰创投已经沿着这个思路进行了全面的布局：

过去一年中，蓝驰创投与最优秀的创业者共同描摹GenAI的形状，在前线亲历了最激烈的「炮火」，由此其AI投资观也在不断迭代、细化。

GenAI仍在加速进化中，战事尚未行至中场，蓝驰创投希望在此刻与创业者分享这些思考，激发更多讨论、加速进化。

01 开源优势不会更大：大模型不会被一统天下，既做模型又做应用有何不同

关于开源/闭源、做模型还是做应用，过去一段时间有许多讨论。蓝驰创投有以下判断：

首先，模型要用得起才有可行性，所以基于开源模型做小型化、垂直化是必然趋势。

但对于那些AGI制高点，比如逻辑推理能力、多模态和视频生成模型，未来闭源的趋势预计还将持续。即便开源，最关键的「How」——模型如何训练、关键参数的设置等，也不会被解密，后来者无法复刻。

长远来看，真正能实现AGI的通用模型会非常有限，但基于不同场景的行业模型会百花齐放。同时由于文化差异、地缘政治等原因，不同国家可能会有各自的大模型。

如果不及时投入，可能在竞争中会落下风。

来源：「Open-source LLMs vs closed-source LLMs: An enterprise perspective」

其次，大模型和很多人常用来类比的操作系统，其实在本质上是不同的。

操作系统本质上是一种技术，但对大模型来说，模型即应用，其迭代的过程中会积累数据。

因此，既做模型也做应用的打法是合乎逻辑的。

只有不断收集用户的反馈、积累模型的应用实践，创业者创业者才能深刻认知自己对模型的需求、以及如何迭代模型。

今天的模型数据驱动属性越来越强，如果只是向外部开放API，很难形成用户反馈闭环，远不如同步做kimi chat这样的应用更有效率。

最后，构建基础模型的路径是多样的。

就像同样是做云平台，亚马逊是先通过Amazon.com形成了一定的市场规模，在此过程中构造了AWS的能力，再对外输出；也有科技公司是直接打造云平台，把能力输出给客户。

第一种路径可能对中国市场更为有效，当公司有业务需求、数据反馈，会更懂基础设施应该怎么做。

02 此时宜迭代数据认知：关注数据处理和多模态数据

去年，蓝驰创投提出一边赚钱、一边赚数据、一边赚知识。

今年，打造数据飞轮已经成为市场的共识，蓝驰对于创业者的建议是，继续升级对数据的认知：更多关注数据处理和多模态数据。

数据方面值得关注的有三层重要问题：

1. 有没有拿到海量的公域数据/独特的私域数据？

2. 能不能找到帮助模型持续快速学习、高质量迭代的数据？

3. 能否对数据做妥善的加强，从而构建更高质量的数据结构？

最难的不是收集数据，而是对数据的处理。

对创业团队而言，能否筛选、处理出真正适配场景的高质量数据，是对技术、模型、以及场景理解的综合考验，这最终可能导致用于训练的数据有2-3个数量级的差别。

在更高的维度上，有三个问题值得创业者仔细思考：智能沿着数据生长、还是数据沿着智能生长？增量新数据和存量旧数据的特征分别是什么？新数据产生的场景怎么排序？

互联网时代，人类处理的都是二维空间的数据，但如果我们把世界看作一个模型，数据就不应该局限于文本范畴。

Sora和Gemini是基于什么数据？理想的自动驾驶、Apple Vision Pro、大疆又是基于什么数据？在空间的维度上看，这个世界的数字化程度可能不足5%，剩余95%的世界应该怎样、用多快的速度进行数字化？

蓝驰认为，在人工智能时代，对三维空间数据的获取和处理会是兵家必争之地，这些多模态的数据会催生新的超级应用，后者不一定还搭载在手机上，而会结合其他新的交互界面、具身智能这样的执行终端而产生。

这也是OpenAI投资Figure的原因之一。具身智能赛道中，蓝驰创投也在早期投资了智元机器人、银河机器人等项目。

基于过去沉淀的认知，蓝驰关注AGI的底层逻辑是：AI+3D交互+Robotics的三浪叠加，以Web3作为辅助。三浪实际上是三种技术的driver，对应着不同的空间和执行能力。

Apple Vision Pro带来的空间计算以及此前所说的元宇宙，抽象成第一性原理就是3D交互，新一代的交互界面，Robotics则是具身智能加上执行结构。

03 软件公司或将消失，一人十亿美金公司会批量出现

移动互联网时代，应用占整个市场的大头，算力和基础设施占比较小。

因为互联网的能力在于「连接」，需要通过应用来兑现价值：人与人的连接产生了社交应用，信息与信息的连接产生搜索应用。

但在GenAI时代，底层的占比要更高，因为它的能力是「生成」，创造的价值比互联网更大、更直接。

同时，GenAI时代的长尾可能更为肥沃，因为长尾上的每个小单元都可以自己创造价值。

比如To B市场，长久以来场景高度分化、数据分散各处，导致相当多个性化的需求得不到满足，但GenAI或许能够将这些细分的需求聚合在同一个入口。

大家在讨论的AI Agent、AI Native、Copilot，本质上都是AI-powerd的应用，这些应用会让每个人自主解决问题的能力会大幅提升。

蓝驰创投判断，当GenAI普遍地赋能个体，模式创新随之发生，会有越来越多一人十亿美金公司出现。

过去20年，囿于优质人才的供给不足，法律、医疗、教育这些高端服务行业成本在持续上升。

但GenAI让我们看到了「Do More with Less」的可能：当公司逐渐减少对人的依赖，创造价值的单位成本也会随之急剧降低，这将会催生新一代公司出现，即不再是赋能于垂直行业的软件公司，而是一家AI模型驱动的行业player。

比如，现在创业者想做一家服务于零售行业的SaaS公司，首先要雇人开发软件，再把产品卖给零售公司；但未来，产品开发的工作可能由代码生成工具完成，系统维护也可以交给AI，这样企业实际上雇佣了一群零售数字员工，这家企业本身就是一家零售公司，而不再是「赋能零售行业的软件公司」。

04 GenAI应用创业者的核心关注点

首先，选择data rich的场景，主要指有上下文、或者尚未被数字化的场景。

其次，要一边赚钱、一边赚数据、一边赚知识，形成数据飞轮。

对创业者来说第一关是形成PMF，但GenAI时代的PMF和之前不同。现阶段的产品定义要基于技术的约束条件，创业者无论是不理解技术、还是过度定义产品，都很容易被秒杀。

创业者要去思考：在相应技术分类中，是否适用/仍然适用Scaling Law？技术的上限会在哪里？有什么本质是不会随着技术的迭代而改变的？基于这些技术判断，创业者要决策一些关键问题：产品采用什么技术？是追技术的上限还是抓技术的下限？如何迭代？

来源：「Designing Generative AI Products That Users Will Love」

所以懂AI的产品经理在GenAI产品的PMF阶段就很宝贵，其所构造的反馈机制需要能让用户在使用过程中进一步形成数据，这是最终能形成护城河的关键所在。

这群人往往经历过几轮AI技术的迭代，在GenAI发展过程中经历、参与过模型的训练和对齐，并且尝试过基于AI能力从0到1构建产品。

三是要注意降低成本。

在模型上，创业者要知道不同模型的核心能力是什么，模型能力的差异化如何高效低成本地适配到合适的场景；同时，要借助PMF 形成的数据飞轮来提高收入。

要相信大模型的Scaling Law，也要相信大模型的cost down速度是非常快的。所以创业者要去思考，依照新摩尔定律，2-3年后公司的商业模型应该是怎样的？

To C和To B产品在不同阶段应该达成的milestone各有不同，蓝驰创投的思考如下：

toC的产品

「探索期」有细分场景、有细分功能，实现核心用户的留存和付费

「验证中」在原有场景、功能上叠加，用户群泛化，收入能覆盖模型调用的成本

「已验证」产品及场景收敛，用户的规模指数级增长，获客成本大幅降低

toB的产品

「探索期」有产品、有场景、少量试用客户，持续发散

「验证中」有产品、有场景、少量付费客户，尝试收敛、持续的客户成功

「已验证」产品及场景收敛，有商业化客户、有规模性收入（客户复购带来的upscale），有少量续费客户

05 要看清自己的优势，也要具备全球视野

虽然地缘政治会是一个不可避开的主旋律，但AI创业从一开始就需要有全球视野。

我们需要持续吸取全球认知，引入世界级人才和资源，并用不偏不倚、中立、务实的视角去观察世界各国——包括美国、中国的pros and cons，从中思考自身的机会和挑战，以及与这个局势的相处之道。

我们可以开放地去想：中国就算有再多的挑战，自身的比较优势是什么？美国就算有再多的领先优势，有没有阿喀琉斯之踵？

于是，我们在考虑下一阶段的AI应用时，还要考虑一个重要问题：未来市场向何处伸展。

不管是中国还是海外的创业者，要在世界局势中找到自己的站位、资本市场的出口。

蓝驰始终从全球视角来看中国比较优势，基于深耕中国多年打下的基础，希望为AI创业者创造成为全球顶级公司的机会。

06 模型小型化、垂直化与Scaling Law不矛盾，但想探索AGI有难度

蓝驰认为，Scaling Law所带来的模型能力提升还远没有看到尽头，仍能沿着它继续向前。

虽然有的人担心数据有限，但实际上仍有大量的数据没有被应用到模型训练中，比如私域数据，以及更重要的物理数据，这两类数据都会赋予模型更多可能。

一些学者、创业者尝试用更小的、端侧的模型去探索AGI。

这个路线和Scaling Law并不矛盾，它希望用更低成本、更快速度实现上升曲线更陡峭的智能提升。就像是我们发现一个炼丹炉已经能产出成果了，现在希望它更高效地运行起来。

不过，这条路线非常考验团队的能力，涉及到上面说的对数据的处理、选用，对超参数的设置等等。

未来这条路线的难度会逐渐加大，如上文所说，市场上关于高阶模型训练的公开信息会越来越少，再想复刻、调优是更难的。

与此同时，作为投资人，蓝驰会始终保持开放心态，对可能的路线保持关注。人类对AGI的探索尚处早期，并不是没有新路线出现的可能。

蓝驰创投「不鸣创业营2024」正在招募

如果你是位创业者/连续创业者，融过资、做过产品、甚至公司已经有了收入；或者你并没开始创业，仍在大厂中，用智慧创造覆盖全社会的To B/To B产品；或者你是在这些领域持续钻研的学术人才，希望用实验室中发现的技术改变世界；哪怕你是没有任何创业、工作经验，但痴迷技术，对技术如何落地有想法的年轻人。

https://mp.weixin.qq.com/s/TfGibKx18OMMjfQw4txB1g?scene=25#wechat_redirect

揭秘AI高阶模型不开源的幕后原因

热门阅读

推荐阅读