逐浪AIGC：科技竞争的焦点：泡沫消散后，国产大模型的未来在哪里？

发表时间: 2023-12-23 08:10

21世纪经济报道记者董静怡上海报道

人工智能的2023年属于大模型。

2022年11月，美国AI公司Open AI发布旗下基于大语言模型的AI聊天机器人程序ChatGPT，在发布后的短短两个月内，ChatGPT的月活用户突破 1 亿，成为史上用户增长速度最快的消费级应用程序。至此，科技行业掀起了大模型的热潮。

我国科技企业迅速跟进。工业和信息化部赛迪研究院数据显示，目前，我国已有超过19个语言大模型研发厂商，其中，15家厂商的模型产品已经通过备案，预计今年我国语言大模型市场规模将达到132.3亿元，增长率将达到110%。

大模型的革命性在于“涌现能力”。在计算量达到10的22次方之后，模型能力会完成从量变到质变的飞跃，呈现出惊人的爆发式增长。

这似乎也证明了一条路是正确的，即扩大模型规模，即可使其具有“智能”。在AI围棋打败人类棋手之时，Google Bert的参数规模为3亿；2020年后GPT-3横空出世，参数量级已经跨越到了1750亿；迭代到GPT-4，参数继续成倍增长，已达1.8万亿左右。

在业内看来，大模型具有强大的泛化性、通用性和实用性，能够降低AI开发门槛、提高模型精度和泛化能力、提高内容生成质量和效率等多种价值，实现了对传统AI技术的突破，并成为AGI的重要起点。

下半年以来，技术的颠覆性影响逐渐深入到产业界，重构传统的产业形态和产业模式。Gartner预测，到2026年，超过80%的企业将在生产中使用生成式人工智能API和模型，或在部署生成式人工智能应用。

而2024年或是AI大模型应用的浪潮年。近日，猎豹移动董事长兼CEO、猎户星空董事长傅盛在2023探索大会上表示，未来一定会出现很多像移动智能手机时代的滴滴、美团外卖等，在过去的时代中没有出现过的应用。

百模大战

这是继IT时代、移动互联网时代之后又一个充满机遇和可能性的新时代。从全球范围看，世界各地均在积极推动大模型研发和应用，其中美国和中国发布的通用大模型总数占全球发布量的80%。

紧跟ChatGPT的脚步，各大企业和机构纷纷加入大模型竞争中，包括百度、阿里巴巴、腾讯等互联网大厂，商汤科技、旷视科技等AI领域厂商，智谱华章、百川智能、达观数据等大模型初创企业，以及复旦大学、清华大学等高校机构。公开资料显示，截至今年10月份，国内已经发布了238个大模型。

在新的大模型竞争中，创业公司和大厂各有优势。大厂有多年的积累和大量的用户，得以获得海量用户数据和反馈，但一线创业公司通常拥有创新的技术和业务模式，同样存在快速技术迭代的可能。正如百川智能创始人、CEO王小川所说，“小创新靠大厂，大创新仍然要靠小厂”。

在《SuperCLUE中文大模型基准测评报告，2023》中，大厂和创业公司大模型的平均成绩差值约1分，几乎持平。

但国内外大模型的能力差距仍然存在。“我们与OpenAI的差距正在拉大，不是在缩小。”复旦大学计算机科学技术学院教授肖仰华表示。

在SuperCLUE测评中，GPT4-Turbo以总分89.79分遥遥领先，高于国内所有的大模型及国外的代表性大模型。国内得分最高的大模型是文心一言4.0，但距离GPT4-Turbo仍有15.77的分差。

“现在国内主流的大模型的能力水平基本上在GPT3.5上下。”非凡资本合伙人吴畏向21世纪经济报道记者表示，在他看来，其中差距在半年以上。

大模型的核心壁垒包括算力、数据、算法。度小满CTO许冬亮在2023金融街论坛年会上表示，只有极少的企业能够从头到尾地完成产业级研发。

算力是大模型训练的基石。如今，模型参数指数级增长，训练所需算力巨大，千亿级别的通用大模型，训练一次就需要付出几千万的成本。当前国内已发布的大模型中，参数规模达到千亿及以上的厂商仅为10个左右。

在美国最新一轮的封锁制裁下，国产化替代方案的需求更加迫切。但在很长一段时间内，芯片与算力仍会是国产大模型与ChatGPT之间一道巨大的鸿沟。

“优数据+强算法”则是大模型开发训练的两大关键点。大模型的输入数据通常存在重复、文本格式多样化、非文本内容多等噪声问题，这些问题可能会对大模型的训练和模型质量产生不良影响。此外，算法能力的持续优化和算法的可解释性也对厂商的技术能力和AI治理能力提出了更高的要求。

“国内每家公司都要做，这就会产生一个问题，每家都做自己的，但每家数据、算力也有限，也没有多少钱可以支持研发，并且又在做一些很基础的、重复性的事情。”复旦大学计算机学院教授、Moss系统负责人邱锡鹏在此前接受21世纪经济报道记者采访时表示。

大模型目前处于泡沫期，拥有技术力量的公司不想被时代的浪潮抛下，企图通过训练自己的大模型迎头赶上，所以有了百模大战、千模大战。当行业进入成熟期，只有少量企业能真正赋能行业，挤掉泡沫后才能沉淀出价值。

“以后大模型会逐渐呈现寡头的趋势，因为算力有限的情况下，以及大模型过于同质化，会使得算力资源以及数据资源未来会集中，有一些价值性不高的大模型也会逐渐被淘汰。”沙利文大中华区总监李庆向21世纪经济报道记者表示。

业内普遍认为，在通用大模型中，最后胜出的只会是少数的几家巨头。

“被淘汰的大模型企业也不会就此消失，他们可能会找到自己的机会，比如做多模态的大模型、或某些特定的行业的大模型等。”吴畏向记者表示。

下半年以来，市场对于大模型的热度较年初已有显著降温，在业内看来，这无非是市场对新技术“高估短期影响，低估长期潜力”的体现。从另一个角度来看，当新技术祛魅，落地过程中各类问题逐渐显现，对于大模型过度的期待也在趋于理性的过程中。

赋能与应用

时间来到2023年尾部，行业对于大模型落地应用的讨论颇多，关注重点从新技术带来的时代变革转移至几个月后的产业变化。IDC在2023年8月的《Gen AI ARC Survey》的调研报告中指出，在拥有5000名以上员工的企业中，80%的企业认为生成式AI将在未来18个月内颠覆他们的业务。

“大模型绝不应该只停留在炼金术阶段，我们要推动它变成科学的大模型，只有跟行业深度融合才有可能真正的实现可持续发展。”肖仰华表示。

首先是从通用大模型向垂直大模型的转型，有行业观点认为，大模型未来发展将趋于通用化与专用化并行。

今年6月，腾讯云首次正式公布行业大模型研发进展，并发布了面向 B 端客户的腾讯云MaaS服务解决方案。今年7月，华为发布“不作诗只做事”的盘古大模型3.0，深耕政务、金融、制造、煤矿、铁路、制药、气象等行业。此外，面向旅游的“携程问道”、面向医疗的百度“灵医”大模型、面向教育的网易“子曰”大模型等也集中在下半年陆续发布。

其中，金融行业的应用场景丰富，是最早进行数字化转型的机构，成为AI大模型落地应用的最佳场景之一。金融行业积淀了包括金融交易数据、客户信息在内的海量数据，良好的数据基础为AI大模型的落地应用提供条件。目前，生成和决策两类金融大模型，已在银行、证券等金融机构中实现落地。

“怎么将自己的业务和商业场景与AI的逻辑相匹配，以及如何寻求AI价值创新，而不单一是从效率上体现，可能是目前推进中需要考虑的问题。”李庆表示，“如果不能灵活使用大模型，或者不能完全适配自己的商业场景，可能在一定程度上很难完全实现降本增效的目的。”

而对于后来者来说，大模型的机会或在于应用。基于大模型技术的AI原生应用被看作会真正点燃行业的路径，吴畏向记者表示，从投资人角度，也更看好大模型应用的创业公司。

百度创始人、董事长兼CEO李彦宏近日在一场圆桌活动上表示，百模大战是对社会资源的浪费，更多资源应该放在超级应用。在11月的西丽湖论坛上，他也说过，“AI原生时代，我们需要100万量级的AI原生应用，但是不需要100个大模型。”在百度世界2023现场，百度率先甩出了十余款AI原生应用。

新技术的繁荣一定是应用的繁荣，如上传20张照片生成写真照的妙鸭相机，输入几个关键词就可生成高质量视频的Pika，这些火爆的创新产品为AI创业拉开一条新口子。业内普遍认为，原生应用能够撬动更大的商业价值，是人类进入AI时代的标识。

它们有基于原有的产品融合大模型的能力，也有重新搭载大模型的基于场景的应用。“目前我们看到很多应用都是选择了第二种。”李庆向记者表示。

他认为，监管层面可能会给予一定空间。“在大模型刚出来时，因为对于其理解以及未来的应用相对模糊，一开始采取从严的策略，之后随着应用的诞生，以及国内外的差异，监管层面或许会给予适当的灵活空间来支持行业的发展。”

不过遗憾的是，直到年末，国内依然没有一款持续火爆的AI应用出现，即便是红极一时的妙鸭相机，也在上线仅两个月后因多次付费、用户粘性不够等渐渐淡出大众视野。在吴畏看来，国内大模型应用的商业模式仍待探索，相比之下，海外市场拥有更大的机会，“海外类似的应用单月收入已突破百万美元。”

不过，此类问题并不可操之过急，大模型高昂的使用成本、自身存在的幻觉问题、市场的付费意愿不足等都是限制应用发展的原因，而这些问题的解决都在日新月异的变革中推进。

业内有观点认为，繁荣的AI原生应用生态需要大模型、智能算力、AI原生应用研发新范式三要素相辅相成，也有观点认为，AI原生应用的起点会在2024年。可以肯定的是，爆发还需时间，但AI应用的未来值得期待。

更多内容请下载21财经APP

逐浪AIGC：科技竞争的焦点：泡沫消散后，国产大模型的未来在哪里？

百模大战

赋能与应用

热门阅读

推荐阅读