2025年AI产业发展大解析:未来趋势展望

发表时间: 2024-12-29 11:17

趋势1:self-play RL范式开启,大模型技术 军备赛进入复杂推理阶段

人工智能的发展从分析式AI进入生成式AI时代

OpenAI GPT系列 大模型以42.9%的使用率位居 首位,同为海外的Meta LLaMa系列大模型以27.1%的 比例位居第三位。中国的大 模型企业,阿里通义大模型 以37.8%的使用率位居第二。

总体上而言,AI开发者在模 型层的选型仍然处于变动的 状态,且尚未形成相对比较 明确的竞争格局。而OpenAI 发布o1(草莓)模型,则再 次定义大语言模型的技术方 向与竞争焦点。

与以往的模型相比,OpenAI o1 聚焦于优化推理过程,在复杂的科学、编程和数学等任 务中的表现显著提升。它能够像人类一样进行深入思考、逐步推导,这对于解决需要深 度逻辑推理的问题具有重大意义,突破了对大型语言模型能力的传统认知,为人工智能 在复杂任务处理上开辟了新的道路。

由此而开启Post-train阶段的Self-play RL(自对弈强化学习)范式对于后续大模型技 术路线的升级和优化具有指引性的意义,传统预训练依赖全网语料,数据有噪声且质量不一,RLHF 后训练受人类标注数据限制。纯强化学习(RL)方法无需人类标注数据, 能让模型自我探索学习,激发创新和探索能力,利于突破未知领域。

尽管Self-play 方法已经开始在一定范围内得到应用,但是,也 仍然存在挑战需要进一步研究和解决,包括收敛性问题、环境非平稳性问题、可扩展性 与训练效率等问题。另外,强化学习注重设计良好的“奖励模型”,但是除了数学、代 码等理科领域,强化学习在其他领域仍然难以泛化。

在OpenAI发布O1推理模型之后,国内大模型厂商也紧随其后,纷纷推出了自己的推理模 型。这些模型在数学、代码、推理谜题等多种复杂推理任务上取得了显著进步。

在复杂推理阶段,大模型需要具备更高层次的逻辑推理、因果推断和问题 解决能力,进而可以扩展大模型在更多领域发挥重要作用,复杂推理的重要性凸显。这 进一步提升了当下大模型技术能力的评价标准与竞争壁垒。

趋势2:多模态模型能力持续升级,朝向多 模态理解和生成的统一发展

当前自然语言、音频、视频等多个模态的理解与生成能力均提升显著

多模态模型的进展

(1)新模型不断涌现

例如智源人工智能研究院 Emu3,是全球首个原生多模态世界模型,通过自回归技术结合图像、文本和视频三种模态,在图 像生成、视觉语言理解和生成方面表现出色。

(2)训练方法优化

例如新的联合训练策略,即在训练过程中先固定大语言模型的权重参数,对图像编码器和桥接组件进行初步训练,然后再对整个模型进行整体训练,这种 分阶段的训练方式有助于提高模型的性能和效率。

(3)跨模态交互能力增强

能够更好地理解和关联不同模态之间的信息,实现更精准的跨模态交互和转换,例如,可以根据文本描述生成高质量的图像或视频,也可以理解图像或视频内容并生成相关的 文本描述,并且在语义一致性方面有了很大提升。

(4)性能提升

计算效率提高,多模态模型计算速度加快、响应时间缩短,可快速处理分析数据满足实 时需求。同时,模型结构与训练方法优化使精度提升,在图像、语音、自然语言处理等 任务准确率和召回率显著提高。

多模态模型的统一有助于使其更接近人类的认知模式,从而更好地理解和处理复杂的自 然场景,增强人机交互体验,拓展更广泛的应用领域。相应地,多模态理解和生成的统 一是当下多模态模型能力提升的重要发展方向。

多模态整体上需要在如下方向进一步研究与提升

(1)技术发展

增强跨模态理解能力不同模态的数据(如文本、图像、音频、视频等)具有各自独特的特征和表达方式, 统一发展能更好地建立起不同模态之间的关联和映射,让模型更准确、深入地理解各 模态信息的内在联系和语义一致性。

提高模型的泛化能力:单一模态的模型往往只能处理特定类型的数据,在面对复杂多变的实际场景时可能表 现不佳。而多模态模型的统一发展可以整合多种模态的信息,使模型能够从多个角度 对事物进行理解和分析,从而提高模型的泛化能力,适应不同的应用场景和数据变化。

(2)数据管理

促进数据融合和共享:多模态模型的统一发展需要对不同模态的数据进行融合和处理,这将推动数据的标准化和规范化,促进不同来源、不同格式的数据之间的融合和共享。

缓解数据稀缺问题:某些模态的数据可能比较稀缺或难以获取,而多模态模型的统一发展可以通过利用其他模态的数据来弥补某一模态数据的不足

(3)应用落地

拓展应用场景:统一的多模态模型可以打破不同模态之间的界限,为各种创新应用场景的开发提供了 可能。例如,在文化娱乐领域,可以打造出具有多模态交互功能的虚拟现实(VR)或 增强现实(AR)游戏,让玩家沉浸在更加丰富的虚拟世界中等。

降低应用成本:对于企业和开发者来说,使用统一的多模态模型可以减少对不同单一模态模型的开发和维护成本。

提高应用效率和质量:多模态模型的统一发展使得不同模态的数据能够在一个模型中进行协同处理,减少了 数据在不同模型之间的转换和传输时间,提高了应用的效率。同时,统一模型能够更 好地整合多模态信息,做出更准确、更全面的决策和判断,从而提高应用的质量和可 靠性


趋势3:Agent向超级智能体进化,具备更 强的学习和推理能力,处理更复杂的任务

Agent 正凭借一系列关键技术进展,如深度学习、强化学习、自然语言处理技术的突破 以及多模态融合等方面的发展,逐步向具备更强学习和推理能力、能处理更复杂任务的 超级智能体进化

Agent能更精准理解场景需求, 高效处理复杂任务,提升整体工作效率,适应多元环境变化,保障应用的稳定性与持续 性。

Agent 进化为超级智能体也将进一步促进多智能体应用的发展,包括提升任 务处理与协同能力,快速处理复杂任务并优化多智能体协同;可能推动多智能体系统的 架构向更加智能化、灵活化的方向发展,并对多智能体系统进行集中管理和监控,及时 发现和解决系统中的问题,提高系统的稳定性和可靠性等。

风险和挑战:

将 LLM(大语言模型)和 RPA(机器人流程自动化)相结合是现阶段 Agent 落地的一 种有效手段,可以充分发挥技术协同优势,增强数据处理与理解能力,将智能决策与任 务执行有机融合;也有助于通过RPA明确的流程规则,确保价值对齐和透明性提升,以 及责任界定的辅助;通过RPA系统本身具有的稳定性和可靠性,在一定程度上提升Agent 应用的安全保障能力等。如下三种方式并行,也是企业考虑利用Agent和数字员工提升 劳动生产力的可行之道。

中国AGENT应用图谱

AGI道阻且长,技术能力持 续提升,加速产业落地

AGI 需具备类似人类的通用认知能力,涵盖学习推理、语言理解与交互、复杂规划与决 策等多方面能力。这就意味着朝向AGI进化的基础技术,无论是模型架的创新,还是模 型自主决策能力的训练与提升,都需要长周期的摸索与研究。

同时,AGI的发展也面临诸多挑战,这包括:

(1)计算资源限制

AGI 基础技术研发对算力要求极高,从模型架构创新角度,新架构探索需大量计算资源 进行实验和验证;模型自主决策能力训练也需海量数据及复杂计算来优化模型参数,以 实现精准决策 。然而,当前硬件技术发展还无法完全满足需求,硬件性能提升速度跟 不上模型规模和复杂度增长,限制了研究进度,导致研究周期延长。

(2)数据获取与质量难题

高质量数据是基础技术发展的关键,模型架构创新需大量不同类型数据来训练和优化, 以学习各种模式和规律;自主决策能力训练更需丰富的标注数据及反馈信息,以引导模 型做出正确决策。但实际中,数据存在获取困难、标注成本高、数据质量参差不齐等问 题,获取和整理数据需耗费大量时间和精力,延缓了研究步伐。

(3)伦理和安全性考量

AGI 的发展引发了诸多伦理和安全问题,如模型决策的公正性、透明度、可解释性,以 及对社会就业结构的冲击等. 这要求在基础技术研究中,同步考虑如何使技术符合人类 的伦理道德和社会价值观,确保其安全可靠、可控可管,而解决这些问题需要在技术研 发过程中不断权衡和探索,进一步拉长了研究周期 。

朝向AGI的目标遇到上述诸多挑战而停止,在这个过程中,AI基础能力持续提升,进一 步加速了产业落地与产品应用的探索。人工智能产业的长远发展,终须基础研究与产品 实践相结合,实现螺旋式攀升。从2024年开端,向2025年延续,人工智能的发展,将由 模型开发与竞赛,转向产品为先与场景打磨的新阶段

此前无论是模型训练方式的转变、还是多模态能力的升级,以及Agent智能化水平的提 升,也都为人工智能的应用落地提供了有力的技术支撑。其他并未单独提及的关键变化 如下:

(4)推理成本显著下降,降低应用场景实践门槛

一方面,硬件技术的进步功不可没。新型芯片架构的研发与优化例如专门针对人工智 能推理任务设计的芯片,大幅提升了计算效率。这些芯片在能耗管理和运算速度上取得 了良好平衡,使得单位推理运算的能耗成本和时间成本均有效降低

另一方面,算法优化也起到关键作用。研究人员不断改进推理算法,减少不必要的计算 步骤和数据传输,通过模型压缩技术,在不显著影响模型精度的前提下,降低模型的存 储和计算需求,从而在大规模推理应用场景中极大地节省了成本。

云服务提供商之间的竞争加剧,为吸引更多人工智能企业用户,他们不断优化基 础设施并降低服务价格,使得企业在使用推理服务时的费用大幅减少,共同推动了 2024 年推理成本的显著下降

(5)大模型竞争格局存在变化空间,模型层竞争收拢

OpenAI o1模型改进了推理密集型基准测试的表现,在复杂的数据和科学任务上表现出色,仍然占据模型侧的领先优势,但是仍然面临o1模型使用成本高昂的问题。

与此同时,开源模型与闭源模型之间的差距正在缩小。如Meta发布LlaMa3.1和LlaMa3.2 模型,前者在推理、数学和上下文任务上与GPT-4o和Claude 3.5 Sonnet等模型能力不 相上下而后者的多模态能力在图像识别和视觉理解任务上与领先的闭源模型具有竞争 力,其轻量级模型在移动设备和边缘计算上的表现也令人印象深刻。

聚焦到中国人工智能市场,中国的大语言模型距离国际领先模型仍然存在差距,但是也 也在部分子任务上实现了SOTA。以智源研究院发布的部分FlagEval「百模」评测结果为 例,字节跳动阿里巴巴以及腾讯等,均在部分方向上表现出色。

(6)压缩与蒸馏模型便于模型部署和提升推理效率,加快模型在新领域的落地应用

通过优化算法和训练方法,实现了在保持高性能的同时减少模型大小。如面壁智能发布 了端侧多模态模型MiniCPM-Llama3-V 2.5,参数规模仅8B,但在多模态能力上超越了 GPT-4V和Gemini Pro,特别是在OCR能力和多语种支持方面表现出色而数据集蒸馏技 术、多模态数据蒸馏等技术在2024年的进步,如腾讯的多模态AI实验室研究了基于蒸馏 的多模态数据集生成方法;华为诺亚方舟实验室多模态蒸馏研究项目等,也进一步推动 了小型模型的应用场景拓展与商业化

(7)合成数据广泛应用

合成数据技术通过算法、统计模型或生成式AI技术生成,旨在模拟真实世界的数据分布 和特征。随着生成式AI技术的进步,GAN(生成对抗网络)、VAE(变分自编码器)等 技术的发展,合成数据的生成质量和效率不断提升。相应地,合成数据的应用领域不断 拓展,从最初的自动驾驶、医疗影像分析等领域逐渐渗透到金融、教育、零售等多个行 业。


趋势4:AI原生应用形成服务闭环,聚焦专 业用户提升效率是中短期重要方向

AI原生应用可能发生的重构

与现存应用最明显的差异在于,AI原生应用需要对最终结果负责,服务或者 说结果的达成过程由AI原生应用自行消化,用户对于AI原生应用的满意度和评价,均 来自于其提供结果的完成度和满意度。例如,用户评价不同的AI生图应用,评价的核 心出发点就在于其生图的质量是否达到用户的预期,对于应用开发者来说,生图的步 骤和产品设计,除了提升用户的生图体验之外,更重要的是通过产品“雕花”,实现 对于用户预期和质量控制的管理。至于产品运营过程,即便面临与以往应用的较大差 异,也是开发者自行消化,如下图所示:

当前AI原生应用发展现状:聚焦专业用户提升效率是中短期重要方向

当前AI原生应用主要覆盖如下用户群体和功能类型,超级个体涌现的背景之下,在传 统意义上对用户进行B和C划分之外,专业人士(即Prosumer)这类用户群体的重要性 愈发突出,包括程序员、设计师、律师等各种专业人士,其效率提升的需求与当前AI 应用的价值匹配度相对比较高,具备付费意愿与付费能力,且采购决策考量和周期相 对可控,是AI原生应用追求用户留存和商业化并重阶段需要重点关注的用户群体


趋势5:成熟应用加速拥抱AI,利用LLM能 力提升自身应用服务体验和产品竞争力, 不加AI就淘汰

拥抱AI在当下是必选项,不是可选项,成熟应用通常都是从如下视角和价值的角度考 虑,需要增强AI能力:

基于上述考量,成熟应用结合自身用户工作流以及市场分发和渠道优势,占据用户界 面,在这一波浪潮中,并未放松和懈怠,普遍呈现出加速AI整合的态势,主要包括如 下类型和状态:

1. 将AI与LLM能力作为内部提效工具

(1)核心特征

• 主要在企业内部使用,旨在提升内部运营和工作效率

• 应用场景相对局限,可能用于自动化数据处理、内部文档管理、简单的任务 分配等

• 对现有业务流程的影响较小,是一种渐进式的改进

(2)对于AI技术能力的要求

• 准确性和稳定性:确保在处理内部任务时能够准确无误地执行,避免错误对 内部工作造成干扰

• 可定制性:能够根据企业内部的特定需求进行定制和调整,以适应不同的工 作流程和数据格式

• 高效性:快速处理内部任务,提高工作效率,减少人工干预的时间成本

(3)可能面临的挑战

• 技术选型难题:需要从众多的 AI 和 LLM 工具中选择适合企业内部需求的,

可能面临功能不匹配、兼容性问题等

• 员工适应问题:员工需要学习新的工具和工作方式,可能存在抵触情绪或学 习成本高的情况

• 数据安全风险:引入外部技术可能带来数据泄露的风险,需要加强数据安全 管理

(4)典型案例

基本上大部分科技企业都有所涉及,尤其是在软件工程和应用开发方向上,同时,大量行业企业,即AI技术的买单方当前也看重这一价值,试水颇多。

2.AI能力融入现有产品体系

随着对AI技术的深入理解和应用,企业开始将AI能力集成到其现有的产品和服务中。 这个阶段的关键是找到AI技术与现有业务的结合点,创造价值增量。

(1)核心特征

• 将 AI 技术逐步整合到现有的产品和服务中,以增强产品的功能和竞争力

• 可能会对产品进行一定程度的升级和改进,为用户带来新的体验

• 仍然以现有产品为核心,AI 作为辅助功能

(2)对于AI技术能力的要求

• 兼容性:与现有产品体系无缝融合,不影响产品的整体性能和稳定性

• 实用性:提供切实有用的功能,满足用户在使用现有产品过程中的实际需求

• 可扩展性:随着产品的发展和用户需求的变化,能够方便地扩展和升级 AI 功能

(3)可能面临的挑战

• 用户体验平衡:在增加 AI 功能时,要确保不破坏原有的用户体验,同时让

新功能易于被用户接受和使用

• 用户增量价值空间:AI功能的增加是否能够在提升用户体验的 同时,也带 来用户价值的提升,从而达成增量商业化

• 成本控制压力:开发和维护融合 AI 能力的产品体系可能需要较高的成本, 包括技术研发、数据处理等方面

(4)典型案例

金山WPS、百度文库用友、金蝶、福昕软件等等,即大量已经深度集成在用户 界面与工作流的应用企业,将AI能力作为提升自身产品体验与功能的发展方向, 部分企业开始尝试针对其AI能力升级提升收费客单价

3.推出以AI为主体的产品与解决方案

在这个阶段,AI技术成为企业产品和解决方案的核心。企业开始推出全新的以AI为主 体的产品和服务。这标志着AI技术从辅助角色转变为驱动企业创新和增长的主要动力。

3.1核心特征

• 以 AI 技术为核心,开发全新的产品和解决方案

• 产品的价值主要来源于 AI 技术带来的创新和优势

• 可能会开拓新的市场领域,满足特定的用户需求

3.2对于AI技术能力的要求

• 创新性:具备独特的技术优势和创新点,能够在市场上脱颖而出

• 高性能:提供强大的计算能力和高效的算法,以满足复杂的应用场景需求

• 可靠性:确保产品在各种环境下都能稳定运行,为用户提供可靠的服务

3.3可能面临的挑战

• 市场竞争激烈:AI 领域竞争激烈,新推出的产品需要有独特的价值主张和

竞争优势才能脱颖而出

• 技术持续创新需求:AI 技术发展迅速,产品需要不断进行技术升级和创新, 以保持竞争力

• 数据质量和数量要求高:以 AI 为主体的产品通常对数据的质量和数量要求 很高,获取和管理高质量数据可能面临挑战

3.4典型案例

4.All in AI,将LLM作为公司战略发展抓手

在这个最终阶段,AI技术与LLM成为企业战略发展的核心。企业将全面拥抱AI技术, 在组织结构、业务模式、市场策略等方面进行深度整合和转型,从而实现智能化升级 与蜕变。

4.1核心特征

• 公司将 AI 作为核心战略,全面投入资源进行研发和推广

• 以 LLM 为重点,构建完整的 AI 生态系统,涵盖多个领域和应用场景

• 可能会进行重大的业务转型和组织架构调整,以适应 AI 战略的实施

4.2对于AI技术能力的要求

• 领先性:在 AI 技术领域保持领先地位,不断进行技术创新和突破

• 生态构建能力:能够整合各种资源,构建开放、合作的 AI 生态系统,促进 产业的发展

• 战略眼光:具备长远的战略眼光,能够准确把握市场趋势和用户需求,制定 合理的发展战略

4.3可能面临的挑战

• 战略风险高:将全部资源投入 AI 存在较大的战略风险,如果技术发展不如

预期或市场需求发生变化,可能对公司造成重大影响。

• 人才短缺:AI 和 LLM 领域的专业人才稀缺,招聘和留住高素质人才可能成 为难题。

• 监管不确定性:AI 技术的发展可能面临监管政策的不确定性,公司需要应 对不断变化的监管环境。

4.4典型案例

百度阿里云,以微软与OpenAI的整合作为标杆,以AI应用未来的快速发展作为未来增长的核心驱动力,带动对于AI基础设施与能力的需求与市场增长。

总的来说,这四个状态反映了现存应用从初步探索AI技术的潜力,到全面拥抱AI并实 现战略转型的过程。随着AI技术的不断发展和成熟,企业将越来越多地依赖AI来驱动 创新和增长,未来各个领域的竞争,也将由于AI能力的加入发生变化,在AI应用第一 阶段的竞争当中,成熟应用相对具备领先优势,无论是交互协同触点的占据还是资源 投入等,但是AI原生应用的颠覆式创新仍然有可能改变当前市场发展。