AI时代的人工智能发展趋势：历史、现状与未来

发表时间: 2024-11-24 19:46

在技术的浪潮中，人工智能正以前所未有的速度发展，它的影响波及社会的每一个角落。这篇文章深入探讨了人工智能的未来发展趋势，从多模态大模型到视频生成，从端侧大模型到AI科研，再到具身智能和人工智能+的概念，揭示了AI技术如何塑造我们的世界。

在上一篇文章中，我们针对人工智能时代，从硬件、软件、行业生态的层面梳理了各自的发展现状和值得关注的机遇。同时也指出，人工智能是以“天”为单位在迭代演化。因此，梳理人工智能有哪些发展趋势，对于我们布局未来，是有很大的参考价值的。

那么，人工智能都有哪些发展趋势呢？闲话少述，我们一项项来展开论述。

多模态大模型：让AI具备视觉，听觉等阅读世界的能力

从人类视角出发，人类智能是天然多模态的，人拥有眼、耳、鼻、舌、身、嘴(语言)。从AI视角出发，视觉，听觉等也都可以作为AI的直接输入，可采取与大语言模型相同的方法进行学习，并进一步与语言中的语义进行对齐，实现多模态对齐的智能能力。

视频生成：发展为符合物理常识的世界模型

世界模型是建立在理解世界的基本物理常识之上，然后观察并预测下一秒将要发生什么事件（如：水往低处流、物体之间碰撞等）。虽然目前文生视频的底模型要发展为世界模型仍然存在很多问题，但可以认为它们正在学习画面想象力和分钟级未来预测能力，这是世界模型的基础特征。

端侧大模型：部署在终端可独立运行的AI大模型

通过提升模型智能程度同时减少参数，来实现“大模型做小”。将大模型部署在终端，直接在本地运行。这种方式能够显著提升数据处理的速度，同时减少了数据传输的需求，降低网络负载。此外，在本地处理数据可以更好地保护用户隐私，减少数据在传输过程中的泄露风险，增强用户对AI技术的信任。目前国外的苹果、Google，国内的华米OV等手机厂商在这方面均有明确进展。

AI科研：从辅助科研到主动科研，实现从推断到推理的跃升

当前科学发现主要依赖于实验和人脑智慧，由人类进行大胆猜想、小心求证，信息技术无论是计算和数据，都只是起到一些辅助和验证的作用。相较于人类，人工智能在记忆力、高维复杂、全视野、推理深度、猜想等方面具有较大优势，在诸如预测蛋白质结构、设计高性能芯片、高效合成新药等科研上有优势。近期的GPTo1引入“思维链”框架，多少也有点这方面的味道。

具身智能：有实体并支持与物理世界进行交互的智能体，传感数据输入后，通过大模型处理生成运动指令进行驱动

具身智能指有实体并支持与物理世界进行交互的智能体，如机器人、无人车等，通过多模态大模型处理多种传感数据输入，由大模型生成运动指令对智能体进行驱动，替代传统基于规则或者数学公式的运动驱动方式，实现虚拟和现实的深度融合。这一领域在第一、第二产业的落地应用更广泛，我推测会是我国未来重点发力的地方。

在机器人+具身智能领域，苹果联合创始人史蒂夫·沃兹尼亚克提出了对应“图灵测试”的“咖啡测试”，相信可作为具身智能的判断准则。

如果机器人能进入一个普通的美国家庭，并弄清楚如何煮咖啡需要一台机器：找到咖啡机，找到咖啡，加水，找到杯子，然后按下正确的按钮来冲泡咖啡。这一系列任务能够顺利完成，就证明它拥有了具身智能。

人工智能+：AI作为一种通用技术，能够与现有的各种技术和行业相结合，产生倍增效应

2024年的两会上，政府在工作报告首次提出“人工智能+”的理念。从顶层设计推进AI与传统行业的深度融合，促进产业升级、创新和转型，提高生产效率和质量，创造新的服务模式和商业模式。体现了国家对科技驱动经济发展模式的坚定信念。关于这方面我们在上一篇文章关于人工智能时代的“行业生态”层面便已有所论述，此处不再详细展开。

以上6个人工智能的发展趋势，都已经有走出明确的第一步，部分甚至已经取得明确的首轮进展。限于笔者的脑力与见识，相信还会有其他的发展趋势未在本文论述，这里也欢迎朋友们进行指正补充。

行文到最后，我想快速讨论一个话题：“人工智能会不会也是炒作起来的热点？”

这让我想起数年前曾经火热的“区块链”、“元宇宙”概念。站在当下回顾，我们可以明确，这些的确是资本的炒作（尤其是“元宇宙”，作为一名曾经的社交产品经理，在“元宇宙”概念出来我就觉得是资本炒作出来的概念）。但对比起来，这轮人工智能的到来，是绝对会对我们的生产生活方式，都产生很大的变革的。自从投身其中，我真切地感受到人工智能所来的效率提升（这方面可以类比计算机、互联网的出现所带来的变革）。关于如何用好人工智能为我们赋能提效，我在后续将陆续输出文章，敬请朋友们关注。

面对人工智能的浪潮，我们除了投身其中，别无他选。愿你我一同努力前进，成为人工智能时代的弄潮儿！

作者：产品经理崇生，公众号：崇生的黑板报

本文由 @产品经理崇生原创发布于人人都是产品经理。未经作者许可，禁止转载

题图来自 unsplash，基于CC0协议

该文观点仅代表作者本人，人人都是产品经理平台仅提供信息存储空间服务。

AI时代的人工智能发展趋势：历史、现状与未来

多模态大模型：让AI具备视觉，听觉等阅读世界的能力

视频生成：发展为符合物理常识的世界模型

端侧大模型：部署在终端可独立运行的AI大模型

AI科研：从辅助科研到主动科研，实现从推断到推理的跃升

热门阅读

推荐阅读