在技术的浪潮中,人工智能正以前所未有的速度发展,它的影响波及社会的每一个角落。这篇文章深入探讨了人工智能的未来发展趋势,从多模态大模型到视频生成,从端侧大模型到AI科研,再到具身智能和人工智能+的概念,揭示了AI技术如何塑造我们的世界。
在上一篇文章中,我们针对人工智能时代,从硬件、软件、行业生态的层面梳理了各自的发展现状和值得关注的机遇。同时也指出,人工智能是以“天”为单位在迭代演化。因此,梳理人工智能有哪些发展趋势,对于我们布局未来,是有很大的参考价值的。
那么,人工智能都有哪些发展趋势呢?闲话少述,我们一项项来展开论述。
从人类视角出发,人类智能是天然多模态的,人拥有眼、耳、鼻、舌、身、嘴(语言)。从AI视角出发,视觉,听觉等也都可以作为AI的直接输入,可采取与大语言模型相同的方法进行学习,并进一步与语言中的语义进行对齐,实现多模态对齐的智能能力。
世界模型是建立在理解世界的基本物理常识之上,然后观察并预测下一秒将要发生什么事件(如:水往低处流、物体之间碰撞等)。虽然目前文生视频的底模型要发展为世界模型仍然存在很多问题,但可以认为它们正在学习画面想象力和分钟级未来预测能力,这是世界模型的基础特征。
通过提升模型智能程度同时减少参数,来实现“大模型做小”。将大模型部署在终端,直接在本地运行。这种方式能够显著提升数据处理的速度,同时减少了数据传输的需求,降低网络负载。此外,在本地处理数据可以更好地保护用户隐私,减少数据在传输过程中的泄露风险,增强用户对AI技术的信任。目前国外的苹果、Google,国内的华米OV等手机厂商在这方面均有明确进展。
当前科学发现主要依赖于实验和人脑智慧,由人类进行大胆猜想、小心求证,信息技术无论是计算和数据,都只是起到一些辅助和验证的作用。相较于人类,人工智能在记忆力、高维复杂、全视野、推理深度、猜想等方面具有较大优势,在诸如预测蛋白质结构、设计高性能芯片、高效合成新药等科研上有优势。近期的GPTo1引入“思维链”框架,多少也有点这方面的味道。
具身智能:有实体并支持与物理世界进行交互的智能体,传感数据输入后,通过大模型处理生成运动指令进行驱动
具身智能指有实体并支持与物理世界进行交互的智能体,如机器人、无人车等,通过多模态大模型处理多种传感数据输入,由大模型生成运动指令对智能体进行驱动,替代传统基于规则或者数学公式的运动驱动方式,实现虚拟和现实的深度融合。这一领域在第一、第二产业的落地应用更广泛,我推测会是我国未来重点发力的地方。
在机器人+具身智能领域,苹果联合创始人史蒂夫·沃兹尼亚克提出了对应“图灵测试”的“咖啡测试”,相信可作为具身智能的判断准则。
如果机器人能进入一个普通的美国家庭,并弄清楚如何煮咖啡需要一台机器:找到咖啡机,找到咖啡,加水,找到杯子,然后按下正确的按钮来冲泡咖啡。这一系列任务能够顺利完成,就证明它拥有了具身智能。
人工智能+:AI作为一种通用技术,能够与现有的各种技术和行业相结合,产生倍增效应
2024年的两会上,政府在工作报告首次提出“人工智能+”的理念。从顶层设计推进AI与传统行业的深度融合,促进产业升级、创新和转型,提高生产效率和质量,创造新的服务模式和商业模式。体现了国家对科技驱动经济发展模式的坚定信念。关于这方面我们在上一篇文章关于人工智能时代的“行业生态”层面便已有所论述,此处不再详细展开。
以上6个人工智能的发展趋势,都已经有走出明确的第一步,部分甚至已经取得明确的首轮进展。限于笔者的脑力与见识,相信还会有其他的发展趋势未在本文论述,这里也欢迎朋友们进行指正补充。
行文到最后,我想快速讨论一个话题:“人工智能会不会也是炒作起来的热点?”
这让我想起数年前曾经火热的“区块链”、“元宇宙”概念。站在当下回顾,我们可以明确,这些的确是资本的炒作(尤其是“元宇宙”,作为一名曾经的社交产品经理,在“元宇宙”概念出来我就觉得是资本炒作出来的概念)。但对比起来,这轮人工智能的到来,是绝对会对我们的生产生活方式,都产生很大的变革的。自从投身其中,我真切地感受到人工智能所来的效率提升(这方面可以类比计算机、互联网的出现所带来的变革)。关于如何用好人工智能为我们赋能提效,我在后续将陆续输出文章,敬请朋友们关注。
面对人工智能的浪潮,我们除了投身其中,别无他选。愿你我一同努力前进,成为人工智能时代的弄潮儿!
作者:产品经理崇生,公众号:崇生的黑板报
本文由 @产品经理崇生 原创发布于人人都是产品经理。未经作者许可,禁止转载
题图来自 unsplash,基于CC0协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。