ChatGPT崛起之际:如何应对百模大战的挑战?

发表时间: 2024-07-05 21:06

“为什么ChatGPT越来越强,而我们在百模大战?”2024世界人工智能大会人工智能全球治理高级别会议首日的科学前沿主论坛上,有专家发出了这样的“灵魂之问”。这不仅是科学界关心的话题,也是产业界经常提起的话题,而这场科学前沿主论坛便围绕着这一“灵魂之问”展开,探索中国人工智能(AI)如何发展。

中美之间,也就是ChatGPT与百模大战之间,确实有差距。在论坛上,中国科学技术信息研究所党委书记赵志耘发布了《2023全球人工智能创新指数》,这份报告清晰地指出了中美在AI之间的差距——虽然目前全球AI发展由中美两家强强引领,同处在第一梯队,但在各个指标上,美国全面领先。

中国AI怎么办?上海人工智能实验室主任、首席科学家周伯文给出的一个方案是“通专融合”,这也是后来嘉宾们讨论的关键词之一。

周伯文认为,对于科学界来说,AI应该帮助科学家提升科学发现能力,以现在最火的大模型为例,要实现这一价值,必须把通用模型和专业模型结合起来。他解释,通用模型无法解决专业问题,而专业模型又过于专业,就像现在有一个明显的趋势,就是全球论文影响力下降,他认为这是因为科学大厦基本建设完成,在每个专业领域里形成了信息茧房,因此影响力下降。

要专业又要破除茧房,与此同时,他也强调要创新AI训练方法,与实际结合。比如人学了游泳知识但不一定会游泳,AI现在往具身智能方向发展,光有智能还不够,还需要身体训练。

周伯文的这套理论也是目前上海人工实验室正在实践的理论,在论坛上,该实验室的三位青年科学家发布了三项通专融合带来的最新成果。

其中,书生·浦语大模型发布了2.5版本,该模型在尝试模仿人的思考过程,推理能力比上一代提升20%,同时模型自主规划搜索、撰写专业回答的效率也比人类专家提升60倍;书生·万象布局图文领域,支持图像、文本、语音等,并采用渐进式训练,从小语言模型逐步过渡到语言模型,目前能力也处于业内领先水平;书生·风乌大模型将跨模态的通用大模型与气象海洋专用大模型融合,能够实现短期到长达多年的高精度天气预报,目前已部署上海气象局。

在随后的圆桌论坛中,包括两位中国工程院院士在内的科学界嘉宾也围绕“通专融合”开展了讨论。

“科学发现要有泛化能力,考虑样本之外还能走多远,同时又要具有可检测性,因此需要通专融合,相互补充。”中国工程院院士、国家流程制造智能调控技术创新中心首席科学家钱锋说。

中国工程院院士、机器人视觉感知与控制技术国家工程研究中心主任王耀南认为,AI要“顶天立地”。所谓“顶天”就是实现前沿技术的突破,要解决体系架构、推理过程、安全可信度等问题。而“立地”是为各行各业赋能,其中具身智能是最好案例,过去机器人依靠编程行动,但要真正在各行业中应用,需要一群机器人协同交互,也就是从感知、规划、决策、控制,到多模态大模型,感传算融合,这背后也是通专融合的意思。

认知智能全国重点实验室主任胡国平指出,训练AI就好比一个人看书做题长大后工作,每个人在小学、初中、大学不同的阶段要有不同资料去学习,一开始是通用知识,后来要分专业,AI也是如此。

虚拟现实技术与系统全国重点实验室主任吕卫锋表示,文生图出现以后,AI就变了,多模态大模型发展,最后就是要形成混合的智能平台。“我是研究虚拟现实的,未来AI就是让虚拟环境更逼真,要虚实结合、能自然交互。”吕卫锋说。

北京大学教授、多媒体信息处理全国重点实验室主任黄铁军介绍了AI的发展历程,从2018年以前,人脸识别感知就是AI,到现在大模型,实际上是认知问题取得了突破。他认为,未来AI需要超实时感知,然后实时处理,就像人看到一些信息,会联想到背后的很多东西一样,人处理信息是依靠大脑的脉冲神经网络,是信息流,不是简单地实时看到什么图文信息就是什么。

“未来的AI感知和处理信息也必须依靠信息流,要把各种东西融合起来考虑,AI的思考功能必须和人一样,同时性能比人强,这样具身智能才能超越人类。”黄铁军还开玩笑道:“AI要代替人的岗位,就是要比人强,要不然我们不需要研究AI了,多生点孩子就行了。”

那究竟如何融合发展?专家们的观点是“聚势成峰”,实验室之间、产业之间密切结合,实现AI战略科技力量的协调与引领。

“融合协同很重要,不仅是通专融合,各实验室也要融合。”钱锋也表示。他还提出了几点思考:“我们能不能形成一个总链主、总平台?能不能让科技创新和产业创新深度融合?能不能创新体制机制?”

“为什么ChatGPT越来越强,而我们在百模大战?这不是科技圈自己能解决的。Open AI从科研到为大企业服务,它的发展是与商业互动的结果。美国有大型企业拉动,在我国的优势是可以集中力量办大事。”黄铁军说。

栏目主编:陈玺撼 题图来源:图虫 图片编辑:徐佳敏

来源:作者:王力