封面新闻记者 吴雨佳
ChatGPT所引领的AIGC新纪元,正在重新定义我们的生产生活。这场全球风暴,每个人应该如何把握?中国企业又有什么样的新机遇和挑战?近日,在首届中国AIGC产业峰会上,微软、百度、科大讯飞、商汤科技、小冰公司、昆仑万维等知名产业玩家的高管和澜舟科技创始人周明、智源研究院总工程师林咏华、启元世界创始人袁泉,智谱华章CEO张鹏等在内的创新公司代表分享了自己的观点。
澜舟科技周明:进入AI 2.0不代表一定要抛弃1.0的技术
ChatGPT和之前的大模型有什么区别?周明阐述了自己的理解。
首先,ChatGPT对用户的意图理解非常清晰,也更加准确;其次,多轮对话的建模非常好,还有若干解析能力。但是,站在工业界角度,很多需要解析能力的任务用单独的引擎能比ChatGPT效果更好。所以,找到ChatGPT的应用场景非常关键,周明就提出了两种考虑:
To C时,AGI能力越多越好,用户在简单界面完成所有调用;To B环境下,问题理解、多轮对话的能力,接上企业自己的核心引擎,好好结合起来。
站在To B的角度,分享了对AI 2.0时代企业进行数智化转型的看法。
ChatGPT出现后,涌现了单模型、单任务永远出不来的能力,于是迈入进入AI 2.0时代,它的特点是一个模型N个任务,未来甚至一个模型可以解决无穷个任务。
但是,企业内部使用时,会发现AGI很多功能并用不上,一些能力反而还会出现捣乱的可能。
以此为背景,企业进行数智化转型时,不要追求必须用AI 2.0、一定要抛弃AI 1.0。企业应该试图把AI 1.0功能引擎和AI 2.0部分能力(如问题理解和多轮对话的能力)无缝对接起来,形成一纵一横的合力,练模型的团队和用模型的团队持续产生交互,共同提升效率。
小冰徐元春:任何一项技术的诞生都为产生产业价值
AI内容生成的价值,不仅在于降本增效,更重要的维度在于解决问题、提高效率、创造场景。
上述的三点,就是小冰公司COO徐元春结合过往经验对AIGC创造能力的总结。
其中,提高效率是最显著,也最容易被理解的一点。比如视频领域,2022年卡塔尔世界杯期间,解说员刘建宏的节目,超过半数都是在他本人录制的基础上,由AI复刻形象、合成声音生成的。
提升效率关键在于高并发和稳定性,强调稳定性的原因,在于很多技术在实验室实现了算法价值,但最后一公里的落地非常艰难,所以,技术的工业化应用标准要达到稳定性的要求。
在解决问题方面,所有的AI公司或科技公司都应该认识到,需要解决的问题应当是产业尤其是传统产业迫切需要关注和改变的真实痛点。
举例来说,利用AIGC能力创造和生成虚拟数字员工,就是在企业现有IP不改变和不稀释的情况下,能够在多时空、多场合创造更多内容——内容,是一个IP最主要的资产和核心生产力。
另外还有拓展新场景。除了利用数字孪生技术,用虚拟人生产、传播内容,获得更广泛的流量,让运营团队和IP解耦、内容和形象解耦,满足大量的内容输出需求。
比如,数字员工可以直播更多场次。这里提到直播不再局限于视频录播,还有实时直播,包括在海外利用当地语言、当地文字回复直播间问题,和用户产生实时互动和实际交流,最终触发购买行为。
在这个场景里,虚拟人和AIGC的融合达成交易、促成销售,从这个角度来讲,AIGC不仅产生内容,也产生了实实在在的销售收入。基于此,如何让模型更加适合推荐,是大模型里更加传统化的应用。
昆仑万维方汉:AIGC最大社会意义是提供低成本终极解决方案
作为资深的互联网从业者,昆仑万维CEO方汉谈到了他最近的一些思考。
首先是AIGC商业模式落地这一方面,他观察到两大定律:
第一,用户创作门槛降低,内容创作数量增加十倍;第二,C端工具商业逻辑是社区,B端实质则是功能的完备性。
其次是AIGC对生产者的影响。
对于存量知识的理解和表达,AIGC将以低廉的成本做到80分的水准。如果我们人类也只能做到80分,那工作一定会被替代;只有80分以上的人,才能去管理“AIGC操作员”,完成曾经需要腰部工作者去完成的工作,并极大地提升产量,而腰部工作者将大概率被淘汰。
除此之外,方汉还提到了几点观察:
第一,开源大模型是商业闭源大模型的有力补充和替代。
就像ChatGPT可以想象成早期的Windows。Windows的存在是整个电脑商业软件领域的一个基石,也是绝大多数人的生产工具,而Linux通过30年的努力把自己变成Windows替代。因此像“Linux”一样的开源大模型也一定会出现。
第二,只有开源模式才可以满足用户的长尾需求。比如Stable Diffusion,其质量、性能都低于DALL·E2、Midjourney,但用户增长很快,而且还催生了许多二次开发工具,解决刚性问题。可控生成作为 AI 创作最后一道高墙,极有可能在可预见的时间内有进一步突破。
第三,各种AIGC工具能力仍受到预训练大模型限制,这点在GPT-4出现之后更加突出。
未来AIGC对整个社会最大意义,是提供了低成本终极解决方案;其次是将彻底改变艺术创作生产方式,最后具体到内容生成,大量创作内容的涌现,让VR和元宇宙变得更加可行。
微软关玮雅:每个应用程序都可以由 AI 来驱动
微软大中华区首席战略官关玮雅表示,越来越多的组织和机构正向云原生、AI技术转型。可以畅想在人工智能时代,每个应用程序都能通过AI驱动,实现更高的效率、更好的用户体验。
她从与OpenAI的合作来展开举例。OpenAI的成功可以归结为四个方面:强大的人才梯队;先进的技术底座;秉承长期主义的研究和投入;开放合作的文化。
除此之外,微软对于OpenAI的发展也做出了积极地贡献:10亿美金的战略投资以及打造了世界前五的超级计算机,同时提供多元化、商业化的路径。
两家企业联合,不仅训练出了震惊世界的多个大型AI模型,更将AI技术与微软的全线产品深度结合,让企业、个人都能享受AIGC带来的潜力与可能。
AIGC的创业路径,可以分成三个功能维度:
第一类是帮助企业降低运营成本,比如最近推出的Microsoft 365 Copilot;
第二类是提高客户满意度和产品体验,比如,通过语音交互技术,帮助不同类型企业为消费者提供个性化产品,这一点在数字人技术体现尤为明显。
第三类,AGI作为一种革命性的技术,也承担着非常重要的社会责任。比如为残障人士提供更加便捷的生活服务。
同样,AIGC在不同行业的商用想象,也是实实在在而具体的,比如制造业、智能车、金融、医疗、游戏、娱乐、教育等领域。
对于企业而言,如何将AI战略提升到CEO的级别?哪些场景应该作为首选开展试点落地?又如何定位在AI时代下企业的核心能力,以及人才素质模型?如何重塑企业的流程、组织、文化,来更好地迎接新一代生产力革命?这些是所有企业家需要深度思考的问题。
百度袁佛玉:文心一言将改变云计算游戏规则
国内以文心一言为代表的应用,已经展现出了产品化、商业化的潜力。
百度集团副总裁袁佛玉就表示,文心一言将根本性地改变云计算市场游戏规则 。源于大模型和生成式AI的两大突破,全球性“AI再造”已经拉开序幕,跟不上的企业将彻底失去未来的竞争力。
具体从三个方面来进行诠释。
首先,这是百度多年技术积累和敏锐洞察。一方面,如果没有长达13年、高达千亿元的技术研发投入,根本就不可能出现文心一言这个大模型。另一方面,去年就曾精准预测过技术层面的方向性改变,也就是生成式AI。今年文心一言将与百度搜索、小度、Apollo自动驾驶等业务融合,但更大的故事在云计算。百度智能云有信心成为引领者。
其次,生成式AI的兴起,将给生产经营效率与用户体验效果带来“双效”提升,将彻底改变所有行业,加速实现社会“智能化跃迁”。这一点从文心一言所释放出的能力就可以看出,可以帮助千行百业实现AI再造。
再者,今天IT技术栈已适配AI技术发展的四层架构(芯片、框架、模型、应用) 。云计算的主流商业模式将从IaaS(基础设施即服务) 变为MaaS(模型即服务) 。
中国拥有全世界最先进、最完整的产业链,它能产生大量真实的行业需求、用户反馈,这会极大推动生成式AI快速发展,并且随着生成式AI在数字和实体经济落地,模型即服务(MaaS) 将催生万亿级别的新市场。
科大讯飞高建清:认知智能大模型将带来重大产业颠覆和机遇
科大讯飞AI研究院常务副院长高建清 分享了科大讯飞在AIGC技术探索与应用创新方面的一些进展。
整体而言,科大讯飞在AIGC三大模块,即音频创造、视觉创造和文本创造方面,都有积累和进展。
以音频创造这一关键技术为例,高建清认为未来有两大关键趋势:
交互领域实现更好的拟人化、情感化甚至口语化。
内容生产领域,对音色、音律、口音等语义信息进行更好地控制。
目前,语音合成已经在新闻播报、纪录片旁白、游戏解说、广告直播等十多个领域。
在AIGC浪潮下,语音创造方面也有一些关键发展趋势:既可以利用大语言模型,如Audio LLM方案,对语音合成中的关键因素进行控制;也可以更好地利用AIGC追求声音艺术,通过插入音效、环境音,对语音合成感受进行改善。
高建清表示,认知智能大模型将带来重大产业颠覆和机遇:它将改变信息分发和获取的模式、内容生产的模式和人机交互的模式。科大讯飞将结合在场景、数据方面的理解,在教育、医疗、人机交互、办公等方向进行布局。
【如果您有新闻线索,欢迎向我们报料,一经采纳有费用酬谢。报料微信关注:ihxdsb,报料QQ:3386405712】