2024 年 1 月 10 日,荣耀 2023 开发者大会正式开幕,拥有自研 70 亿参数 AI 大模型 “魔法大模型”的全新操作系统 MagicOS8.0 正式发布。次日荣耀终端有限公司研发管理总裁邓斌、荣耀终端有限公司产品线总裁方飞以及魔法 OS 领军团队和学术界领军人物等齐聚一堂,围绕着魔法OS 以及在 AI 大模型驱动下对未来操作系统的一次探索和思考。(访谈内容有精简)
问:下一代操作系统的展望?
吕院士:大模型不是人工智能的全部,只是人工智能目前成为热点的一部分,所以大家对它的定位,我个人感觉微软的说法比较合理,“Pilot and Copilot”,是比较合适的。再往下说,由于“六个一切”,由于“各领风骚,联动发展”导致人类社会进入人机物三元融合的新世界。
回到学术上,要解决一些问题,这个问题的源头就是软件定义一切,软件在什么地方跑?要在计算机上跑,是不是就有一个命题,一切都是计算机。所有计算机上都要跑操作系统,是不是一切都是操作系统?然后是不是一切都要语言来做沟通?Prompt也可以看作一种语言,指挥计算机的语言、指挥大模型的语言等,如果这个学术体系要建起来,还是费劲的。什么样的软件能定义一切?我们叫开放化、智能化、原子化的软件定义一切。在这中间操作系统也好,什么也好,我们把它叫做场景化的操作系统,或者场景化的基础软件、场景化的系统软件来作为一个中间载体来加以覆盖。
问:关于 AI 大模型与操作系统的关系?
黄萱菁:举几个小例子。第一个例子,操作系统可以做一个个性化、个人的大模型,最近大家知道像OpenAI都搞了大模型工厂,可以做千人千面的大模型,但对个人用户来说每个人有一个专属大模型,这样大模型能从你个人长期使用手机的经验中,了解你个人的需求,执行一些个性化的任务。比如我说“给我老妈发条信息约她今天老时间、老地点吃饭”,这样的需求个性化模型就可以理解到,你的母亲是谁,名字是什么,怎么给她发信息,老时间、老地点做实体的识别功能。这可能是一类。我自己是做语言信息处理的,现在大模型首先是大语言模型,我们仅仅只理解语言是不够的,因为人和手机最重要的交互手段是语音,所以我们怎样在语音上能够做到转换,这也是要做的。
问:端侧大模型和云测大模型的区别?
黄萱菁:大家过去用的,比如一开始用的ChatGPT是一个云侧的大模型,云侧大模型它是一个非常完整的大模型,参数很多,比如要千亿的参数,功能也非常强,但它对算力的要求非常高。大家用大模型会发现它的速度有时候并不是那么快,因为中间有它推理的开销问题和网络的时延问题。另外还有一点,用户个人是有隐私数据的,我的姓名、收入、家庭住址这些信息在手机上,手机是你个人专属的,而且有国家法律的保护比如《隐私保护法》《数据安全法》,手机的数据不应该泄露到云上去。
所以在这种角度下,我们可以做一些端侧大模型,它的推理是在本地进行的,这样就不耗远地的算力。端侧大模型时延就比较快,你会觉得丝滑般的用户体验就出来了,这靠云侧大模型是做不到的。另外隐私保护方面,端侧大模型个人信息本地处理了,但有些场合我们甚至要做些端侧跟云侧不是矛盾,是互补的。另外有时候端云还要协同,我们就可以在本地做一些隐私保护,把一些数字、姓名该替换的替换掉,到云端大模型,它帮我拉好一个框架写的差不多,本地还可以做些替换。端云协作终究目的就是进一步服务用户,提升用户体验,保护用户个人的数据安全,端云协同是将来一个非常重要的场景。
问:云侧和端侧的大模型目前探索到哪一步了?
邓斌:过去我们有大量的个人经验数据,大量的轨迹数据,这些轨迹数据大模型怎么用起来,它是跨模态的,怎样将这么多个人的画像,比如曾经去过四川菜馆吃辣的,你多高或者你是哪里人,这些东西和你的每个行动是什么关系,我相信大模型给了新的AI范式一个新的机会。第二比较难的地方就是要面临的复杂应用,我们要解决在全场景下处处都是软件,一切都是AI的状态,我们要回避一个问题,怎样让计算机代人对复杂的任务进行有效分解,分解出一个清晰的宏定义或者清晰的指令级语言的要求,能够真正的告诉各个专业化模型你应该干什么。
未来的任务会越来越复杂,所以这是我们端云协同非常大的意义。第一,我们用真正的数字化个人让你的行为变成可用、可描述、可量化、跨模态的行为;第二,让你行为的目标,在所有专业化模型来看也是可量化、可定义、可Prompt化的意图逻辑,这是荣耀未来在端云协同上要真正构建起来的核心能力。
问:人机互动的趋势跟操作系统之间的关联,关于这方面有什么见解?
喻纯:我们设想的未来是,一台手机或者是一个终端设备,终端设备的形态有各种各样的,但是这些设备通过它的传感器,我们构建起来一个我个人的空间,这个空间有一点像一个数字孪生。比如我现在正在这做讨论,可能某个云端的服务器上就存着我现在所有的状态,包括在场各位,如果能知道这些信息的话,会构建出来这样一个数字空间,在这个空间里不仅仅是个物理的,也关于我自己的个性、性格,我的知识。
这些事情我感觉每步都可做,从技术上讲完全可以往前做这个事,就看谁第一步把这个事做好。所以我设想的人机交互可能会在5年左右发生一个非常革命性的变化,但这种变化背后可能又有一个比较夸张的问题,是不是人越来越像科幻电影里的,插一根管子活在虚拟世界里的效果。因为所有东西都被计算机可控、可算了,我们现在很多时候已经处于这种情况,我们看各种新闻看各种视频,我们有信息茧房等各种各样的问题,人已经被机器影响,这可能又是咱们说的大科学家、哲学家要考虑的问题。
问:未来操作系统与互联网产业合作的关系将发生哪些变化?
董振宁:我关注到荣耀发布了新一代OS操作系统,包括魔法大模型,我关注到它构建了基于大模型技术总线的架构,基于这种总线的架构会让很多行业垂直的大模型很方便地通过货架式的架构,融入到手机的操作系统当中,这是以前从来没有的现象。这样的话会产生在模型和应用上的一种新物种,或者叫模型上的百花齐放,都是有可能的。另外会催生很多行业垂直类大模型在手机上的新的应用,以及包括云端大模型上应用的生态都可能发生。
方飞:首先谈谈最近做了OS后,期间有跟很多互联网伙伴交流。以前互联网时代,我们的终端可能是个平台,我们提供了基础的位置信息,输入一个基础的平台,但我觉得现在发生了变化,我们也懂消费者了。我们是个场景化的操作系统,我更懂消费者,更懂他实时意图和想法。在这样的前提下,可以打通我们的各个服务,可能不仅是一个APP,当时是一个APP能做的行为,可能是一串的原子化服务。结合大模型、本地化的能力,我们就可以打破壁垒,构建一种新的服务模式,这个模式正在构建中。不管是所谓的应用市场,它只是对你场景的一种理解,我觉得终端将来有这么一个巨大的机会。