以大模型之名,重新定义手机操作系统。
作者 | 北方
编辑 | 靖宇
2020 年,彼时智能手机刚刚进入 5G 普及阶段,手机的硬件与软件都迎来了一次迭代浪潮——新形态的需求对操作系统的设计与交互都提出了诸多新的问题,OriginOS 的首个版本,可以看作 vivo 对这些问题的回答。
彼时,我曾有机会与 OriginOS 开发团队沟通,正如 OriginOS 的中文名原 OS,Origin 一词代表的原始、本源之意一样,开发新系统的首要目标就是要与手机操作系统生态内的众多常用功能进一步融合,提供新的手机操作系统体验。
但在 1.0 时期,OriginOS 开发团队更多是将传统系统的一些功能和元素重新组合,创造全新的视觉和交互规范,即使 OriginOS 确实成为了当时一众 Android 第三方操作系统中的一股交互旋风,但仍然很难触及一些在此之上的难点:用户使用手机的方式千人千面,即使能将百尺竿头的触摸交互更进一步,终究难免有隔靴搔痒之感。
很多用户对一台 Dream Phone 的追求,实际上是对操作系统更加智能化的追求,但这种有温度的诉求,很多时候对单一的功能开关来讲是很难面面俱到的,因此手机智能助手从很早之前就被许多业内人士认为是让手机更好用,变成「更有温度的智能设备」的跃迁途径之一。
OriginOS 开发团队同样意识到了这个天花板效应,因此在 2017 年,就开始了在 AI 大模型领域的布局,而在 OriginOS 4 上,则是 vivo 在大模型领域耕耘多年成果的首次亮相。
2011 年,首台搭载智能语音助理 Siri 的 iPhone 4S 问世,但此后的十余年,手机上的智能助理的进展相比起硬件层面上的突飞猛进来讲进展缓慢:不仅语音识别往往会在复杂场景下出现拾音不准确、要发音清楚的问题;语义理解不佳、换一种表达方式就答非所问的情况也十年如一日的普遍存在。加上使用场景有限,长此以往,导致时至今日很多普通用户对手机智能助理的印象还是「最常用的功能是设定闹钟」。
让手机关键功能的更加触手可及,一直是手机系统进化的核心诉求。OriginOS 1.0 的时候,vivo 通过原子组件在部分应用上实现了「零层级」交互,区别于早年间大家比较熟悉的桌面小组件,它相当于将应用程序的某些功能入口进行抽离再整合,从而大幅简化操作流程,实现便捷操作。
到了 OriginOS 4,这次 vivo 主打的升级变成了今年最流行的行业趋势——通用大模型;此前 vivo 已经预告过关于蓝心大模型的性能:已取得了 C-Eval 全球中文榜单第二、其百亿内大模型榜单第一,CMMLU 全球中文榜单第一以及其百亿内大模型榜单第一的成绩。
根据 vivo 官方的介绍,目前蓝心大模型共包含:十亿、百亿、千亿共计三个参数量级,共计五款自研大模型,其中 10 亿与 70 亿两个都是为包括手机在内的设备设计的端侧大模型,从 700 亿开始则是部署在云端、用于意图识别、文案创作等场景的通用大模型。其中 70 亿参数级别的大模型未来还将进行开源,而蓝心小 V 目前的体验,主要是基于部署在云端的百亿参数级别大模型而实现。
具体到目前的体验中,蓝心小 V 有包括原子组件、悬浮图标以及侧边栏三种呼出方式,最符合 OriginOS 设计风格的当然是一个 2x2 图标位的原子组件,除了蓝心小 V 的启动入口,还能同时展示航班、火车、以及快递等常用信息。
在蓝心小 V 之前,Jovi 已经是 OriginOS 用户非常熟悉的手机智能助理,但这次是将一个完整的大模型塞进手机中,并非只是一个局限于应用层级的智能助理。按照目前 vivo 官方关于蓝心小 V 能做什么的介绍,除了目前已经不算陌生的知识问答、写作以及图片生成需求之外,蓝心小 V 还能结合 OriginOS 4 实现一些手机系统层级的操作。
换言之,如果你之前已经用过类似的生成式对话机器人,你同样也能很快地用同样的交互模式,来使用蓝心小 V,比如直接让它帮你生成一份邮件:
除了这种非常典型的文本场景,根据文本生成风格化照片、生成思维导图这些仅在不到一年前,还被业界公认为是手机智能助理难以跨越的需求,在大模型加持下,在传统的大模型智能语音交互的基础上,我体验到最常用的交互操作,其实还是例如将生成的文本内容直接导出为 Word 或 PDF 格式,无需进入第三方应用另存为,即可快速分享到工作群中。
在手机操作系统中,大模型实际上带来最多日常体验改变的,往往是对现有内容的深度整合。以蓝心小 V 中目前整合的图片功能为例,你可以上传一张照片,然后对话框中会弹出三个根据图片内容信息识别出的建议选项,例如「转换为日漫风格」「提取文本」等常见的照片处理操作。
在照片风格变换这个功能上,目前蓝心小 V 支持彩绘日漫、梦幻动漫、绯红烈焰三种风格,生成效果非常适合直接出图拿来发朋友圈,不失为一种省时省力的艺术创作。
说到发朋友圈,蓝心小 V 其实在推荐中也内置了「配文发朋友圈」这个选项:根据用户发送的照片,自动识别画面中的内容,并生成一句话的配文,同时提供快速跳转至微信的选项,这个需求相信肯定是很多人日常生活中的刚需。
既然是大模型智能助理,肯定还有很多不局限于推荐列表中的功能:比如上传同一张照片时要求它「消除照片中的路人」,小 V 同样能直接执行,数秒就能快速出图,即使是下面这张图中路人基本已经与背景融为一体的情况下,这个功能也能准确识别出来并将其修补。
作为这些功能的重度用户,我必须要说这些功能并非在现有的手机系统上不能实现,但全新的蓝心小 V 可以说是用一种新的交互方式,将这些常用功能做到进一步触手可及,从这种层面上让手机变得更智能易用。
上传 PDF 由蓝心小 V 进行分析和快速提取文档重点信息,甚至可以通过提问「论文的核心结论是什么」「依据论文内容,心理学目前主要的研究方向是」要知道这一功能即使是 GPT-4 也是刚刚在十月底的更新中,加入这一功能。在手机大模型领域,蓝心小 V 算是目前的第一了。
在目前版本的测试中,我用一篇名为《国外本土心理学研究进展》的论文发给蓝心小 V,要求它帮我总结一份摘要,同时要求它直接以要点的方式进行总结,蓝心小 V 都准确地完成了对应指令中包含的实际需求,小小地展示了一把目前 CMMLU 全球中文榜单第一大模型的人类语言识别能力。
如果你想了解关于论文更加细节的问题,同样可以试试蓝心小 V:直接向它提问例如「作者提出了哪些观点」这样的问题,蓝心小 V 同样能给你一段快速总结式的回复。同样的使用方式自然也可以适用于包括会议记录、文章总结等各种文本应用场景,这种「不需要遵守固定范式」的空气感从 ChatGPT 诞生时就是大模型的魔力之一,如今我终于在手机系统上看到了与之相似的使用体验。
到了大模型时期,如果仍然将蓝心小 V 归类于「语音助手」,很可能会混淆大模型在操作系统层面上的作用:例如随着智能手机动辄 1TB 的存储空间,手机摄影重度用户空间不够已经逐渐成为历史,但在茫茫照片海中快速找到自己想要的图片,已经逐渐成为了新的问题,有了蓝心小 V 之后,你可以尝试直接以语义识别的方式说出照片的内容理解,让小 V 帮你在相册中主动识别有对应内容的照片。
除此之外,利用全局识屏功能,从当前屏幕中快速抓取有效信息、以及使用类似「手机太卡了,帮我优化一下」的命令,在目前版本中都能直接实现对应的系统级操作。可以预见,未来蓝心小 V 类似这样的功能肯定能拓展至更多 App 以及系统级服务中,甚至是常用的第三方 App,这对于现在各种功能框架被 App 割裂的手机体验趋势来讲无疑是一种「拯救」。
我们这次收到的是 OriginOS 4 的预览版,预计整合大模型的蓝心小 V 将在 OriginOS 4 的正式版中正式上线;包含蓝心小 V 大部分功能的「蓝心千询」未来还将以独立 App 的形式,上架其他通用的手机应用商店,这意味着未升级到 OriginOS 4 甚至是其他品牌的手机,未来都有机会像下载 ChatGPT App 一样,通过下载蓝心千询 App 的方式,直接体验到包括问答创作、图片生成在内的蓝心大模型功能。
上面提到了「有温度的系统」,在这次的 OriginOS 4 中,我还意外看到一些能感受到 OriginOS 开发团队「让手机操作系统更有温度」的一些努力:比如在设置-快捷与辅助-无障碍功能中的「vivo 看见」。
对实时画面流进行分析解读、同时以语音的方式提示画面信息辅助视障用户更好的与世界交互,一直是智能手机无障碍功能发展路线中的重点,而在 OriginOS 4 中,融合了蓝心大模型的 vivo 看见,能支持视障用户在弱网甚至无网的环境下识别取景框内的内容并进行播报,实时分析画面中包含的环境、人物、位置关系、行为等。借助 AI 的能力,实现更高效的无障碍功能。
除了蓝心小 V 之外,OriginOS 4 中还加入了很多在系统层面上的体验改变,既有在 Android 底层内核的革新,也有对 OriginOS 一贯强调的新设计的再进一步。
系统动效重构仍然是今年 OriginOS 的升级重点:OriginOS 4 中,vivo 引入了「虚拟显卡」这一概念:即在 Android 系统底层用一个独立进程作为显示单元,高优先级的处理相关任务,给用户带来更流畅的图形处理和视觉效果。
在锁屏样式部分,OriginOS 用户可能已经熟悉的 Origin 锁屏在得到保留的同时,OriginOS 4 中还加入了许多新的样式设置选项 :你能自定义锁屏时钟是否居中、字体样式以及颜色等细节,还可以直接从壁纸中自动取色决定文本内容的基调。
重新设计的 vivo Sans 在视觉效果上更时尚,图标的粗细还与文字字重进行统一,既保证了信息传递的整体视觉平衡性,也在手机屏幕的介质上也能获得更加舒适的阅读体验。
另外你可能也已经注意到:OriginOS 4 的设置图标也进行了重绘,更符合新系统下的整体视觉语言。
在桌面原子组件部分,本次新增了一个名为「停车助手」的聚合类 App,基本上是将各种原本散落在第三方 App 中的常用功能入口汇聚一堂,方便你在开车时快速使用,这种属于 OriginOS 最擅长的应用内功能整合,但同样需要很多与百度地图、高德地图这样第三方服务商的合作。
在超级省电模式下,OriginOS 4 的手机能获得比以往更长的待机时间。在实际测试中,超级省电模式续航相比均衡模式提升 26%,待机场景相比较 OriginOS 3 提升了近 22%。
另外从今年开始,针对 Android 底层内核修改、实现的系统轻量化也算是行业趋势之一,OriginOS 4 同样引入了这一概念,虽然这一改进直接看起来似乎并没有太强的感知,但实际上通过改写安卓内核,将系统和三方应用后台轻载化,屏蔽后台无关的偷跑计算,使得 OriginOS 4 的系统后台更轻量,使三方应用更静默,进而使功耗下降。在优化后,能降低 20% 的后台负载,对比 OriginOS 3,在部分场景下,负载下降 20%,待机提升约 15%。
在近两年对国内用户愈发重要的反诈功能部分,OriginOS 4 中进一步整合了千镜可信引擎的能力,自动同步给包括支付宝以及银行 App 在内的更多第三方金融 App,同时调用这些 App 内的风控机制,当检测到相关风险存在时,现在可以直接在 App 内弹出提示,快速进行二次验证。
上面说了这么多,看起来似乎 OriginOS 4 的功能非常繁杂,但在经过一段时间的实际使用体验后,我所看到的 OriginOS 4 主要的改变,其实仍然没有偏离 OriginOS 一开始的初心。从最初提出的原子组件概念,到如今的大模型落地 OriginOS,本质上都是在试图解决那个关于未来手机操作系统的问题:
「手机操作系统怎样才能变得更有温度?」
相比之前单纯的功能罗列,融合了大模型的 OriginOS 显然有了更多的思考,开发团队也在不到一年的时间内,在大模型与手机系统的框架之间做出最大程度的改变。最终跨出了从手机系统迈向 AI 操作系统的「第一步」。
这种改变是需要勇气的,现阶段的 vivo 基于蓝心大模型所构建的生态尚处于萌芽期,即使有大模型的加持,通往下一代操作系统的道路仍然道阻且长,但我仍然从 OriginOS 4 中看到了,关于解答这个问题更多的可能性。