安卓阵营全面包围苹果,双巨头手机大模型时代缓慢启动

发表时间: 2024-01-19 21:51

集微网报道 (文/姜羽桐)2009年,苹果公司在为 iPhone 3G 制作的广告中高调喊出“There's An App for That”(总有一款应用为它而生),意指即使手机本身做不到,也总有某个App可以实现。这句经典广告语曾极大丰富了移动互联网时代生态建设,而随着App发展的臃肿化,大量功能重复堆叠,人们不禁发问:“我们到底需要多少应用?”

作一个假设:智能手机拥抱AI大模型形成“智能体”,打破单一App功能进化为系统类服务,深入学习理解用户行为习惯,主动提示用户需求和任务,将散落的App串联后一键完成目标!该假设绝非天方夜谭,“AI大模型+智能手机”的壮举正在发生。

截至2024年1月,华为(盘古)、vivo(蓝心大模型)、OPPO(AndesGPT)、荣耀(魔法大模型)、三星(Gauss大模型)、小米(MiLM)均已官宣端侧大模型。耐人寻味的是,智能机时代的变革者、急先锋——苹果公司突然慢热起来,面对安卓阵营的急速转向似乎瞻前顾后,而安卓阵营的“老大哥”三星同样姗姗来迟,2024年的大模型端侧部署有些热闹。

安卓阵营“围剿”苹果,鸿蒙割席

2023年12月20日,苹果公司在预印本网站arXiv上发表论文《闪存中的LLM:内存有限的高效大型语言模型推理》,提出在手机内存上运行大模型的可能。其在文中构建了一个可以大大扩展LLM适用性和普及性的研究框架,该框架以闪存为基础进行推理,并在两个关键领域进行了优化:减少闪存传输的数据量,读取更大、更连续的数据块。

来源:预印本网站arXiv

各大手机厂商相视一笑,苹果不装了、摊牌了

2023年以来,以ChatGPT为代表的AI大模型始终占据“C位”,并由云端部署走向端侧部署,尤以手机AI大模型更甚:2023年8月,华为宣布HarmonyOS 4系统全面接入盘古大模型;11月,vivo的X100系列也同样支持70亿参数AI大模型。甫入新年,大模型手机发布明显提速。1月8日,OPPO发布旗舰Find X7系列,宣布70亿参数的AI大模型在手机端落地;11日,首发搭载荣耀自研70亿参数端侧平台级AI大模型“魔法大模型”的荣耀Magic6系列发布......

1月18日,三星推出旗舰机Galaxy S24系列产品,喊着“Galaxy AI is coming”(Galaxy AI将至),为安卓阵营的版图补上了重要一张;同日,华为官宣HarmonyOS NEXT开发者预览版开放申请。与上代鸿蒙系统相比,HarmonyOS NEXT的系统底座由华为自研完成,仅支持鸿蒙内核及鸿蒙系统的应用,强调“不再兼容安卓应用”。这无疑代表“AI手机”的重要参与者——华为正式与苹果、安卓两大阵营“分庭抗礼”。

一眼望去,主流手机厂商已前排就坐,安卓阵营“强手如云”,华为鸿蒙“割席”独坐。但并不意味着苹果公司无动于衷。据媒体披露,苹果早于上年7月就在内部测试一款对标OpenAI和谷歌的生成式AI工具,暂名“Apple GPT”,其大模型被称作“Ajax”;不久,苹果又披露一款开源多模态大语言模型(Ferret),拥有70亿、130亿两个参数版本,只对研究机构开放。另有消息指,苹果计划在今年发布的iOS 18中引入AI,主要用于Siri和通讯应用程序的智能问答、生成语句等功能。

结合近期动态,Siri助手AI化或成为苹果公司手机大模型的技术落脚点。但就目前进度看,用户想要在2024年下一代iPhone上体验苹果大模型,时间恐怕太紧张。笔者猜测,AI大模型部署手机所涉及的个人数据隐私问题,或许是苹果保持谨慎的原因之一。而技术上,苹果向来擅长“后发先至”。

AI大模型混战,三条路径两种选择

除了口风甚紧的苹果公司,大部分主流手机厂商都已加入了将大模型部署在手机的行列里,唯一的分歧大概只是路径选择问题——云端、端侧、混合(端云协同)。

混战打响前夜,云端路径却成为第一个“出局者”。vivo副总裁周围算过一笔“经济账”:目前调用一次云端大模型的平均成本在1.2分~1.5分人民币。考虑到每个手机厂商至少有上亿的用户量,假如每人每天调用10次,那么每年产生的成本就会达到数十乃至上百亿元。这部分成本由厂商长期负担不现实,但由用户付费也会降低使用体验和意愿。

而安全方面,云端大模型固然有着“大而强”的优势,但用户隐私问题却难以回避。如果个人数据上传云端,稍有不慎就将面临“翻车”风险,各大厂商无法承受满盘皆输之痛。

就AI大模型端侧部署路径问题,思必驰智能穿戴产品总监宋碧霄指出:“端侧大模型的优势在于很好地保护用户隐私数据的同时,执行速度也得到极大提升。但端侧运行因为芯片算力,内存和功耗问题,手机上运行的大模型参数目前最大只有数十亿参数,相比较云端动辄千亿大模型而言,性能逊色不少。”据悉,2023年7月,思必驰发布自研对话式语言大模型DFM-2,并陆续通过《生成式人工智能服务管理暂行办法》备案和《深度合成服务算法》备案。

宋碧霄表示,为平衡成本、响应速度,考虑用户安全和隐私问题,同时还能较为精准解决复杂场景的智能交互,云端协同是一个不错的思路。简单的、敏感的、隐私的任务由部署在端侧的大模型处理,更加复杂且涉及大数据信息的任务则调用云端能力。

据观察,目前vivo、OPPO采用端云协同模式,荣耀、小米则偏向端侧计算模式。譬如,vivo发布的自研通用大模型矩阵蓝心大模型,以十亿、百亿、千亿三个参数量级的5款大模型,分别面向端侧、端云、云端场景。

70亿参数“真香”?芯片大厂不能幸免

与动辄百亿、千亿参数的大模型只能部署在云端相比,轻量化大模型早已另辟蹊径落地端侧,成为与用户距离最近的那个,高唱着“不是大模型用不起,而是端侧AI更有性价比”。就目前各大手机厂商发布的参数而言,端侧大模型参数一般控制在60-70亿左右,最高130亿。

这显然出于现实的考虑。联发科曾透露,大语言模型对内存需求暴增,130亿参数大模型至少需要13GB内存;OPPO影像产品总监张璇也曾介绍,70亿大模型正常的模型大小是28GB,为了真正在端侧部署,对模型进行压缩和轻量化后可压缩至最小的3.9GB左右。

宋碧霄表示,在手机上运行AI大模型,离不开硬件支持,算力、内存、功耗是三个无法回避的问题。数百亿、千亿参数大模型依赖端侧芯片强大的算力和内存,设备运行受限;当前最新的手机芯片可以支持130亿参数大模型,但功耗会比较高。在手机上部署AI大模型时,需要在“强大的手机大模型”“能用的手机大模型”之间平衡,目前最讨巧的大模型参数可能就在60~70亿左右。未来随着AI芯片的优化,不排除可以将端侧大模型做到更大的参数、更低的功耗

端侧AI大模型成为手机厂商们的必争之地,芯片大厂也不能置身事外,正加速CPU和NPU的性能提升。2023年下半年起,高通、联发科、三星纷纷投入了这场关键决战,掉队也就意味着淘汰:

10月,高通发布第三代骁龙8,并将其定位为首个专为生成式AI而打造的移动平台。据悉,第三代骁龙8在端侧可运行超100亿参数的大模型,面向70亿参数的大预言模型每秒可生成20个token;11月,联发科发布专为生成式AI设计的第七代AI处理器 APU 790,处理速度是上一代的8倍,能实现更加高速且安全的边缘AI计算。此外,联发科官宣旗舰5G生成式AI移动芯片天玑9300,在CPU上采用“全大核”的架构,峰值性能较上一代提升40%,功耗节省33%。

Canalys 研究分析师钟晓磊表示,能够“运行”大模型的手机SoC并不少,但运行起来效率不一,大部分SoC运行大模型的速度并不尽如人意,可用性较差。从我们的角度看,以70亿参数的LLM为例,文本生成速度至少要快于普通成年人的阅读速度(约10 tokens每秒),才算是在运行效率和生成质量上达到基本的可用性

钟晓磊表示,高通骁龙8 Gen 3、联发科天玑9300目前能够符合上述要求。而随着大模型的不断优化,芯片厂商制程工艺以及架构设计的迭代,未来能够看到可以高效运行大模型的“AI手机”将向更低的价位段渗透。

AI智能手机元年,事关胜利的渴望

形容2023年的人工智能发展,很难不联想到“人工智能元年”这个词。而行至交棒时刻,“人工智能终端元年”终于顺利上位。调研机构Counterpoint Research预计,2024年生成式AI智能手机出货量有望突破1亿部,占比提升至8%;2027年出货量有望达到5.22亿部,占智能手机比重40%。另有调研机构Canalys预测数据,2024年“AI手机”出货量将达6000万部。

烈火烹油、鲜花着锦的背后,是各大手机厂商太需要一场胜利的渴望。

自2007年初代iphone发布以来,智能机取代功能机已逾十余年,各类技术创新轮番上阵,终于在2023年难掩疲态。根据Counterpoint Research最新报告,预计2023年全球智能手机出货量将同比下降5%,达到12亿台,创下近十年最低水平纪录!出货量下滑、换机周期延长,使得AI大模型与智能手机的结合势在必行,既是可以看得见的增量,也是未来生死存亡的关键。

研究分析师钟晓磊提醒,目前大模型在移动设备上的应用仍然处在早期阶段,各家对于大模型的应用还在摸索期,但已涌现不少痒点创新的特色功能。目前阶段而言,虽然杀手级的应用场景还未落地,但厂商仍旧需要巩固好自身的模型能力以及硬件能力,以防止在未来的AI竞赛中处于落后的位置

预期过高反误卿卿。目前业界对于“AI手机”功能的热望与吹捧,恐在市场上留下过高预期,2024年是否能够推出划时代的产品还要打一个问号,消费者是否能够真切感受到大模型上机后带来的巨变?此外,AI大模型与智能手机的结合,是否推高终端价格,销售业绩表现尚不可知。

但就目前而言,手机厂商在端侧大模型领域的第一轮交手暂告一段落,硝烟虽浓,战况却还谈不上激烈。2024年,随着各大主流厂商大模型的公开官宣与路径分野,手机作为最适合部署大模型的终端设备之一,显然将成为“主战场”,并在后续博弈中涌现强者。此外,在AI芯片的有力加持下,大模型手机分析能力、理解能力、记忆能力、生成能力或将迎来突飞猛进,手机厂商宣传多年的“千人千机”终有落地之时。

最后援引高通CEO Cristiano Amon在接受媒体采访时的预测,他说:“2024年将成为全球AI智能手机元年。他说,生成式AI正在‘非常、非常快’地进入手机。”