智能手机移动SoC旗舰平台设计公司,杀出一匹黑马,震撼业界。
11月6日,联发科技(MediaTek)推出业界首个全大核架构SoC旗舰移动平台“天玑9300”。这款旗舰芯片以从所未见的“4(超大性能核心)+4(大型能效核心)”CPU架构设计,刷新行业认知。同时,这也是联发科技首款旗舰5G生成式AI移动芯片。
受益于此项架构创新,天玑9300的CPU峰值性能比前代提升幅度高达40%。同时,联发科技在旗舰芯片上一直追求的“不会为了追求高性能而放弃低功耗”原则,也在本代SoC得以体现:节省功耗达到惊人的33%。
性能升幅和功耗控制如此出色,出现最显著的应用端变化,是天玑9300带来的极速端侧AI大模型终端无延迟的优异体验。
这种体验来自联发科技刚刚发布的最强旗舰SoC移动平台创下的多项技术第一:这是业界首款集成硬件生成式AI引擎,首次提供端侧LORA融合加速技术,首次提供硬件内存压缩技术,支持10亿、70亿、130亿和最高330亿参数的端侧AI大模型……
从天玑9000开始,到2022年的天玑9200,再到这次的天玑9300,联发科技在技术创新方面亮点频闪,比其竞对苹果和高通走得更快。
就此次推出的CPU全大核架构设计看,联发科技无线通信事业部产品规划总监张耿豪很自信地认为,“从今年开始,有可能全大核就是一个新标准的规格,未来是全大核的世代。”
超强性能源自架构设计创新
天玑9300,采用台积电第三代4nm工艺制程,与高通骁龙8 Gen 3一样。
相比其前代天玑9200,本代CPU性能提升高达40%,GPU性能提升更超过了40%达46%;两者的能耗控制水平,分别提升33%和45%。
这个性能出色到何等地步呢?
通过Geekbench 6.2测试平台可以发现,天玑9300单核性能得分2215,多核则飙到7733分,后者得分一举超越目前业界所有同类旗舰。
这个表现甚至超出了摩尔定律范畴——采用台积电3nm工艺制程的苹果A17 Pro(号称地表最强移动SoC),多核性能测试分为7342(单核得分2955);高通刚刚发布的骁龙8 Gen 3,多核性能跑分为7114(单核得分2187)。
这么强悍的CPU性能,得益于天玑9300在业界首次推出的全大核架构设计。
联发科技抛弃了安卓旗舰阵营之前采用的大中小核混合架构设计模式,换用“4(超大核)+4(大核)”全新CPU架构,以此设计震撼业界。
“天玑9300是MediaTek迄今为止最强大的旗舰移动芯片,通过我们开创性的全大核架构设计,为旗舰智能手机带来令人惊叹的计算力突破。”联发科资深副总经理暨无线通信事业部总经理徐敬全博士表示,“全大核CPU结合新一代APU、GPU、ISP以及MediaTek特有的前沿技术,不仅能显著提升终端性能和能效,还将为消费者带来卓越的端侧生成式AI体验。”
在此之前,最主流的旗舰SoC移动平台CPU设计采用Arm于2011年推出的big.LITTLE架构,也就是通过大小核CPU组合,以平衡性能和功耗问题。
从技术结构上看,big.LITTLE架构是将较耗电但运算能力强的CPU核心组成的“big集群”,与低耗电但运算能力弱的CPU核心组成的“LITTLE集群”封在一起,并共享存储器区块。
2013年,三星推出首款基于big.LITTLE架构(四核Cortex-A15+四核Cortex-A7)的八核手机处理器Exynos 5410。SoC移动旗舰CPU架构由此进入“大小核时代”。
2017年5月,Arm发表DynamIQ(针对AI和ML优化)以取代big.LITTLE架构,仍沿用大小核配置思想,即“DynamIQ big.LITTLE”。此后芯片设计界开始大规模采用大小核“三丛集”架构,比如高通最新推出的骁龙8 Gen 3,就采用了“1+5+2”的“三丛集”架构;而联发科技首款采用big.LITTLE架构的处理器是MT6595,于2014年初推出。
但是,此次联发科技推出的天玑9300,采用了“全大核”CPU设计:1个3.25GHz频率的超大核Cortex-X4、3个2.85GHz的Cortex-X4超大核和4个2.0GHz频率的Cortex-A720大核。
Cortex-X4超大核和Cortex-A720大核是Arm于今年5月发布的第三代ARMv9 CPU内核。据Arm公开资料显示,Cortex-X4的性能相比上代提升15%+,功耗减少40%;Cortex-A720最明显的优势是能效提升20%。
天玑9300的CPU共八个大核为清一色乱序执行(Out-of-Order Execution)线程,能在短时间内并行完成多项任务。也就说,这能更好地应对资源拥挤时(比如多线程并行启动)的计算性能需求,还能减少执行重要任务的等待时间。
怎样做到落地AI端侧大模型
自从2022年12月OpenAI推出现象级AI应用产品“ChatGPT”至今,AI商业化具象了以往“元宇宙”过于抽象的想象方向,引爆全球AI软硬件技术创新热情,进入全新发展阶段。
但是,像ChatGPT文本或Stable Diffusion艺术创意AGIC(生成式AI:Artificial Intelligence Generated Content)工具,其动辄上千亿抑或万亿级的数据量规模,难以落地终端。这需要的内存量规模太庞大,成本和能耗均难以为C端用户承受。
现在,有了天玑9300。与出色的CPU性能相比,此次联发科技推出的天玑9300,最大的亮点在于这是联发科技首颗旗舰5G生成式AI移动芯片。
什么是生成式AI?简单一句话,即使用神经网络(NPU)识别现有数据中的模式和结构,生成新的原创内容。
5G生成式AI移动芯片的意思,通俗讲,就是在智能手机终端,无需通过网络云端,只依靠终端自带的SoC移动芯片,就能运行AI大模型;再通过各种软件和算法,最终生成各种包括文本、图片、音频、视频或3D模型等形式的新数据,从而带给C端用户以前所未有的新体验。
由生成式AI移动芯片带来的新体验的丰富程度,与该类芯片能支持多少参数的量级成正比。
联发科技官方称,天玑9300支持10亿、70亿、130亿和行业最高的330亿参数量级的端侧AI大模型。据高通官方称,其刚刚发布的骁龙8 Gen 3,能支持运行超过100亿个参数的大模型。
但是,这与天玑9300相比,参数量级有所不如。
那么联发科技,怎么做到支持如此规模参数量的?
天玑9300采用了一项被称为“NeuroPilot Compression”的硬件内存压缩技术,这在业界首次得以应用。这项技术能将130亿参数LLM(大语言模型:Large Language Model)所需的内存空间,从13GB减少到5GB。
当前配置16GB内存的顶级旗舰机,内存分配结构大致是:4GB的安卓系统内存空间,各种应用所需的内存空间约6GB;通过“NeuroPilot Compression”技术,只需5GB内存,就能顺利运行130亿参数的LLM。据联发科技官方称,搭载天玑9300运行330亿参数的端侧LLM也已成功落地。
联发科技透露了实现这种能力的部分技术细节。从LLM压缩类型看,这项技术更接近结构稀疏型。
天玑9300生成式AI真正的技术核心,是应用NeuroPilot Compression技术时无需额外编码或开发人员设定开关,只需通过NeuroPilot工具链,从模型导入工程端,完成程序构建后,集成进天玑9300(包括未来的迭代SoC版本)即可。
站在技术角度看,除了效果惊人的NeuroPilot Compression,还有transformer算子硬件加速。
天玑9300生成式AI引擎的性能,由第七代APU790支撑,整数运算和浮点运算能力是前代(第六代APU)的两倍,速度是前代的8倍。其中,transformer算子硬件加速起了关键作用。
此外,APU 790支持生成式AI模型端侧技能扩充技术NeuroPilot Fusion,这也是业界首次提供提供端侧 LORA 融合加速技术。
NeuroPilot Fusion能基于标准大模型持续在端侧做低秩自适应(LoRA,Low-Rank Adaptation)融合;通过加持混合式AI,基于1个基础大模型,通过云端训练,在端侧完成N个功能的融合,赋予基础大模型更全面、更丰富的生成式AI应用能力。
这是搭载天玑9300旗舰智能手机,在未来基于端侧AI大模型,形成与其他旗舰SoC移动平台的全新AI体验,最大的差异化区别所在。
有必要对搭载天玑9300的智能终端,在端侧落地生成式AI大模型做个技术小结:通过NeuroPilot Compression硬件内存压缩技术、端侧技能扩充技术NeuroPilot Fusion和transformer算子硬件加速技术,天玑9300在端侧落地AI大模型的性能,在业界实现登顶。
引领安卓SoC全大核设计潮流
天玑9300就CPU性能、全大核架构和逆天的端侧AI性能而言,堪称联发科技有史以来最强芯片,同时也是业界近年来少见的技术创新先锋担当。
芯片制造技术发展到今天,若说摩尔定律失效,或许过于夸张,但摩尔定律放缓,确是不争的事实。比如采用台积电3nm工艺制程的“地表最强芯片”苹果A17 Pro,与采用台积电4nm工艺制程的天玑9300相比,单核性没能实现翻倍,多核性能甚至有所不如。
对于这个问题,业界IDM头部公司三星电子和专业晶圆代工商台积电,不约而同,都将资源投向了先进封装领域,以此延长摩尔定律的生命周期。当然,这两家公司并非在摩尔定律确定放缓的今天才做的战略布局,而是早在十多年前就已落子。
所以说,业界巨头之所以成为巨头,是因为这些公司都具有洞察行业未来的眼光、改变现状的勇气和实打实的技术创新。
比如三星电子在从台积电虎口抢单苹果A7处理器代工时的绝招——封装体叠层(POP:Package on Package)技术,实现了A7芯片在成本、性能和体积上的巨大迭代优势;台积电则早在2011年就推出了如今大名鼎鼎的CoWoS(Chip on Wafer-on Substrate)封装技术,对提升AI加速卡性能意义非凡。
延长摩尔定律的生命周期,除了改进封装技术,为什么不能改进CPU架构?
联发科技推出的天玑9300:这款芯片最大的技术创新,就是在旗舰芯片上放弃了Arm已推出12年的big.LITTLE架构和其已落地5年的迭代版DynamIQ big.LITTLE架构,替之以全大核CPU架构设计。
事实证明,天玑9300的CPU性能强劲。作为旗舰级移动平台,图形处理器(GPU)性能也广受关注。
天玑9300内置12核的Arm Immortalis-G720图形处理器,延续了前代Arm Immortalis-G715带来的硬件级加速的光线追踪能力,峰值性能提升46%,功耗节省40%。因此,天玑9300能支持60FPS(每秒传输帧数:Frame Per Second)高流畅度的光线追踪游戏。
据联发科公布的官方数据显示,以GFXBench v5.0.5 1440P Aztec Ruins Vulkan软件测试,天玑9300的GPU性能成绩99FPS,高于高通骁龙8 Gen3和苹果A17 Pro。
华尔街见闻注意到,最近两年以来,联发科技技术创新数次引领行业跟进。比如2022年11月发布的天玑9200,在移动端首次实现硬件级加速的光追技术,由此开启移动端光线追踪时代。随后,高通、苹果和三星等芯片大厂纷纷跟进。
此次发布的天玑9300,从各个测试软件平台的测试结果看,CPU全大核设计架构确实大幅提升了性能和能效。未来AI端侧大模型要落地,对SoC的性能和能效要求必将越来越高,传统的DynamIQ big.LITTLE架构大概率会被天玑9300这种全大核架构替代。
站在端侧性能要求和移动端SoC具备的能力匹配度角度观察未来,用联发科技无线通信事业部技术规划总监李俊男的话来说,“我相信到明年,我们还可以证明全大核架构设计(对于行业的带动意义),其他对手明年预计也会跟上。”
张耿豪认为,“全大核架构,我们相信,明年大家都会采用这个设计方式。所以我们能说,我们引领了这个新潮流。苹果也采用了类似的设计架构,全行业都会跟进。所以从今年开始,全大核很可能就是一个新标准的规格,未来是一个全大核的世代。”
*以上内容不构成投资建议,不代表刊登平台之观点,市场有风险,投资需谨慎,请独立判断和决策。