探索华为昇腾的未知面

发表时间: 2020-09-26 20:15

金磊 发自 凹非寺

量子位 报道 | 公众号 QbitAI

提到昇腾,还停留在「超强芯片」的刻板印象?

不不不,是时候重新认识一下它的「暴力美学」了——昇腾AI全栈

但为什么是AI全栈?

其实,这也影射出了华为的一个「AI观」:

仅芯片的升级、演进,不能够满足当前算力的需求。



在9月25日的华为全联接大会《开放创新,共赢多样性计算新时代》主题演讲中,华为计算产品线总裁邓泰华道出了缘由:

全生态开放创新,使能算力爆炸式增长,为数字经济提供发展新动能。

而这,也正是华为AI的下半场

华为的AI全栈,现在是一个怎样的状态?

早在2018年的华为全联接大会中,轮值董事长徐直军,便首次公布了华为AI全栈全场景的解决方案。

这一枪可谓是打响了华为AI全栈的号角。

那么,时隔两年,华为AI全栈发展得怎么样了?

在今年的HC大会上,邓泰华展示了这样一张「昇腾AI全栈」全景图

不难看出,「昇腾AI全栈」主要包括四大层面,分别是系列硬件AI算子开发AI模型开发AI应用开发



系列硬件方面,华为AI在2年时间里已经产出、积累了非常丰富的硬件。

用于推理的包括Atlas 200、Atlas 500等,可以在嵌入式设备、边缘设备使用;用于训练的包括像Atlas 800、Atlas 900等,在算力方面拥有强悍的硬实力。

今天,邓泰华还推出了最新的硬件产品,Atlas 300I。

AI算子开发方面,主要是聚焦在「异构计算架构CANN」身上。

从2018年推出1.0版本,到现在的CANN 3.0,也是仅仅用了2年时间进行迭代。

并且,目前不仅使用于推理、训练场景,还能够实现「端边云协同」。这就意味着不必在不同的终端,再去开发不同的算子,大大提高了效率。

例如,CANN从2.0到3.0版本的升级,以及ModelArts联合调优,就能让ResNet-50模型的训练时间降低到28s

接下来,是AI模型开发方面。MindSpore是华为在2019年8月推出的全场景AI计算框架,并于今年3月份正式开源。

仅6个时间,便正式推出MindSpore 1.0:一行代码实现亿级参数模型、适配不同硬件开发。

例如,用基于Ghost模块建立的神经体系结构GhostNet,结合MindSpore 1.0来做图像分类、目标检测任务,均已达到业界最优。

不仅如此,华为还计划在明年推出MindSpore 2.0版本,实现全流程极简

最后,是AI应用开发方面,MindX 1.0“极简易用”的特性,能满足那些没有深度开发能力、但想要打造行业AI应用的客户。

也就是说,只需要极少量、甚至是一行代码,就能够生成AI的应用。

以及ModelArts也已步入了3.0时代,从训练数据到模型落地一站式打通。

除此之外,还有跨越上述三个「软件层」的流程开发工具链 MindStudio2.0,涵盖了算子开发、模型训练、模型推理、应用开发和应用部署,有利于用户推出自己的开发平台。

……

至于为什么要做全栈,邓泰华做出了解释。

「我们正处于AI爆炸式增长的前夜」,他认为,「AI已然在特定领域超越人类,成为推动社会发展关键引擎」。

这也就意味着,AI从技术本身,就已经具备了场景化、规模部署的条件。

但现实却是,AI在行业的渗透率是非常低的,大约只有4%。



最直接的痛点,就是AI从算法在应用过程中面临诸多挑战,华为总结下来分为三方面,分别是算法开发难应用开发难业务部署难

「要用哪个模型?哪个算子?还有就是懂行业的人不懂AI,懂AI的人不懂行业……」,邓泰华列举了一系列的问题。

而「昇腾AI框架」,就一举解决了这些难题:

华为已经用「快、准、狠」的标准,在AI全栈「软硬件」这一块做好了铺垫。

华为AI的「上半场」已经就绪,已然是迈入「下半场」的姿态。

华为推出分布式多样性计算软件,为何而来?

华为AI的下半场,就不仅仅是单个技术的发展,而是将它们融为一个整体,继续放大华为AI全栈的能力,从而构建一个「坚不可摧」的AI生态

因此,在华为AI的下半场,只有「昇腾AI全栈」是不够的。

邓泰华在大会中还提出,已经进入分布式多样性计算时代



为此华为首次推出了分布式多样性计算软件套件**。



在这个套件中,3大关键部件是重点。

首先是性能加速库,通过算法创新,从容应对分布式多样性计算场景面临的难题。



据介绍,今年还会陆续推出机器学习库和图分析库。

其次,是华为自研的统一调度器,将于今年12月上市。

拥有三大创新突破:

  • 大规模分布式技术方面,拥有2万节点的科学计算场景,以及30万核的制造场景。
  • 关键调度算法方面,拥有百万核MPI,3分钟启动科学计算场景,
  • 多负载融合调度方面,可集成主流HPC、AI、BigData等应用;并且,资源利用率达到了90+%。

最后,是基于函数计算的分布式并行应用开发框架



这种框架可以让分布式并行应用构建,像搭积木般快速便捷。

在现场展示的开发demo中,可以节省3/4的代码量。



据介绍,分布式并行应用框架的上市时间为2021年的6月。

华为的这一步,不仅让「昇腾AI全栈」在技术本身有了提升,于开发者、于产业、于生态,有了更完备的能力。

而华为,并没有停滞于此。

人才方面如何更进一步?不仅融入学分,还培养大学教师

除了技术、产业,华为AI全栈还为生态创造了哪些价值?

人才人才,还是人才

为此,华为和教育部联合建设了一个名为「智能基座」产教融合协同育人基地的项目。

项目中的第一个举措,就是改革课程内容

华为将鲲鹏和昇腾知识融入到了22门专业学分课 (如下图),包括通用计算课程体系和人工智能课程体系。



此外,在这次的HC大会中,华为还推出了「鲲鹏」+「昇腾」系列学习教材。



据介绍,华为在未来还将陆续推出更多的相关系列教材。

举措之二,便是开展师资培训,培养一批具备鲲鹏昇腾专业知识的大学教师

华为还举办了诸如「百校教师AI峰会」等线下活动,加速了AI人才的培养,使得众多高校开发者基于Atlas 200和Atlas 200 DK开发的各类AI应用。

第三个举措就是优化实践条件,通过鲲鹏和昇腾软硬件结合的AI全栈,以及华为云的能力,强化了计算教学实践平台。



最后,华为不仅送资源,还有福利——现金支持。

从学生到教师,从课程内容到教学平台,华为AI全栈的能力也已深入到了人才、教育当中。

AI全栈的生态构建,就此更加完备。

华为AI,已然大步迈入下半场

如果用一句话来形容华为AI的最新进展,应当是:

已经大步迈入AI的下半场

当然,步入「AI的下半场」需要一个标杆:

不仅是单个技术的突破与创新,于产业、于人才,于生态,整体协同的发展。

这就是迈入AI下半场应当具备的条件。

现在,再来简单速刷一下华为AI目前的状态。

于技术,基于昇腾的软硬件各层技术已然成熟、可用,形成了一个环环相扣的紧耦合闭环,并且能力还在升级迭代当中。

于产业,基于昇腾、鲲鹏的AI全栈能力,共同开辟了一个多样性计算的时代,推动了产业的发展。

于人才,华为的「智能基座」项目,在学生、教师、资源、平台等方面都投入了大量的力度。

如此看来,华为的AI,已然迈入下半场。

你说呢?

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态