探索华为昇腾的未知面

发表时间: 2020-09-26 20:15

金磊发自凹非寺
量子位报道 | 公众号 QbitAI

提到昇腾，还停留在「超强芯片」的刻板印象？

不不不，是时候重新认识一下它的「暴力美学」了——昇腾AI全栈。

但为什么是AI全栈？

其实，这也影射出了华为的一个「AI观」:

仅芯片的升级、演进，不能够满足当前算力的需求。

在9月25日的华为全联接大会《开放创新，共赢多样性计算新时代》主题演讲中，华为计算产品线总裁邓泰华道出了缘由：

全生态开放创新，使能算力爆炸式增长，为数字经济提供发展新动能。

而这，也正是华为AI的下半场。

华为的AI全栈，现在是一个怎样的状态？

早在2018年的华为全联接大会中，轮值董事长徐直军，便首次公布了华为AI全栈全场景的解决方案。

这一枪可谓是打响了华为AI全栈的号角。

那么，时隔两年，华为AI全栈发展得怎么样了?

在今年的HC大会上，邓泰华展示了这样一张「昇腾AI全栈」全景图。

不难看出，「昇腾AI全栈」主要包括四大层面，分别是系列硬件、AI算子开发、AI模型开发和AI应用开发。

在系列硬件方面，华为AI在2年时间里已经产出、积累了非常丰富的硬件。

用于推理的包括Atlas 200、Atlas 500等，可以在嵌入式设备、边缘设备使用；用于训练的包括像Atlas 800、Atlas 900等，在算力方面拥有强悍的硬实力。

今天，邓泰华还推出了最新的硬件产品，Atlas 300I。

在AI算子开发方面，主要是聚焦在「异构计算架构CANN」身上。

从2018年推出1.0版本，到现在的CANN 3.0，也是仅仅用了2年时间进行迭代。

并且，目前不仅使用于推理、训练场景，还能够实现「端边云协同」。这就意味着不必在不同的终端，再去开发不同的算子，大大提高了效率。

例如，CANN从2.0到3.0版本的升级，以及ModelArts联合调优，就能让ResNet-50模型的训练时间降低到28s。

接下来，是AI模型开发方面。MindSpore是华为在2019年8月推出的全场景AI计算框架，并于今年3月份正式开源。

仅6个时间，便正式推出MindSpore 1.0：一行代码实现亿级参数模型、适配不同硬件开发。

例如，用基于Ghost模块建立的神经体系结构GhostNet，结合MindSpore 1.0来做图像分类、目标检测任务，均已达到业界最优。

不仅如此，华为还计划在明年推出MindSpore 2.0版本，实现全流程极简。

最后，是AI应用开发方面，MindX 1.0“极简易用”的特性，能满足那些没有深度开发能力、但想要打造行业AI应用的客户。

也就是说，只需要极少量、甚至是一行代码，就能够生成AI的应用。

以及ModelArts也已步入了3.0时代，从训练数据到模型落地一站式打通。

除此之外，还有跨越上述三个「软件层」的全流程开发工具链 MindStudio2.0，涵盖了算子开发、模型训练、模型推理、应用开发和应用部署，有利于用户推出自己的开发平台。

……

至于为什么要做全栈，邓泰华做出了解释。

「我们正处于AI爆炸式增长的前夜」，他认为，「AI已然在特定领域超越人类，成为推动社会发展关键引擎」。

这也就意味着，AI从技术本身，就已经具备了场景化、规模部署的条件。

但现实却是，AI在行业的渗透率是非常低的，大约只有4%。

最直接的痛点，就是AI从算法在应用过程中面临诸多挑战，华为总结下来分为三方面，分别是算法开发难、应用开发难、业务部署难。

「要用哪个模型？哪个算子？还有就是懂行业的人不懂AI，懂AI的人不懂行业……」，邓泰华列举了一系列的问题。

而「昇腾AI框架」，就一举解决了这些难题：

华为已经用「快、准、狠」的标准，在AI全栈「软硬件」这一块做好了铺垫。

华为AI的「上半场」已经就绪，已然是迈入「下半场」的姿态。

华为推出分布式多样性计算软件，为何而来？

华为AI的下半场，就不仅仅是单个技术的发展，而是将它们融为一个整体，继续放大华为AI全栈的能力，从而构建一个「坚不可摧」的AI生态。

因此，在华为AI的下半场，只有「昇腾AI全栈」是不够的。

邓泰华在大会中还提出，已经进入分布式多样性计算时代。

为此华为首次推出了分布式多样性计算软件套件**。

在这个套件中，3大关键部件是重点。

首先是性能加速库，通过算法创新，从容应对分布式多样性计算场景面临的难题。

据介绍，今年还会陆续推出机器学习库和图分析库。

其次，是华为自研的统一调度器，将于今年12月上市。

拥有三大创新突破：

大规模分布式技术方面，拥有2万节点的科学计算场景，以及30万核的制造场景。
关键调度算法方面，拥有百万核MPI，3分钟启动科学计算场景，
多负载融合调度方面，可集成主流HPC、AI、BigData等应用；并且，资源利用率达到了90+%。

最后，是基于函数计算的分布式并行应用开发框架。

这种框架可以让分布式并行应用构建，像搭积木般快速便捷。

在现场展示的开发demo中，可以节省3/4的代码量。

据介绍，分布式并行应用框架的上市时间为2021年的6月。

华为的这一步，不仅让「昇腾AI全栈」在技术本身有了提升，于开发者、于产业、于生态，有了更完备的能力。

而华为，并没有停滞于此。

人才方面如何更进一步？不仅融入学分，还培养大学教师

除了技术、产业，华为AI全栈还为生态创造了哪些价值？

人才，人才，还是人才。

为此，华为和教育部联合建设了一个名为「智能基座」产教融合协同育人基地的项目。

项目中的第一个举措，就是改革课程内容。

华为将鲲鹏和昇腾知识融入到了22门专业学分课 （如下图），包括通用计算课程体系和人工智能课程体系。

此外，在这次的HC大会中，华为还推出了「鲲鹏」+「昇腾」系列学习教材。

据介绍，华为在未来还将陆续推出更多的相关系列教材。

举措之二，便是开展师资培训，培养一批具备鲲鹏昇腾专业知识的大学教师。

华为还举办了诸如「百校教师AI峰会」等线下活动，加速了AI人才的培养，使得众多高校开发者基于Atlas 200和Atlas 200 DK开发的各类AI应用。

第三个举措就是优化实践条件，通过鲲鹏和昇腾软硬件结合的AI全栈，以及华为云的能力，强化了计算教学实践平台。

最后，华为不仅送资源，还有福利——现金支持。

从学生到教师，从课程内容到教学平台，华为AI全栈的能力也已深入到了人才、教育当中。

AI全栈的生态构建，就此更加完备。

华为AI，已然大步迈入下半场

如果用一句话来形容华为AI的最新进展，应当是：

已经大步迈入AI的下半场。

当然，步入「AI的下半场」需要一个标杆：

不仅是单个技术的突破与创新，于产业、于人才，于生态，整体协同的发展。

这就是迈入AI下半场应当具备的条件。

现在，再来简单速刷一下华为AI目前的状态。

于技术，基于昇腾的软硬件各层技术已然成熟、可用，形成了一个环环相扣的紧耦合闭环，并且能力还在升级迭代当中。

于产业，基于昇腾、鲲鹏的AI全栈能力，共同开辟了一个多样性计算的时代，推动了产业的发展。

于人才，华为的「智能基座」项目，在学生、教师、资源、平台等方面都投入了大量的力度。

如此看来，华为的AI，已然迈入下半场。

你说呢？

— 完 —

量子位 QbitAI · 头条号签约

关注我们，第一时间获知前沿科技动态

探索华为昇腾的未知面

华为的AI全栈，现在是一个怎样的状态？

华为推出分布式多样性计算软件，为何而来？

人才方面如何更进一步？不仅融入学分，还培养大学教师

华为AI，已然大步迈入下半场

热门阅读

推荐阅读