深度揭秘华为AI战略软硬件两手抓,AI

北京哪个治疗白癜风医院最好 https://wapjbk.39.net/yiyuanzaixian/bjzkbdfyy/

年7月,华为总裁任正非在主题为《钢铁是怎么炼成的》的讲话中提到,“5G就是一个小儿科,过于被重视了。5G提供高带宽、低时延,支撑的是人工智能,人工智能才是大产业。”华为作为传统的ICT商,进军AI领域绝非头脑发热或盲目跟风,而是出于对自身业务整合的深入考量。AI作为当今科技界技术风口,不仅拥有广阔的潜在市场空间,同时可以将华为ICT、消费电子、IoT、云服务等业务联接起来。

本期的智能内参,我本期的智能内参,我们推荐安信证券的研究报告《华为的AI野望》,详解华为硬件和软件的AI体系,揭秘华为AI战略布局。

一、硬件体系:华为AI业务根基

1、昇腾:专注于AI场景的华为芯

昇腾+,云端两极体系已然成型。年10月10日,华为正式在全联接大会上发布昇腾和昇腾两款AI芯片。昇腾将打造Max、Mini、Lite、Tiny和Nano五大系列,以面对各种不同的应用场景。其中,昇腾属于Mini系列,昇腾属于Max系列。

▲各类昇腾芯片横跨全场景的最优表现

昇腾定位于边缘侧及端侧AI芯片,着重AI推理能力。昇腾的FP16浮点运算算力达到8TOPS,INT8整型运算算力达到16TOPS,最大功耗为8W,采用12nm制程工艺。昇腾定位于云端AI芯片,着重AI训练能力。昇腾的FP16浮点运算算力达到TOPS,INT8整型运算算力达到TOPS,最大功耗为W,采用7nm制程工艺。目前,昇腾的性能指标已在一定程度上超过了谷歌和英伟达推出的主流AI芯片。

▲昇腾与参数特征

▲主流AI芯片横向对比

达芬奇架构,锁定AI算子级别优化。针对AI计算场景,华为研发了达芬奇指令集架构,具备高算力、高能效、灵活可裁剪的特性。达芬奇架构的主要特性是针对矩阵运算的3DCube技术。AI计算过程中由于神经网络链式求导的需求,大量张量(高维矩阵)计算成为传统处理器速度的瓶颈。3DCube技术针对矩阵运算做加速,使AI核心在一个时钟周期内实现个MAC操作,从而相对CPU和GPU产生数量级的提升。

▲达芬奇架构的3DCube技术

CANN芯片算子库,工欲善其事必先利其器。CANN指神经网络计算架构,是位于芯片底层之上的芯片算子库和算子开发工具包。CANN兼具最优开发效率和算子性能,其核心是高度自动化算子开发工具TensorEngine。通过统一的DSL接口,配合预臵的高层模板封装、自动性能调优等工具集合,用户可以方便地在昇腾芯片上开发自定义算子。同时,CANN已经支持所有主要AI框架。同样在昇腾芯片上开发这个算子,通用的DSL需要63Loc,而TensorEngineDSL仅需22Loc就能实现同样的功能,开发效率提高将近3倍,是开发者提高效率的有力工具。

昇腾芯片加载板卡,Atlas一体化产品遍及全栈应用场景。华为效仿谷歌等公司的思路,并不将昇腾芯片作为一款独立的产品,而是集成板卡销售一体化产品。目前,华为已推出一些系列Atlas人工智能计算平台产品,应用领域遍及云侧至端侧全栈。传统的Atlas平台现阶段主要搭载昇腾芯片,性能有限。年华为全联接大会上,华为正式推出Atlas。Atlas搭载数千颗昇腾,是全球最快的AI训练集群。Atlas人工智能计算平台产品包括:

(1)Atlas训练集群:定位于大规模问题AI训练集群服务器。Atlas搭载数千颗昇腾,并充分利用了华为在集群通信库和作业调度平台上的技术积累。Atlas在16位浮点运算上的总算力达到-FLOPS,相当于50万台PC的计算能力。在ImageNet数据集上针对ResNet-50模型的训练时间相比于竞争对手提高了10秒,是目前AI集群计算的全球第一。

▲华为Atlas与同类产品计算耗时(秒)

(2)Atlas深度学习系统:定位于云侧训练及推理平台。Atlas提供经过优化的AI环境,预装软件环境实现开箱即用。同时,Atlas集成华为集群管理、任务调度、性能监控等功能,大幅降低企业AI应用门槛。Atlas面向AI开发者和数据科学家,提供软硬件一体式交付。

(3)Atlas智能小站:定位于边缘侧AI平台。Atlas适用于交通、看护、无人零售、智能制造等多个应用场景,可实现16路高清视频处理能力,相比业界产品性能提升4倍。同时,Atlas集成了WIFI和LTE两种无线数据接口,提供灵活的网络接入和数据传输方案。

(4)AtlasAI加速卡:本身是PCIe板卡,即可在边缘侧服务器使用,也可通过集成加载在云侧使用。Atlas支持多种数据精度,搭载昇腾芯片实现高性能计算,相比业界同类型产品提升3倍。

(5)AtlasAI加速模块:定位于端侧应用场景。Atlas本身体积极小,仅半张信用卡大小,可面向摄像头、无人机、机器人等高清视频实时分析需求类应用场景。Atlas功耗极低,近10W左右。

(6)AtlasDKAI开发者套件:定位于端侧应用场景,面向开发者提供。AtlasDKAI开发者套件基于昇腾芯片打造,核心功能通过该板上的外围接口开放,能够实现“一次开发、多端部署”。AtlasDKAI开发者套件面向平安城市、无人机、机器人、视频服务器、闸机等多个领域。

▲华为Atlas系列产品

深度参与国家项目,与鹏城实验室建立紧密合作。鹏城实验室定位于实现国家使命的基础创新平台,重点布局新一代人工智能基础研究。鹏城实验室目前在重点搭建鹏城云脑项目,其所需的基础平台是E级AI超算系统,已建成的云脑1峰值性能达PFLOPS,云脑2计划达到E级AI算力。在鹏城云脑超算平台上,鹏城实验室打造了启智章鱼计算引擎、启智代码托管平台、数字视网膜等产品。华为昇腾芯片深度参与鹏城云脑项目,目前云脑2计划整体采用搭载昇腾的Atlas训集群,以实现超强算力。

▲鹏城实验室

▲鹏城云脑

昇腾呼之欲出,进军智能汽车AI芯片。在华为发布昇腾芯片的同时,华为副董事长、轮值董事长徐直军同样表示未来还计划推出昇腾,主要面向自动驾驶场景。在智能汽车产品上,华为早在年12月就公布了自动驾驶的汽车大脑MDC,并在年高调宣布与四维图新进行合作,并已经取得了部分国内车厂订购。在昇腾芯片的加持下,MDC将得到进一步性能提升。同时,华为的昇腾芯片发展计划正在有序展开,昇腾、昇腾也将在年后逐步推出。

2、鲲鹏:智能计算的全国产数字底座

年华为全联接大会上,鲲鹏芯片再次成为焦点,多场主题演讲及专题演讲均围绕鲲鹏展开。鲲鹏包括服务器和PC机芯片,鲲鹏是业界首颗64核的数据中心处理器,性能比业界主流处理器高25%、内存带宽高60%;同时把CPU、桥片、网络和磁盘控制器“4合1”,是业界集成度最高的数据中心处理器。鲲鹏芯片按照“量产一代、研发一代、规划一代”的节奏发展,从7年走到现在已历时12年,鲲鹏现在是第三代芯片。我们认为,鲲鹏芯片不仅仅是国产化领域的数字底座,也将充当智能计算领域的数字底座,是华为战略的重要一环。

▲鲲鹏

▲鲲鹏及昇腾产品演进

完美搭佩昇腾芯片,双引擎驱动智能计算。在大规模数据中心中,服务器成本占比持续提升。根据华为云数据中心统计,服务器成本占比已超过60%。预计到年,AI算力将会占据数据中心算力的80%以上。同时,万物互联的时代正在开启,将带来数据的爆炸式增长,海量存储和密集计算将成为常态化需求。IDC预测,未来计算产业发展方向必然是多种计算架构共存,云服务的普及将会加速这一进程。鲲鹏作为华为自研的通用型计算芯片,能够最好地与AI昇腾芯片匹配,共同打造华为智能计算的异构体系。

▲鲲鹏+昇腾双引擎

打造集成产品,渗透民商两用。鲲鹏不仅仅是一款单一的芯片,更通过集成硬件进行了大量的产品拓展。鲲鹏芯片在云端的主要承载是TaiShan系列服务器,是当前兼容ARM架构的最强算力的通用服务器。面向数据中心分布式演进需求以及边缘计算需求。华为全联接大会,华为再次展出了鲲鹏主板,包括PC端与服务器端两款,并开放给合作伙伴。华为鲲鹏主板采用多合一SoC、xPU高速互联、GE高速I/O等关键技术。它不仅搭载了鲲鹏处理器,还内臵了BMC芯片、BIOS软件。目前,华为已与清华同方等合作伙伴展开合作,开发出自有品牌的服务器和台式机产品。

▲鲲鹏主板

▲数据中心成本分析

打造鲲鹏计算产业,网罗优质上下游企业。基于openEuler的OS以及配套的数据库、中间件等平台软件是鲲鹏计算产业的基础。为壮大鲲鹏计算产业,华为建立了openeuler.org社区,开源OS源代码,并提供各种基础工具,缩短厂家构建基于openEuler的发行版OS的开发周期。同时,鲲鹏计算产业将对合作伙伴进行转向支持,联合合作伙伴9个月完成0+应用的代码迁移和性能优化,计划年Q1完成重点行业标杆项目建设,可满足20%业务场景迁移至鲲鹏计算平台,形成重点行业重点业务的技术架构部署参考设计。鲲鹏在服务器、数据库、公有云等领域与大量A股上市公司建立广泛合作,共同推进产业发展。

▲鲲鹏生态合作伙伴

发布白皮书,制定发展蓝图。华为于年9月发布《鲲鹏计算产业发展白皮书》,公布了鲲鹏长期的发展蓝图。开放、共享的生态体系是鲲鹏计算产业成功的基础,要构建全行业、全场景鲲鹏计算产业体系,完成鲲鹏计算产业从关键行业试点到全行业、全场景产业链建设目标,总体上来讲,计划分为试点、推广、深化三个阶段来实现。

试点阶段:通过在政务、电信、金融和互联网等行业选取典型场景进行产业使能、孵化和试点,通过试点建立产业界上下游厂家和用户的信心。

推广阶段:面向政务、电信、互联网、广电、金融证券、电力、能源、交通等行业全面打通产业体系,为行业数字化业务创新提供基础。

深化阶段:面向全行业、全场景,打通产业链,构筑基于鲲鹏处理器的产业体系。

▲鲲鹏发展蓝图

3、麒麟:耕耘于手机AI战场的先锋

多代迭代,臻至完美。麒麟芯片由华为海思自主研制,已经历了超过12代产品迭代。麒麟芯片的前身是年推出的华为手机芯片K3V2。通过两年的技术完善,第一款正式的麒麟芯片产品麒麟于年初推出。麒麟是全球首款4核手机处理器,搭载了Mali-MP4的GPU。其后,麒麟芯片针对高端应用和低端应用手机产品分别推出了一系列产品,大幅提高了各方面性能。至麒麟,AI技术成为麒麟芯片标配,并持续迭代至今。麒麟芯片的最新产品是麒麟,其首款7nmEUV工艺打造的芯片,进一步强化了AI功能。

▲麒麟芯片产品迭代图谱

NPU自主化,打造独立自主麒麟芯。麒麟芯片的AI功能最早从寒武纪获得技术支持。通过IP核授权的方式,麒麟和麒麟分别搭载了采用寒武纪1A和寒武纪1H两款架构设计的NPU。自麒麟芯片起,麒麟芯片开始搭载基于自研达芬奇架构的NPU。最新的麒麟搭载了NPU大核+NPU微核架构设计,其正是昇腾架构的分支版本AscendLite和AscendTiny。华为在麒麟、麒麟两款芯片的转变充分说明了华为已打通手机AI芯片的底层技术,同时华为的昇腾架构也将逐步由服务器等云侧高性能计算场景逐步向端侧终端设备拓展。

▲麒麟芯片NPU架构变化

麒麟5G综合AI能力第一,彰显AI实力。根据《中国电信年终端洞察报告》及中国电信自主研发的AI评测工具AIT3.0,相比业界其他AI芯片性能,在主力网络模型、多模式调校,浮点性能和硬件算力等维度上的测评中,麒麟5G综合表现业界最佳,与此同时,麒麟也展现出强劲的AI能力。

▲麒麟5G表现出众

MATE30问世,三大AI功能领衔手机AI应用场景。年9月19日,华为在德国慕尼黑新品发布会上发布手机Mate30系列。其中,Mate30Pro正面采用“刘海”屏幕设计,可以通过3D镜头进行面部识别,同时大幅添加传感器设备。Mate30的三大创新功能成为重要亮点:

(1)智能AI使能隔空操作。传统的智能手机都需要手触屏来操作系统,包括点开APP,拍照,截屏等功能均需要触屏的支持,相比之下,MATE30可以让使用者在没有触碰屏幕的情形下,就直接操作系统。例如,利用双手握拳,达到截屏的效果。

▲Mate30AI隔空操控

(2)AI使能智能跟踪双眼视角。传统智能手机在使用期间,屏幕上的图片或者视频会跟随用户姿势转变方向。Mate30可以智能跟踪眼睛视角,以最适合我们观赏的角度来呈现,从而解放用户双手。

(3)AI功能为隐私安全保驾护航。安全隐私是手机终端使用者


转载请注明:http://www.aierlanlan.com/rzgz/1692.html