新闻资讯
5年5亿美金,华为昇腾如何构建全行业AI生态?
2018 年,在第三届 HUAWEI CONNECT(华为全联接大会)上,华为首次公布了 AI 战略与全栈全场景 AI 解决方案,其中包含全球首个覆盖全场景人工智能的华为昇腾(Ascend)系列处理器以及基于华为昇腾全栈技术的产品和云服务。
围绕昇腾芯片,华为推出了智能边缘推理、数据中心推理、开发者套件、昇腾云服务等系列产品,来帮助 AI 在云边端的落地。
硬件只是底层的基础设施,想要充分发挥昇腾的计算能力,让 AI 真正落地,就需要软硬协同,打造完整的软件栈,积极构建 AI 开发者生态。近日,在苏州举行的“2020 全球人工智能产品应用博览会”上,华为昇腾计算业务副总裁张迪煊向 CSDN 介绍了昇腾的生态构建之路,包括深度学习框架 MindSpore 开源背后的故事,以及昇腾开发工具链的进展。张迪煊表示,昇腾在基础软件上投入了 3000 多人的研发力量,让软件工具从无到有,从能用到好用,真正满足开发者的需求。未来 5 年,华为还将投入 5 亿美金来打造 AI 生态,通过与各大高校、机构、初创企业等合作,全方位、多维度支撑华为 AI 的快速发展和落地。
开源 MindSpore,构建 AI 基础能力,从学习 PyTorch 做起
今年 3 月,华为正式开源了深度学习框架 MindSpore。它对下通过 CANN 发挥芯片的能力,对上提供网络编程API,以此开发AI应用程序,并且支持 ModelArts 服务。
MindSpore 集成与借鉴了业界主流框架的优势,能够提供全场景统一的 API,可进行自动微分、自动并行、自动调优;MindSpore IR 计算图表达可以执行深度图优化等。相比同类产品,MindSpore 有三个特点,一是开发态友好,AI算法即代码;运行高效,与昇腾芯片对接;部署灵活,全场景按需协同。实际上,除了华为之外,百度、旷视等也都有开源了自家的深度学习框架 PaddlePaddle(飞桨)和 MegEngine。在谈及开源 MindSpore 的初衷时,张迪煊表示,因为业界没有框架能够真的覆盖云端边场景,而华为的业务范围决定了 MindSpore 的天然场景优势。 当然,目前业界的主流深度学习框架依然是 TensorFlow 和 PyTorch。作为一个后来者,MindSpore 在打造生态之路上采用了与 PyTorch 相似的路径:从学术界做起。 张迪煊表示,PyTorch 之所以能快速起来,是因为其用户界面非常友好,在学术界占有率越来越高,从而反哺工业界。而 MindSpore 在用户界面上和 PyTorch 比较相似,通过与高校和企业合作论文,以及开展各种大赛、活动,MindSpore 可以更容易吸引科研界的关注。 不过,作为一家硬件厂商,华为并不排斥合作。目前华为的底层硬件不仅支持 MindSpore,也支持第三方框架,并且同时在跟百度和旷视合作,提供多样化的硬件资源。 张迪煊表示,“中国应该有多个框架,供全球使用。”
CANN 3.0:基础架构作为连接硬件与软件的必由之路,而 CANN 3.0 完成了统一异构计算架构的升级。CANN 3.0 支持后向兼容和演进,只需要一套应用代码,即可兼容 10+ 种设备形态、14+ 操作系统以及多种 AI 框架。此外,CANN 3.0 提供两种算子开发方式,兼具效率和性能。目前,CANN 3.0 高性能算子库拥有 1000+ 深度优化的硬件亲和算子。
MindStudio 2.0:MindStudio 2.0 是 AI 全栈开发工具链,包括网络模型移植、应用开发、推理运行及自定义算子开发等功能,支持端到端开发,从算子开发、模型训练、模型推理、应用开发到应用部署的全流程,无需在不同工具上完成,可以显著降低开发门槛。训练过程中,可利用 Less BN(智能识别网络中不必要的 BN 算子)和随机冻结算法大幅提升模型训练效率;而在推理场景中,昇腾模型压缩工具可帮助加速推理进程。
MindX:MindX 1.0 通过 “2+1+X”助力 AI 计算融入千行百业。其中“2”是深度学习平台 MindX DL 和智能边缘平台MindX Edge;“1”是优选模型库 ModelZoo,目前已有 20 多个按场景和框架的高性能模型,预计将在今年增加到 50 以上;“X”则是使能各行业的 SDK。
所有软件都有能用到好用的过程,华为在打造开发工具的过程中也遇到过这个问题。张迪煊表示,MindStudio 2.0 就比 MindStudio 1.0 好用。每个开发者都有自己的开发习惯,比如先用另一个工具来做开发,然后用华为的工具来做部署。然而对开发者来说,软件平台的切换往往意味着较长的适应过程。针对这一问题,MindStudio 2.0 已经支持 14 个开发工具,到年底会支持 60 多个工具,而且这些工具全部实现组件化设计,并采用标准的 API,这样就可以不改变开发者原有的开发习惯,直接将 API 组件接入到 MindStudio,全程不用切换开发平台。芯片底层的开放程度也决定了开发者的效率。因为开发者必须了解芯片的底层架构,包括每个内存单元的地址,才能够进行高效调用,华为的工程师也经历过同样的困难。张迪煊举例道,“去年的时候,开发一个算子大概要一到两个月,后来(我们)对底层函数做了加速封装,将其抽象出来,大大提高了开发效率。”此外,华为在 MindStudio 2.0 还上增加了 AscnedCL 统一编程接口,解决底层的算子驱动优化问题,从而影响上层应用。 张迪煊表示,架构决定了平台在各行各业的推广能力。如果是垂直烟囱式架构,每个行业都要打造自己的烟囱,能力就没法共享,不能互通。而华为要做好水平层,然后在水平层上面构建烟囱,这样底层丰富能力就可以共享给每个烟囱。
本内容属于网络转载,文中涉及图片等内容如有侵权,请联系编辑删除
回复列表