11 月 11 日,华为技术沙龙·昇腾专场来到深圳,由华为多位 AI 领域技术专家,围绕华为全栈全场景 AI 解决方案,通过 Atlas 人工智能计算平台与基于全栈开发工具链 Mind Studio 进行 AI 开发的实践案例,为现场开发者深度解读了 AI 开发的技术难点与行业解决方案应用。
深圳湾科技发展有限公司董事长邱文、华为 Atlas 领域总裁许映童等领导也出席了本次沙龙,并做了开场致辞。许映童总裁表示:华为坚持战略投入,持续创新,通过解决世界级计算技术难题,为世界提供最强算力。借助本次沙龙,希望与大家共同探讨昇腾生态的合作机遇,并且跟深圳湾科技园区的企业代表和技术专家进一步开展深入交流。
一、打造全栈全场景 AI 生态,赋能 AI 技术开发者
随着计算产业的智能化升级,AI 已成为数据中心、边缘计算、终端的基础能力,预计到 2025 年,AI 算力将会占据数据中心算力的 80% 以上,AI 芯片 75% 部署在边缘,海量的 AI 算力需求将带动全球人工智能市场增长。
从技术上来看,人工智能发展可划分为三个阶段:
弱人工智能,擅长单个方面的人工智能(如图像、语音、内容分析等);
强人工智能,具备认知和推理能力,能够比肩人类大脑;
超人工智能,具备感知和思想意识,几乎在所有领域都能超越人类,包括科学创新和社交等。
目前,人工智能应用还处在弱人工智能阶段,随着融合视频分析 / 语义理解、自行判断、自主决策等深度学习 / 强化学习算法的成熟完善,将推动各个行业向强人工智能阶段迈进。
华为智能计算生态发展部总监区俊彦表示,计算产业生态的构建将非常关键且具有一定挑战性,目前,华为已经形成了以“鲲鹏 + 昇腾”为核心的双引擎计算战略,并打造出包括芯片、芯片使能、训练和推理框架以及应用使能在内的全堆栈解决方案。
芯片上,基于昇腾 310 芯片的 Atlas 推理型行业场景解决方案已在 50+ 行业上应用,涉及安防、金融、电力、交通、互联网、运营商等,并从成熟的互联网、智慧城市,逐步融入到传统行业,成为传统行业智能化升级的引擎。
随着昇腾 910 AI 处理器以及 MindSpore 全场景 AI 计算框架的推出,华为 Atlas 人工智能计算平台将在端、边、云上,实现训练和推理全系列产品竞争力构建,实现超强算力,全场景部署和云边端协同,加速华为 AI 在各行业的应用落地。
未来五年华为将围绕昇腾投入数十亿人民币来助力 AI 产业的发展。通过“1 平台 +3 计划”的措施,逐步开放昇腾的技术能力,开源 AI 训练框架,投入华为的技术资源和营销资源,打造一个支撑人工智能产业发展的平台,使能华为的合作伙伴和开发者。
同时,华为还将通过与产业组织、研究机构和行业协会的广泛合作,共谋人工智能的创新发展,共同孵化产业标准。
在开源开放上,区俊彦表示,华为坚定的执行开放和开源的战略,在 2019 年底会全面开放 CANN 工具链,支撑合作伙伴自定义算子,更好的来应用和挖掘昇腾芯片的能力。还将对外发布 TBE 算子开发工具,借助高校、研究机构和合作伙伴的力量,共同丰富昇腾的算子,来支撑更多的网络模型,而完成的算子和模型将会进行开源,方便开发者来使用和优化算子和模型。
二、AI 全栈开发工具链应用实践
华为提出的全栈全场景 AI 解决方案,把 AI 推向新高度。而打造面向端、边、云的全栈全场景 AI 解决方案,简单易用、高效率的工具成了 AI 开发者的诉求,为此华为推出了 AI 全栈开发工具链——Mind Studio。
据华为 AI 专家谭涛介绍,Mind Studio 是一套基于华为 Ascend 芯片开发的 AI 全栈开发工具链,包括基于芯片的算子开发、模型开发与转换,AI 应用层开发等能力,让用户的算子、模型和应用最大限度的发挥出芯片的计算能力,又通过场景化的工具体验降低算子、模型、AI 应用的开发门槛。
Mind Studio 可提供面向 AI 算子开发、模型开发、应用开发的全栈全场景支持。算子开发上,支持 TBE 自定义算子、 支持 TBE 自定义算子插件开发、支持语法的智能纠错和代码自动补全;模型开发支持离线模型转换、支持模型算子精度比对、支持模型整网性能 profiling 分析、支持网络模型的可视化;应用开发支持 AI 应用开发与调试、支持代码框架自动生成、支持推理结果图形化展示、支持全系统调优。
模型转换是当前很多开发者最常用的功能之一,许多开发者都是基于开源的模型开发应用,比如 Tensorflow 或者 Caffe 的模型。基于 Mind Studio 工具链可以把开源的 Tensorflow、Caffe 模型转换成昇腾支持的格式。
在转换过程中,开发者还可以配置模型中的输入和输出节点,量化配置参数,图像预处理的参数,生成满足开发者输入要求的更高效 om 模型。
算子比对工具可以对已经生成的模型和基准的模型(如 Caffe 模型)进行算子的比对,比对的方式可以选择不同的算法,如 LowerBound 等。算子比对的结果可以发现出模型中各个算子计算结果的偏差,通过对偏差的大小设置,开发者可以快速定位出偏差较大的算子并进行优化。
AI 应用的开发中,对应用中的各个引擎(如数据预处理、模型推理、后处理等)进行分析,可以发现整个应用中的引擎的性能瓶颈,继而再优化。整网运行过程中除了可以获取到软件栈的时间轴数据外,还能获取 AI 处理器设备上的硬件数据。
Mind Studio 针对 TBE 的语法可进行高亮,支持定义的跳转,引用查看和智能补全等功能。方便用户进行算子插件和 AI 应用的编译和调试。
三、解读昇腾云服务
昇腾云服务器性能提升 2 倍以上,可广泛用于 AI 推理、AI 训练、自动驾驶训练等场景。同时,昇腾还带来更多价值,比如在自动驾驶云服务上,利用超大规模集群能力可支持 PB 级数据的实时处理,端到端开发效率提升 5 倍以上。
而基于昇腾云服务器的全栈全场景 AI 解决方案, 华为云异构计算产品经理赵刚也给出了更深入的解读。赵刚表示,华为云推出了昇腾云服务器实例家族。基于昇腾 310 的推理实例,提供高性价比 AI 推理算力。基于昇腾 910 的训练实例,成倍提升训练效率。
目前华为云昇腾云服务器解决方案已在视频直播、智慧零售、智慧园区、泛金融身份认证、智慧医疗领域上应用。用于图片分类、智能鉴黄、行为识别、画质检测、违规审核、人脸识别、物体识别、文字识别、语音识别等技术上,为客户业务提质提速。
评论