百度发布全新端侧推理引擎Paddle Lite，支持华为NPU在线编译_AI&大模型_高琳

北京时间 8 约 21 日，InfoQ 获悉：百度深度学习平台飞桨（PaddlePaddle）发布 Paddle Lite，该推理引擎在多硬件、多平台以及硬件混合调度的支持上更加完备，是飞桨在 Paddle Mobile 的基础上进行的一次大规模升级迭代。通过对底层架构设计的改进，拓展性和兼容性等方面实现显著提升。目前，Paddle Lite 已经支持了 ARM CPU，Mali GPU，Adreno GPU，华为 NPU 以及 FPGA 等诸多硬件平台，是目前首个支持华为 NPU 在线编译的深度学习推理框架。

随着技术进步，手机等移动设备已成为非常重要的本地深度学习载体，然而日趋异构化的硬件平台和复杂的终端侧的使用状况，让端侧推理引擎的架构能力颇受挑战。端侧模型的推理往往面临着算力和内存的限制，为了能够完整的支持众多的硬件架构，并且实现在这些硬件之上人工智能应用性能的性能优化，百度飞桨基于 Paddle Mobile 预测库，融合 Anakin 等多个相关项目的技术优势，发布端侧推理引擎 Paddle Lite，通过建模底层计算模式，加强了多种硬件、量化方法、Data Layout 混合调度执行的能力，从而保障了宏观硬件的支持能力。

Paddle Lite 在架构上全新升级，并重点增加了多种计算模式（硬件、量化方法、Data Layout）混合调度的完备性设计，可以完整承担深度学习模型在不同硬件平台上的的推理部署需求，具备高性能、多硬件、多平台、扩展性强等优势。Paddle Lite 依托飞桨训练框架及其对应的丰富完整的算子库，底层算子计算逻辑与训练一致，模型完全兼容无风险，并可快速支持更多模型。

Paddle Lite 架构由四层次组成：

第一层 model 层直接接受 Paddle 训练的模型，通过模型优化工具转化为 NaiveBuffer 特殊格式，以便更好地适应移动端的部署场景；
第二层 Program 层是 operator 序列构成的执行程序；
第三层是一个完整的分析模块，主要包括 TypeSystem、SSA Graph 和 Passes 等模块；
第四层是执行层，由 Kernel 序列构成的 Runtime Program。

Paddle Lite 具有以下重要特性：

与其他端侧引擎相比，Paddle Lite 扩展性更高，框架层硬件抽象层次的描述能力强，容易对新的硬件进行集成，可以模块化地对硬件和模型进行更细致的分析和优化。

在模型支持方面，Paddle Lite 现已支持 Paddle 图像分类、检测、分割及图像文字识别等领域的模型预测，官方发布了 18 个模型的 benchmark。此外，可以通过 X2Paddle 工具将由 Caffe 和 TensorFlow 训练的模型转换后进行预测。

在硬件支持方面，目前 Paddle Lite 已支持 ARM CPU, ARM GPU、华为 NPU 和 FPGA 等硬件平台，正在优化支持的有寒武纪、比特大陆等国产 AI 芯片，并会兼容支持的 Intel、NVIDIA 等主流云端芯片。

在性能方面，Paddle Lite 针对不同微架构，进行了 kernel 的深度优化，支持 INT8 量化计算，在华为 NPU 上也具有良好的性能表现。

Paddle Lite 可针对端侧设备特点进行深度定制及优化，无第三方库依赖，整个推理过程分为模型加载解析、计算图的优化分析及设备上的高效运行。移动端可以直接部署经过优化分析的图，执行预测。Android 平台上，ARMV7 动态库只需要 800k，ARMV8 动态库仅有 1.3M，也可以根据需要，进行更深度的剪裁。

此外，Paddle Lite 还进一步完善提供了 Web 前端开发接口，支持 JavaScript 调用 GPU，可在网页端快捷运行深度学习模型。

发布

暂无评论

创作场景

百度发布全新端侧推理引擎 Paddle Lite，支持华为 NPU 在线编译

评论

cad 2024 mac下载 cad设计绘图软件,AutoCAD 2024破解版安装教程

Kyligence 正式加入华为“同舟共济”行动计划，成为行业数智化“联盟级伙伴”

Druid MySQL连接池本地实践

ZKFair 创新之旅，新阶段如何塑造财富前景

ZKFair 步入Dargon Slayer 新阶段，未来还有哪些财富效应？

仿真黑科技EasyGo DeskSim 2022

新质生产力崛起，运营商前端运营如何跃升

详解数仓对象设计中序列SEQUENCE原理与应用

containerd配置HTTP私仓

百度“超模”、三大开发神器组团出道？李彦宏2024年度演讲提前剧透！

BSN-DID研究--主题一：DID API

浅谈JVM整体架构与调优参数

SQLynx发布3.0.0版本：带来更流畅便捷的SQL开发体验

ZKFair 创新之旅，新阶段如何塑造财富前景

C++ 数学函数、头文件及布尔类型详解

ZKFair 步入Dargon Slayer 新阶段，未来还有哪些财富效应？

关于 ASP.NET Core 中的静态文件

原型图设计思路总结

你们单测覆盖率是如何统计的？原理是什么？

System.gc 之后到底发生了什么？

ZKFair 步入Dargon Slayer 新阶段，未来还有哪些财富效应？

ZKFair 创新之旅，新阶段如何塑造财富前景

假如AI圈有世纪大和解

产品经理能力模型

Databend 开源周报第 138 期

创作场景

百度发布全新端侧推理引擎 Paddle Lite，支持华为 NPU 在线编译

评论

更多内容推荐

推荐阅读

电子书

大厂实战PPT下载