TensorFlow模型优化工具包增加新功能，可将深度学习模型缩小一半_AI&大模型_陈思



 写点什么

登录/注册

北京时间 8 月 7 日，TensorFlow 官方在 Medium 博客上更新了一篇文章，宣布为模型优化工具包添加了一项新功能：半精度浮点量化工具，据介绍，该工具能够在几乎不损失精度的情况下，将训练模型缩小一半，还能改善 CPU 和硬件加速器延迟。

TensorFlow 团队将训练后的半精度浮点量化作为模型优化工具包的一部分，这一套工具包括了混合量化，全整数量化和修剪等功能。

通过牺牲极少的精度，训练后的半精度浮点量化成功缩小了 TensorFlow Lite 模型的尺寸（高达 50％），并将模型常数（如权重和偏差值）从全精度浮点（32 位）为精度降低的浮点数据类型（IEEE FP16）。

训练后的半精度浮点是训练 TensorFlow Lite 模型的好工具，因为它对精度的影响极小并且模型尺寸显着减小。

感兴趣的读者可以点击这里查看相关文档，以便解不同的量化选项和方案。

降低精度的好处

降低精度有很多好处，特别是在部署到边缘时：

模型尺寸减少 2 倍。模型中的所有常量值都存储在 16 位浮点数而不是 32 位浮点数中。由于这些常数值通常在整个模型尺寸中占主导地位，因此通常会将模型的尺寸减小约一半。
精确度损失可忽略不计。深度学习模型经常能够在推理上产生良好的结果，同时使用比最初训练时更少的精度。在对几个模型的实验中，研发人员发现推理质量几乎没有损失（见下面的结果）。

尺寸缩小 2 倍，精度折衷可忽略不计

训练后的半精度浮点量化对精度的影响很小，但可以使深度学习模型的大小缩小约 2 倍。例如，以下是 MobileNet V1 和 V2 型号以及 MobileNet SSD 型号的一些结果。MobileNet v1 和 v2 的准确度结果基于ImageNet图像识别任务。在COCO对象识别任务上评估 SSD 模型。

模型准确性

通过将标准 Mobilenet float32 模型和 fp16 变体分别在：ILSVRC 2012 图像分类任务，以及 COCO 对象检测任务上进行了评估，研发人员得到了如下的结果：

如何启用后训练半精度浮点量化

开发者可以在 TensorFlow Lite 转换器上指定训练后的半精度浮点量化，方法是使用训练好的 float32 模型，将优化设置为 DEFAULT，并将目标规范支持的类型设置为半精度浮点常量：

import tensorflow as tf converter = tf.lite.TFLiteConverter.from_saved_model(saved_model_dir) converter.optimizations = [tf.lite.Optimize.DEFAULT] converter.target_spec.supported_types = [tf.lite.constants.FLOAT16] Tflite_quanit_model = converter.convert()

复制代码

转换模型后即可直接运行，就像任何其他 TensorFlow Lite 模型一样。默认情况下，模型将通过将 16 位参数“上采样”为 32 位，然后在标准 32 位浮点运算中执行操作来在 CPU 上运行。

开发者还可以在 GPU 上运行模型。研发团队已经增强了 TensorFlow Lite GPU 代理，以接收精简参数并直接运行（不需要像在 CPU 上那样转换为 float32）。在应用程序中，开发者可以通过 TfLiteGpuDelegateCreate 功能创建GPU 代理。指定代理的选项时，请务必设置 precision_loss_allowed 为 1：

//Prepare GPU delegate.  const TfLiteGpuDelegateOptions options = {    .metadata = NULL,    .compile_options = {      .precision_loss_allowed = 1, // FP16      .preferred_gl_object_type = TFLITE_GL_OBJECT_TYPE_FASTEST,      .dynamic_batch_enabled = 0, // Not fully functional yet    },  };

复制代码

有关 GPU 代理的概述，请参阅此链接：

https://medium.com/tensorflow/tensorflow-lite-now-faster-with-mobile-gpus-developer-preview-e15797e6dee7

查看使用半精度浮点量化的工作示例请点这里：

https://github.com/tensorflow/tensorflow/blob/master/tensorflow/lite/g3doc/performance/post_training_float16_quant.ipynb

创作场景

TensorFlow 模型优化工具包增加新功能，可将深度学习模型缩小一半

降低精度的好处

尺寸缩小 2 倍，精度折衷可忽略不计

模型准确性

如何启用后训练半精度浮点量化

评论

软件测试 | 测试开发 | 一步一步学测试平台开发-Vue restful请求

软件测试 | 测试开发 | Frida 实现 Hook 功能的强大能力

软件测试 | 测试开发 | 静态扫描体系集成

软件测试 | 测试开发 | 测试右移之logstash完整配置实例

软件测试 | 测试开发 | Jenkins中，如何管理用户及其相对应权限？

持续测试成熟度模型

软件测试 | 测试开发 | 接口抓包分析与Mock实战

毕业后什么都不会，找了个培训班学软件测试学了4个月，拿到offer，坐等入职

新零售SaaS架构：中央库存系统架构设计

软件测试 | 测试开发 | 实战演示 H5 性能分析

软件测试 | 测试开发 | Pytest 结合 Allure 生成测试报告

软件测试 | 测试开发 | 通用 api 封装实战，带你深入理解 PO

从启动到关闭 | SeaTunnel2.1.1源码解析

Qualcomm Atheros wallys QCA9880 Dual Band 2.4GHz 5GHz 2x2 MIMO 802.11ac Mini PCIE WiFi Module//QCA9882 3x3 FCC/CE/IC

Java 8的新特性

9个方法预防租赁LED显示屏舞台隐患

软件测试 | 测试开发 | Jenkins通过什么方式报警？

软件测试 | 测试开发 | 做到这几点，你也能成为 BAT 的抢手人！

Log4j2远程执行代码漏洞如何攻击? 又如何修复

软件测试 | 测试开发 | 测试平台开发-前端开发之数据展示与分析

软件测试 | 测试开发 | 搞清楚这六个能力模型，轻松应对互联网裁员潮

ElasticSearch 不停服升级实践

软件测试 | 测试开发 | 实战演练基于加密接口测试测试用例设计

软件测试 | 测试开发 | 测试左移之Sonarqube maven项目分析

软件测试 | 测试开发 | 学做测试平台开发-Vuetify 框架

软件测试 | 测试开发 | 如何安装Jenkins 插件？

技术分享 | 实战演练

JVM——内存泄漏与内存溢出

软件测试 | 测试开发 | 测试平台开发-前端开发之Vue router路由设计

秋招收到10几个offer 说说我的想法吧

喜报！霍格沃兹第二届火焰杯软件测试高校选拔赛荣获大奖

创作场景

TensorFlow 模型优化工具包增加新功能，可将深度学习模型缩小一半

降低精度的好处

尺寸缩小 2 倍，精度折衷可忽略不计

模型准确性

如何启用后训练半精度浮点量化

评论

更多内容推荐

推荐阅读

电子书

大厂实战PPT下载