写点什么

谷歌宣布 TensorFlow Object Detection API 支持 TensorFlow 2

  • 2020-07-29
  • 本文字数:1161 字

    阅读完需:约 4 分钟

谷歌宣布TensorFlow Object Detection API支持TensorFlow 2

谷歌宣布 TensorFlow Object Detection API(OD)支持 TensorFlow 2(TF2)。该版本包含与 eager 模式兼容的二进制文件、两个新的网络架构和针对所有受支持模型的预训练权重。


软件工程师 Vivek Rathod 和研究科学家 Jonathan Huang 在 TensorFlow 博客上对新版本的新特性做了概述。大部分工作是让现有的预训练模型与 TF2 兼容,对模型代码进行移植,使用了 Keras 层,并提供权重作为 TF2 检查点。OD 框架还支持同步分布式训练,以及用于训练、评估和导出的 eager 模式二进制文件。虽然所有的新模型和新的开发工作都只与 TF2 有关,但 TF1 仍然受支持。大多数代码模块都兼容 TensorFlow 的两个版本,不兼容的模块则分成两个版本。Rathod 和 Huang 写道:


我们的想法是让 TF2 和 Keras 的所有好处都暴露出来,同时继续为 TF1 的广大用户群提供支持。


TensorFlow Object Detection API 是“一个建立在 TensorFlow 之上的开源框架,让对象检测模型的构建、训练和部署变得更加容易”。这个框架包含了一组用于管理图像数据输入和对象检测模型接口的工具。一般来说,目标检测模型的输入是一个图像,然后输出一组方框,表示在图像中检测到的物体位置。OD API 还提供了预训练“模型动物园”,这对于开发自定义对象检测应用程序非常有用。“模型动物园”包含了几种流行的深度学习计算机视觉架构,如 MobileNetResNet,它们是基于 Common Objects in Context(COCO) 2017 数据集进行训练的。


TensorFlow 2 于 2019 年 9 月发布,采用 Keras 作为定义模型的官方高级 API。Keras 最初被设想为定义神经网络的接口,支持后端,包括 TensorFlow 和 Theano。TF2 还将 eager 执行设置为默认模式,让开发和调试变得更加容易。新的 OD API 利用了这些特性。预训练的模型使用 Keras 层重新实现,权重以 TF2 检查点格式进行保存。OD 框架中的辅助代码已经经过编译,开发人员可以通过交互式的方式来调试模型。新的 OD API 还支持同步分布式训练,可以加快大型模型的训练,同时不会降低准确性(相比异步分布式训练)。


除了移植现有模型,新版本还包含了两个新的模型架构: CenterNetEfficientDet。CenterNet 使用单点来表示对象位置,而不是方框,并具备“最佳的速度和精度权衡”(基于 COCO 数据集)。EfficientDet 是一个新的对象检测模型,比之前的 SOTA 模型体积小了 4 倍到 9 倍,使用更少的 FLOP(13 倍到 42 倍)。


一名 Reddit 用户评论道:


EfficientDet 看起来真的很有前途,它们致力于通过 TF2 让训练 OD 模型变得更容易。不过我觉得 TF 团队绝对可以投入一些资源来构建一个更简单的 Object Detection API,可以从 Torch Hub、Huggingface 甚至 Tensorflow Hub 获得灵感。


Object Detection API源代码和预训练模型可以在 GitHub 上找到。


原文链接


Google Announces TensorFlow 2 Support in Object Detection API


2020-07-29 11:341725

评论

发布
暂无评论
发现更多内容

HTTP系列之:HTTP中的cookies

程序那些事

Java 网络协议 HTTP cookies

Go 专栏|复合数据类型:数组和切片 slice

AlwaysBeta

Go 语言

洞穿性能测试痛点,PerfDog以提升应用和游戏的品质为使命

WeTest

“人类先锋”点亮物联网灯塔

脑极体

重磅!博睿数据通过CMMI5级评估,国内APM领域首家

博睿数据

ShardingSphere 语句解析生成初探

源码 ShardingSphere

未来10年,5个C/C++吃香的细分领域技术

奔着腾讯去

云原生 网络安全 音视频 DPDK 虚拟化技术

Linux内核四大核心框架

hanaper

AJAX获取的日期相差8小时

hasWhere

MySQL 获取表的信息

玄兴梦影

MySQL 数据库表 查询语句

网络攻防学习笔记 Day124

穿过生命散发芬芳

9月日更 互联网安全

链路压测中各接口性能统计

FunTester

性能测试 测试框架 测试开发 FunTester 链路测试

Go 专栏|变量和常量的声明与赋值

AlwaysBeta

Go 语言

看云起云动 览开源盛世 | 亚马逊云科技中国峰会Dev Day线上来袭!

亚马逊云科技 (Amazon Web Services)

数据结构和算法在流程画布中的实际应用

GrowingIO技术专栏

数据结构 G6 图可视化引擎 流程画布

Go 专栏|基础数据类型:整数、浮点数、复数、布尔值和字符串

AlwaysBeta

Go 语言

北鲲云超算平台如何帮助现代生物制药发展?

北鲲云

AISWare AntDB 亚信数据库在多省份计费系统应用案例

亚信AntDB数据库

案例分享 #数据库 9月日更

Java + opencv 实现图片修复(图片去水印)

张音乐

Java OpenCV 音视频 9月日更 图片去水印

数据安全法真的来了,这6个“雷区”千万别踩!

腾讯安全云鼎实验室

数据安全 数据安全法

数字人民币最新技术成果将亮相2021年服贸会

CECBC

【HTML5游戏】从敲打空格键开始

devpoint

HTML5游戏 9月日更

Go 专栏|复合数据类型:字典 map 和 结构体 struct

AlwaysBeta

Go 语言

kubebuilder 构建控制器说明点

Geek_f24c45

Kubernetes kubebuilder kube-controller

LeetCode刷题278-简单-第一个错误版本

ベ布小禅

9月日更

(深入篇)漫游语音识别技术—带你走进语音识别技术的世界

声网

深度学习 音视频 语音识别

财经大课:如何看待规模化与差异化竞争

石云升

财经思维 9月日更

以两军问题为背景来演绎BasicPaxos

OpenIM

🐦【Mybatis开发指南】如何清晰的解决出现「多对一模型」和「一对多模型」的问题

洛神灬殇

Java mybatis mybatis配置 9月日更

线程同步类CyclicBarrier在性能测试集合点应用

FunTester

多线程 性能测试 线程安全 测试框架 FunTester

直播访谈-数据产品修炼之路

第519区

数据产品经理

谷歌宣布TensorFlow Object Detection API支持TensorFlow 2_大数据_Anthony Alford_InfoQ精选文章