HarmonyOS开发者限时福利来啦!最高10w+现金激励等你拿~ 了解详情
写点什么

谷歌用于图像识别的机器学习模型已移植至 TensorFlow 并已开源

  • 2016-11-03
  • 本文字数:964 字

    阅读完需:约 3 分钟

随着 announcement 宣布将用于图像识别的 TensorFlow 模型,以及对新老方法的精确度和性能进行比较评测的测试方法开源,谷歌 Google 在过去几年中迈上了一段全新的旅程。2014 年的 Inception V1 ,2015 年的 Inception V2 ,以及最新发布的 Inception V3 模型逐渐完善,分别以 89.6%、91.8%,以及 93.9% 准确度的成绩位居 ImageNet 2012 图像分类测试的前五名。在使用 BLEU -4 指标衡量机器生成的注解的测试中,通过将一种自然语言的语句翻译成另一种语言并对准确度进行比较,基于TensorFlow 的方法相比原本最先进的 DistBelief 模型也取得了领先两分的成绩。

在从原有实现中移植模型,并对其进行完善的过程中,最重要的问题之一在于对图像中的对象进行分类,以及对对象进行描述并将一张图像中的对象与另一张图像中的对象进行关联。为了解决这一问题,该模型在分类操作之外增加了一个微调操作,可以让模型提取用于描述对象细节的有用信息。通过将图像分类操作拆分为多个步骤,首先识别其他操作中确定的对象,并增加形容和预处理操作,并为要处理的注解提供必要的结构,使其在语句结构上更为准确,更类人。

该模型有一个范例:识别铁轨上的火车图像,随后识别火车为黄色夹杂着蓝色。最终合成的结果识别为:黄蓝相间的火车正行驶在铁轨上。虽然在本例中模型能否确定静态图片中对象是运动中的或静止的并不重要,但所输入图像的注解在训练数据中将类似图像中的对象描述为运动中的或静止的,这很重要。

该模型可将之前学习到的图像注解中的不同元素组合在一起,针对更多图像创建全新的注解,新的图像中可以包含多个已分类对象,但所有对象并未包含在同一个训练数据集中。在这个范例中,该模型自行创建出一个之前并不存在的注解。

在对原有模型的实现与新的模型进行性能评测对比发现,在通过Nvidia K20 GPU 运行DistBelief 以及全新的基于TensorFlow 的Inception V3 进行的性能对比中,TensorFlow 的训练时间(0.7 秒)仅为DistBelief(3.0 秒)的25%。除了基于TensorFlow 的Inception V3 图像分类模型,谷歌还提到了即将发布 Inception-ResNet-v2 模型,但并未谈到有关该模型的性能评测信息。虽然未使用训练数据集,但他们会通过人工生成的图像注解作为最基础的训练数。

查看 **** 英文原文 Google Machine Learning Models for Image Captioning Ported to TensorFlow and Open-Sourced

2016-11-03 19:005338
用户头像

发布了 283 篇内容, 共 106.6 次阅读, 收获喜欢 62 次。

关注

评论

发布
暂无评论
发现更多内容

IPv6的优势分析

天翼云开发者社区

ipv6

低代码提升开发能力的思路

伤感汤姆布利柏

奇绩创坛 2025 春季创业营开始报名

奇绩创坛

奇绩创坛 奇绩创坛创业营

台媒报道:华为云携手赞奇科技 推出《黑神话:悟空》专属云游戏服务

轶天下事

易观分析:2024年第2季度中国电商直播市场交易规模达10604亿元 退货问题折射行业转型急迫性

易观分析

电商直播

这应该是全网最详细的Vue3.5版本解读

快乐非自愿限量之名

JavaScript Vue 前端

海外网络加速方案:解决海外访问难题

Ogcloud

网络加速 海外网络加速 企业网络加速 网络加速服务

以太坊基金会AMA总结:面对ETH价格疲软,团队的应对策略与展望

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 NFT开发 代币开发

电商数据抓取新技能:京东商品详情API返回值分析

技术冰糖葫芦

api 网关 API Explorer API 策略 pinduoduo API

第八届未来网络发展大会在宁召开,天翼云“息壤”助力算力互联互通一体化调度!

天翼云开发者社区

云计算 网络安全 网络发展大会

跨越山海,台湾媒体点赞《黑神话:悟空》云游戏服务

轶天下事

奖项再+1!通义灵码智能编码助手通过可信 AI 智能编码工具评估,获当前最高等级

阿里巴巴云原生

阿里云 云原生 通义灵码

奖项再+1!通义灵码智能编码助手通过可信 AI 智能编码工具评估,获当前最高等级

阿里云云效

阿里云 云原生 通义灵码

数业智能心大陆告诉你如何培养孩子的批判性思维?

心大陆多智能体

智能体 AI大模型 心理健康 数字心理

ping命令使用及其常用参数

天翼云开发者社区

ping

Java线程池详解

快乐非自愿限量之名

Java

云行| 云端释放“黔”力,天翼云赋能贵州“智”变!

天翼云开发者社区

人工智能 云计算 大数据

通义灵码怎么样?分为哪些版本,看看基础能力多少分?

阿里云云效

阿里云 云原生 通义灵码

大学生必备!华为手机校园智慧锦囊,一机在手,万事无忧

最新动态

消费全返免单系统模式开发技术讲解

V\TG【ch3nguang】

数业智能心大陆:揭秘如何利用AI做心理疗愈

心大陆多智能体

智能体 AI大模型 心理健康 数字心理

东郊到家平台系统模式开发功能部署设计未来展望

V\TG【ch3nguang】

NFC碰一碰刷卡、AI功能……2024年大学生都在关注手机哪些功能?

最新动态

西游再现!一键部署 Flux 文生图大模型生成西游人物

阿里巴巴云原生

阿里云 云原生

三分钟全面了解低代码,两小时实现应用系统搭建

EquatorCoco

低代码 系统搭建

功能发布-自定义SQL查询

ClkLog

sql 开源 自定义标签

通义灵码怎么样?分为哪些版本,看看基础能力多少分?

阿里巴巴云原生

阿里云 云原生 通义灵码

蚂蚁数科发布智能数据开发与治理平台DataFab 加速数据要素价值释放

Lily

IoTDB 端边云同步:SQL 一键搞定 5 大常见场景

Apache IoTDB

中国传媒业人工智能应用发展图谱2024

易观分析

人工智能’

美联储降息在即:加密市场风云再起,机遇与挑战并存

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 NFT开发 公链开发

谷歌用于图像识别的机器学习模型已移植至TensorFlow并已开源_AI&大模型_Dylan Raithel_InfoQ精选文章