速来报名!AICon北京站鸿蒙专场~ 了解详情
写点什么

Google 使用 3 亿张图片大幅度改进图像识别算法

  • 2017-08-03
  • 本文字数:671 字

    阅读完需:约 2 分钟

Google 和 CMU 的研究员使用 3 亿张图片,在图像识别算法的几个指标上取得了长足改进,而往常的训练一般只使用一百万张图片。

很多开发者在训练物体检测算法时会使用包含一百万张图片的 ImageNet 数据集。这个数据集从 2011 年起就没有新图片加入了。然而,在该数据集上训练的神经网络中的参数数量与日俱增,训练模型的 GPU 算力也在增加。卡内基梅隆大学(CMU)中 Google 的研究人员和科学家提出:如果增加训练数据量会如何?

于是,Google 建立了一个内部数据集,含有3 亿张图片,标记为18291 个类别。图片标注的来源包括原始网络信号,网页之间的联系,以及用户的反馈。因为不是由人标注的,所以含有20% 的噪音。

结论是:增大数据量果然有益。虽然图片标记含有噪音,算法的准确率还是提高了3 个百分点。很明显,数据量的增加克服了标记的噪音。研究人员发现算法的表现和数据量呈对数关系上升,如图所示。论文作者认为,现有的模型是基于一百万张图片建立的:如果对模型进行调整,准确率还有上升空间。

研究人员在微软的 COCO 对象检测基准测试上进行了测试,结果喜人:平均正确率 (AP) 从 34.3 上升到 37.4。Google 和 CMU 在 ICCV 会议上发布了算法和评测,并发布了论文《重新审视深度学习时代数据的非理性效果》,可在arxiv 自由获取。

查看英文原文 Researchers Improve State of the Art in Image Recognition Using Data Set With 300 Million Images


感谢冬雨对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2017-08-03 19:003349

评论

发布
暂无评论
发现更多内容

食堂就餐卡系统设计 UML 练习

escray

学习 极客大学架构师训练营 UML

OBS鉴权实现的宝典秘籍,速拿!

华为云开发者联盟

OBS 签名

AWS在线技术峰会2020探班回顾,四大看点不容错过

有只小耳朵

云计算 AI 云原生 金融 医疗

HTTP必知必会

陈靓-哲露

智能门禁的音视频技术应用

anyRTC开发者

音视频 WebRTC 直播 RTC

JDK15正式发布,划时代的ZGC同时宣布转正

YourBatman

ZGC JDK15

Rust闭包的虫洞穿梭

袁承兴

rust 函数式编程 闭包

架构师训练营第一期-第一周课后-作业一

实战案例丨GaussDB for DWS如何识别坏味道的SQL

华为云开发者联盟

数据库 sql 算子

Code Like Sync, Works Like Async

滴滴普惠出行

百度大脑事件图谱:洞察复杂世界中的事件知识

百度大脑

卧槽!牛逼了!40K+Star!Mall电商实战项目开源回忆录!附源码、教程合集

学习 程序员 架构师 计算机

当代开发者的好帮手,浅析.NET敏捷开发框架的优势与特点

Philips

敏捷开发 软件开发 .net core 开发工具

架构师训练营第一期-第一周课后 - 作业二

Copy攻城狮辛酸史:含泪“一分钟”跑通MindSpore的LeNet模型

华为云开发者联盟

学习 程序员 mindspore

同城快递订单系统架构设计方案

周冬辉

git的几种实用操作(合并代码与暂存复原代码)

良知犹存

git

2020年6月最新iOS面试题总结

iOSer

ios 2020 面试 经验总结

Java基础知识面试题(2020最新版)

Java架构师迁哥

入行架构师之前,这7项技能你要先了解一下

华为云开发者联盟

架构 架构设计 架构师

跨专业学习6个月,成功上岸阿里|滴滴,分享学习路线供大家参考

小Q

Java 学习 架构 面试 基础

Apache Pulsar 社区周报|09-05 ~ 09-11

Apache Pulsar

开源 云原生 Apache Pulsar 消息中间件

餐卡系统设计文档

龙卷风

学习笔记丨浮点数探究

Liuchengz.

C语言 基本数据类型

第一周作业,UML图

等燕归

GrowingIO 智能运营产品微前端实践

GrowingIO技术专栏

大前端 智能运营

面试官:哪些场景会产生OOM?怎么解决?

艾小仙

Java 架构 面试 编程语言 JVM

百度大脑助力旅游场景智能解决方案落地

百度大脑

我擦~字符串转字节切片后,切片的容量竟然千奇百怪

Gopher指北

后端 Go 语言

正则表达式

菜鸟小sailor 🐕

爬虫

分布式系统:数据一致性解决方案

马迪奥

分布式事务 一致性

Google使用3亿张图片大幅度改进图像识别算法_Google_Roland Meertens_InfoQ精选文章