写点什么

Google 使用 3 亿张图片大幅度改进图像识别算法

  • 2017-08-03
  • 本文字数:671 字

    阅读完需:约 2 分钟

Google 和 CMU 的研究员使用 3 亿张图片,在图像识别算法的几个指标上取得了长足改进,而往常的训练一般只使用一百万张图片。

很多开发者在训练物体检测算法时会使用包含一百万张图片的 ImageNet 数据集。这个数据集从 2011 年起就没有新图片加入了。然而,在该数据集上训练的神经网络中的参数数量与日俱增,训练模型的 GPU 算力也在增加。卡内基梅隆大学(CMU)中 Google 的研究人员和科学家提出:如果增加训练数据量会如何?

于是,Google 建立了一个内部数据集,含有3 亿张图片,标记为18291 个类别。图片标注的来源包括原始网络信号,网页之间的联系,以及用户的反馈。因为不是由人标注的,所以含有20% 的噪音。

结论是:增大数据量果然有益。虽然图片标记含有噪音,算法的准确率还是提高了3 个百分点。很明显,数据量的增加克服了标记的噪音。研究人员发现算法的表现和数据量呈对数关系上升,如图所示。论文作者认为,现有的模型是基于一百万张图片建立的:如果对模型进行调整,准确率还有上升空间。

研究人员在微软的 COCO 对象检测基准测试上进行了测试,结果喜人:平均正确率 (AP) 从 34.3 上升到 37.4。Google 和 CMU 在 ICCV 会议上发布了算法和评测,并发布了论文《重新审视深度学习时代数据的非理性效果》,可在arxiv 自由获取。

查看英文原文 Researchers Improve State of the Art in Image Recognition Using Data Set With 300 Million Images


感谢冬雨对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2017-08-03 19:003511

评论

发布
暂无评论
发现更多内容

继承

y

继承

云原生AI成过去式,AI原生的云才是通向未来的“藏宝图”

脑极体

一文搞懂 Flink Stream Join原理

shengjk1

flink源码 flink join

第八章作业-用户路劲图

z

「架构师训练营 4 期」 第十二周 - 001&2

凯迪

架构师训练营 4 期

产品经理训练营 Week11 学习心得

Mai

API 工具链研发的理论基础 - 导读

李宇飞

工具链 API sdk

结合 Flink 学习装饰者模式

shengjk1

flink源码 flink源码分析

产品 0 期 - 第八周作业

曾烧麦

产品训练营

Vue中如何在线预览pdf文件

y

作业 - 第八章 数据分析

hao hao

数据分析

王一凡

maven项目下的重复依赖校验

程序员架构进阶

maven 持续集成 28天写作 3月日更 Jar包扫描

用户路径地图+漏斗模型总结

mas

一文搞懂 Flink 处理水印全过程

shengjk1

systemedctl使用指南

happlyfox

3月日更

2021金三银四总结面试必备清单:字节/蚂蚁金服/腾讯/百度

比伯

Java 程序员 架构 互联网 技术宅

产品经理训练营第八章作业

新盛

你有没有领导力?

石云升

领导力 28天写作 职场经验 管理经验 3月日更

this指向

y

this指针

Android 系统开发做什么?

吴小龙同学

阿里混沌工程平台实践

心远

阿里巴巴 混沌工程

产品经理第 0 期训练营第九周作业提交

Krystal

携手百度智能云推动实现工业AR空间智能化

百度大脑

AR 百度智能云

产品经理训练营 Week11 作业

Mai

用户路径地图与漏洞模型

思亭

用户路径地图 漏洞模型

用户路径地图

王一凡

Flink SQL 自定义 Source format

shengjk1

flink sql

用户路径地图+漏斗模型

mas

架构师:始于理性思考,成于科学实践——郭东白老师分享总结

青春不可负,生活不可欺

成长 架构设计 架构师

「产品经理训练营0期」第八周作业

🌟

产品 产品经理训练营

Google使用3亿张图片大幅度改进图像识别算法_Google_Roland Meertens_InfoQ精选文章