写点什么

Google 使用 3 亿张图片大幅度改进图像识别算法

  • 2017-08-03
  • 本文字数:671 字

    阅读完需:约 2 分钟

Google 和 CMU 的研究员使用 3 亿张图片,在图像识别算法的几个指标上取得了长足改进,而往常的训练一般只使用一百万张图片。

很多开发者在训练物体检测算法时会使用包含一百万张图片的 ImageNet 数据集。这个数据集从 2011 年起就没有新图片加入了。然而,在该数据集上训练的神经网络中的参数数量与日俱增,训练模型的 GPU 算力也在增加。卡内基梅隆大学(CMU)中 Google 的研究人员和科学家提出:如果增加训练数据量会如何?

于是,Google 建立了一个内部数据集,含有3 亿张图片,标记为18291 个类别。图片标注的来源包括原始网络信号,网页之间的联系,以及用户的反馈。因为不是由人标注的,所以含有20% 的噪音。

结论是:增大数据量果然有益。虽然图片标记含有噪音,算法的准确率还是提高了3 个百分点。很明显,数据量的增加克服了标记的噪音。研究人员发现算法的表现和数据量呈对数关系上升,如图所示。论文作者认为,现有的模型是基于一百万张图片建立的:如果对模型进行调整,准确率还有上升空间。

研究人员在微软的 COCO 对象检测基准测试上进行了测试,结果喜人:平均正确率 (AP) 从 34.3 上升到 37.4。Google 和 CMU 在 ICCV 会议上发布了算法和评测,并发布了论文《重新审视深度学习时代数据的非理性效果》,可在arxiv 自由获取。

查看英文原文 Researchers Improve State of the Art in Image Recognition Using Data Set With 300 Million Images


感谢冬雨对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2017-08-03 19:003308

评论

发布
暂无评论
发现更多内容

四点原因,Zoom裁员15%,视频会议甜蜜期结束

B Impact

DNS 原理及大规模高性能监测

郑州埃文科技

DNS

贝叶斯AB测试

俞凡

最佳实践 ab测试

开源ChatGPT要来了;软件2.0智能革命;GLM、Diffusion模型大加速

OneFlow

人工智能 深度学习

运维训练营第十三课作业

好吃不贵

2023最新Python阅读书籍推荐

kcodez

Python

状态机设计举例

timerring

FPGA

湖仓一体电商项目(二十):业务实现之编写写入DM层业务代码

Lansonli

湖仓一体电商项目

软件测试/测试开发 | Web测试方法与技术之CSS讲解

测试人

软件测试 自动化测试 测试开发 Web自动化测试 web测试

ByteHouse:基于ClickHouse的实时数仓能力升级解读

字节跳动数据平台

数据库 大数据 数据分析 Clickhouse 企业号 2 月 PK 榜

Kubernetes环境cert-manager部署与应用

Galen Suen

Kubernetes TLS cert-manager Certificate Let's Encrypt

Camtasia2023Mac/win电脑屏幕录制编辑软件

茶色酒

Camtasia2023

【SpringBoot】SpringBoot常用注解

No8g攻城狮

Spring Boot 2 #面试

ThreadLocal源码分析及避坑指南

喝水不抬头

2023-02-11:给你两个整数 m 和 n 。构造一个 m x n 的网格,其中每个单元格最开始是白色, 请你用 红、绿、蓝 三种颜色为每个单元格涂色。所有单元格都需要被涂色, 涂色方案需要满足:

福大大架构师每日一题

算法 rust 福大大

在 JavaScript 如何下载文件

devpoint

JavaScript Blob download

支撑MVP,架构师需要做什么

agnostic

MVP

Dromara HertzBeat 开源社区新晋两位 Committer

TanCloud探云

Java GitHub 开源 后端 开源社区

怎样做新人培训

Joseph295

免费的苹果手机投屏到电脑mac软件AIrserver7

茶色酒

AIrserver7

NodeJS 实战系列:DevOps 尚未解决的问题

光毅

DevOps nodejs

ChatGPT十问十答 | 图解ChatGPT

涛哥 数字产品和业务架构

人工智能 ChatGPT

由ChatGPT引发的关于AI的一些思考

xiaoboey

AI ChatGPT

学习算法必备的《程序员代码面试指南》免费领取啦!!

小小怪下士

编程 程序员 算法 LeetCode 数据结构与算法

一文读懂 Zebec Chain 的“先行网络” Nautilus 链

西柚子

使用开源实时监控系统 HertzBeat 5分钟搞定对 Mysql 数据库监控告警

TanCloud探云

Java 数据库 GitHub 开源 数据库监控

设计模式-值类型与引用类型、深拷贝与浅拷贝、原型模式详解

C++后台开发

数据结构 设计模式 后端开发 Linux服务器开发 C++开发

Ruby on rails入门

阿呆

ruby-on-rails

2023年金三银四必问的 1400 道 Java 面试题及答案整理,让你面试少走99%的弯路!

架构师之道

编程 程序员 java面试

springboot自动配置原理

喝水不抬头

Python 发展趋势:与 Rust 深度融合、更易于编写 Web 应用

Python猫

Python

Google使用3亿张图片大幅度改进图像识别算法_Google_Roland Meertens_InfoQ精选文章