写点什么

从大脑视觉皮层获得灵感,初创公司 Vicarious 利用 AI 破解了 CAPTCHA 的安全性

  • 2017-11-19
  • 本文字数:1102 字

    阅读完需:约 4 分钟

湾区初创公司 Vicarious 利用称为“RCN”的新型网络布局改进了一项机器学习技术,从而有能力解决CAPTCHA 的挑战

Vicarious 的目标是开发一种在任何环境下都能够检测出特定字母的算法。对机器来说,在不同的环境下检测出字母是件困难的事。出于这个原因,发明了 CAPTCHA 以区分人类和机器。在 2013 年,Vicarious 成为首批利用深度神经网络破解 CAPTCHA 系统的公司之一。

如今,他们改进了算法,所需的数据变得更少以推广到所有的 CAPTCHA。通常,神经网络需要数千到数百万的样本以推广到未曾见过的新数据。但是,他们的新系统归纳能力更好,训练所需的数据只是原来的 300 分之一。

为此,他们发明了 RCN。与一般的神经网络在训练之前不具有任何知识相反,RCN 带着与轮廓和表面相关的知识开始学习。 这种预备知识有利于模型的建立和推广,而一般的神经网络必须学习已存在着的轮廓和表面,还必须学习物体和背景之间的不同。多亏了预备知识,现在可以在几个独立的物体上训练一个 RCN,并利用其来代表具有多个物体的场景。

RCN 背后的想法源于认知科学和神经科学。人类在出生时,神经皮层就已经有能力区分前景和背景。对于我们来说,比起从一片空白开始学习所有的东西,在我们所处的世界中学习各种表达更容易些。

RCN 是轮廓和表面组合的模型。表面是使用条件随机场的模型。轮廓是利用特征的组合层次来建模。这样一来,RCN 能够识别具有不同外观的物体,无需在每一种形状和外观组合上进行训练。RCN 的另外一个优点是它们不会过度拟合训练集中的无关细节。这意味着 RCN 对于其他类似的场景有很强的推广能力。

解决 CAPTCHA 问题是机器学习技术推广的一个非常重要的领域。Vicarious 观察到在 CAPTCHA 中轻微的干扰就使得传统的神经网络方法完全无效。这个可以在下图中观察到,如果在训练了两个网络之后,修改了 CAPTCHA 的表达,那么深度学习的方法会失败。而他们的新方法在仅仅用了 260 个样本训练之后,表现却更好。

为了生成训练和测试数据,研究人员生成了自己的 CAPTCHA。对于这些 CAPTCHA,他们复制了几个著名的 CAPTCHA 生成系统的字体。相关的数据集可以通过他们的博文底部的链接下载获得。

Vicarious 是一家美国人工智能公司。他们希望可以在训练样本中进行归纳,就像人类能做到的一样。他们的终极目标是把这个智能应用于机器人。关于 RCN 的本文已发布于《Science》其网站上

查看英文原文: Start-up Vicarious Defeats CAPTCHA Security with AI Inspired by Brain’s Visual Cortex


感谢冬雨对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2017-11-19 18:001935
用户头像

发布了 199 篇内容, 共 85.8 次阅读, 收获喜欢 295 次。

关注

评论

发布
暂无评论
发现更多内容

探索Git分支管理:优化团队协作与项目开发

测吧(北京)科技有限公司

测试

理论+实践,带你了解分布式训练

快乐非自愿限量之名

分布式 分布式训练 语言模型

什么是运算符

测吧(北京)科技有限公司

测试

关于零信任理念, 零信任的重点是什么

德迅云安全杨德俊

解锁工业数据流:NeuronEX 规则调试功能实操指南

EMQ映云科技

emq emqx NeuronEX

深入理解变量:定义、使用和地址

测吧(北京)科技有限公司

测试

KaiwuDB 参编的《分析型数据库技术要求》标准正式发布

KaiwuDB

数据库 分析型数据库 数据库行业标准制定 数据库标准

深入理解逻辑运算符及其短路特性

测吧(北京)科技有限公司

测试

了解元组:定义、特点、应用及常用方法

测吧(北京)科技有限公司

测试

建发弘爱 X 袋鼠云:加速提升精细化、数字化医疗健康服务能力

袋鼠云数栈

数据资产 医疗 医疗AI 医疗中台 数据服务

掌握Python中的系统监控与管理:使用psutil库

霍格沃兹测试开发学社

一文搞懂 ARM 64 系列: ADC

EquatorCoco

开发 arm

深入了解字符串:定义、转义字符和字符串下标

测吧(北京)科技有限公司

测试

2024春季火山引擎FORCE原动力大会,5月15日开幕

新消费日报

基于OceanBase+Flink CDC,云粒智慧实时数仓演进之路

Apache Flink

flink oceanbase 实时数据

DY短视频批量爬虫提取工具功能介绍

Geek_16d138

好用的软件分享

企业如何训练自己的专属大模型?

幂简集成

AI API 大模型

为什么公共云的弹性能力很难被发挥出来?

AutoMQ

Java 大数据 云原生 AutoMQ

重磅更新:草料二维码容量调整,不再限制图片文件上传量

草料二维码

Bonree ONE 2024春季正式版:革新智能运维,7 大功能亮点重磅发布

博睿数据

云手机:海外舆情监控的新工具

Ogcloud

云手机 海外云手机 云手机海外版 国外云手机 跨境云手机

SD-WAN助力企业实现多分支互联

Ogcloud

SD-WAN 企业组网 SD-WAN组网 SD-WAN服务商 SDWAN

深入了解条件判断、状态标记和假值状态

测吧(北京)科技有限公司

测试

探究字符串操作的各种类别

测吧(北京)科技有限公司

测试

元组与列表:相同点、不同点及内存占用

测吧(北京)科技有限公司

测试

ZOC8 for Mac v8.08.2激活版:顶级终端仿真器

iMac小白

ZOC8 下载 ZOC8 中文版 ZOC8 激活版 ZOC8 破解版 ZOC8 mac

理解标准数据类型及类型查看

测吧(北京)科技有限公司

测试

线程池核心原理浅析

不在线第一只蜗牛

线程 核心原理

深入理解计数器函数:闭包与装饰器

测吧(北京)科技有限公司

测试

从大脑视觉皮层获得灵感,初创公司Vicarious利用AI破解了CAPTCHA的安全性_AI&大模型_Roland Meertens_InfoQ精选文章