写点什么

unCaptcha:准确率高达 85% 的谷歌语音验证码破解工具

  • 2017-11-01
  • 本文字数:1043 字

    阅读完需:约 3 分钟

很多网站使用谷歌的验证码系统 reCaptcha 来防止用户使用机器人进行自动操作,比如使用机器人创建账号等。2012 年,一个谷歌研究团队几乎百分百破解了其文本验证码系统。于是,谷歌将验证码升级到了语音和图像,并通过不断迭代加固他们的验证码系统。如果能够找到验证码系统的漏洞,也就等于把千万个网站暴露于攻击之下。

近日,美国马里兰大学的四位研究人员开源了一个叫作 unCaptcha 的工具,用于破解谷歌的语音验证码系统,准确率高达 85%。

谷歌的 reCaptcha 系统使用了一些高级的分析工具来判断一个用户到底是人还是机器人。他们使用了多种元素,包括 cookie、解题的速度、鼠标的移动以及解题的成功率。

unCaptcha 使用浏览器自动化工具(如 Selenium)找到网页上的语音验证码,解析出其中的数字,然后通过程序自动键入验证码,以此来骗过验证码系统。

语音验证码由一组变长的数字读音组成,每个数字的语速、音高也不一样,甚至口音也不一样。为了解析出这些数字,需要先从网页上把语音文件下载下来,然后将解析出来的语音元素发给在线的语音识别服务(比如 IBM、谷歌云、谷歌语音识别、Sphinx、Wit-AI、微软 Bing 语音识别)进行识别。识别之后的结果会被收集起来,组成一串数字,这些数字会自动键入到验证码的输入框,从而通过验证。

unCaptcha 已经在著名的 Reddit 网站上做过实验,并通过了谷歌的语音验证码系统,但为了不影响 Reddit 网站,他们在创建新用户这一步停止了实验。unCaptcha 在识别数字方面的准确率高达 92%,整体语音识别准确率达到了 85%。

该工具托管在 GitHub 上,并提供了安装使用示例。

另外,他们也发表了免责声明。他们开发 unCaptcha 的主要目的是作为概念性验证,而绝非要与谷歌作对。他们还将几个在线语音识别服务提供的 API 秘钥从项目中删除,避免不必要的麻烦。

Reddit 网站上有帖子针对该项目展开热议。有人对该项目所使用的技术手段赞不绝口。也有人开玩笑说,他们利用了第三方的在线语音识别服务,包括谷歌自家的语音识别系统,所以对于谷歌来说,无异于搬石头砸自己的脚。有人认为 85% 的准确率已经超过了他通过点击街景标志来输入验证码的正确率。也有人希望这个项目能够做成浏览器插件,这样就可以更轻松地绕过谷歌的验证码系统。

更多的信息可以参看 unCaptcha 网站 GitHub 项目主页,更多的 Reddit 讨论可以在这里看到。


感谢郭蕾对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2017-11-01 19:003068
用户头像

发布了 322 篇内容, 共 140.0 次阅读, 收获喜欢 145 次。

关注

评论

发布
暂无评论
发现更多内容

优雅编程 | javascript代码优化的4个小技巧

devpoint

递归 命名空间 闭包 函数绑定

移除数组中的数字,不用额外空间, 实战RxSwift中的Observable, subscribe, dispose, 吴军老师态度读后感 John 易筋 ARTS 打卡 Week 39

John(易筋)

ARTS 打卡计划 吴军的态度 态度读后感

伊卡洛斯象征了什么?「Day 5」

道伟

文化 28天写作

Linux 入门篇 —— 重定向与管道符

若尘

Linux 管道符 linux开发

可能是Java Stream的最佳实践(二)

ES_her0

28天写作

阿里粗排技术体系与最新进展

DataFunTalk

别再这么写代码了,这几个方法不香吗?

楼下小黑哥

Java 重构

谁手握账本?趣讲 ZK 的内存模型

HelloGitHub

Java zookeeper ZooKeeper原理

为您收录的操作系统系列 - 进程管理(下篇)

鲁米

方法论 操作系统 进程

处理XML数据应用实践

华为云开发者联盟

xml 数据库 数据 XML文档 GaussDB(DWS)

厘清 I/O 模型

sakila

网络编程 I/O

揭开《钢铁侠》AI管家贾维斯神秘面纱的扛鼎之作!

博文视点Broadview

揭秘京东城市时空数据引擎—JUST如何助力交通流量预测

京东科技开发者

JUST 流量预测

28天瞎写的第二百四十三天:正念冥想可以解决什么问题?

树上

冥想 28天写作 正念

高手来啦!十八般武艺保护你的Web应用

云计算

【LeetCode】转置矩阵Java题解

Albert

算法 LeetCode 28天写作 2月春节不断更

工作多年,如何找到自己更好的职业方向

一笑

28天写作

腾讯位置服务开发应用

我是哪吒

28天写作 2月春节不断更 腾讯地图 腾讯位置服务开发应用 腾讯位置

Kafka.07 - 性能优化介绍

insight

kafka 2月春节不断更

工作日志2-23

技术骨干

云原生2.0时代:企业更应了解一下容器安全

华为云开发者联盟

容器 云原生 安全 漏洞

如何有效改变别人的认知和行为?

数列科技杨德华

28天写作

专治小学生作业拖沓

Ian哥

28天写作

新思科技静态应用安全测试帮助Cryptsoft公司提高软件安全和质量水平

InfoQ_434670063458

翻译:《实用的Python编程》02_05_Collections

codists

Python

感性赢了理性那一面——浅谈峰终定律

Justin

心理学 28天写作

产品0期 - 第五周作业

曾烧麦

产品训练营

程序员成长第十二篇:做好项目计划

石云升

项目管理 程序员 28天写作 2月春节不断更

批量下载,我有妙解~

Viktor

JavaScript iframe 跨域

基于matlab的控制系统与仿真4-判断系统稳定性

AXYZdong

matlab 2月春节不断更

(28DW-S8-Day5) 区块链如何防伪

mtfelix

比特币 区块链 非对称加密 28天写作 防伪技术

unCaptcha:准确率高达85%的谷歌语音验证码破解工具_语言 & 开发_薛命灯_InfoQ精选文章