验证码挡不住,美企开发 AI 演算模型成功突破 CAPTCHA 验证

来源:元器件交易网 2017-10-31 04:31:00

当人们在网站上注册或购物时,经常会出现

验证码的输入要求,为了区分出「真人」,图片上会出现线条及扭曲分隔开的文字,让计算机难以识别,但这种方式最近被一款人工智能(AI)破解了。

NPR 报导,新创公司 Vicarious 表示,他们已经运用 AI 开发出一种算法模型,可以通过「全自动区分计算机与人脑的公开图灵测试」,也就是现在十分常见,被称为 CAPTCHA 的验证机制。

CAPTCHA 主要是在图片上显示一组验证码,由混乱的字母、波纹线和一些背景噪声组合而成,类似测试在过去对于计算机判读来说十分困难,也因此 CAPTCHA 的能力也被一些 AI 研究人员当作测试的关键基准。

这并非第一次有人成功破解 CAPTCHA 的验证,大约在 10 年前,一家科技公司就曾经被贩卖票卷的 Ticketmaster 起诉,原因是绕过 CAPTCHA 系统大量购买演唱会门票。

但过去这项例子中,主要是利用 CAPTCHA 中特定的弱点,防止程序出现细微的变化借以绕过系统,但 Vicarious 联合创始人 Dileep George 指出,这项新的研究却是「从根本上」打倒了 CAPTCHA。

过去多是采用深度学习(Deep learning)来训练 AI 对特定事物作出反应,透过这样的训练,AI 将能逐渐学会识别图片中的不同字母,但一旦字母互相重迭,AI 便会变的难以识别。

George 解释,深度学习只是复制人脑工作的一部分方式,就像人们也会从经验中学习一样。 但人类小孩并不需要看过大量、不同形式的字母才能区别,即使出现的字母比较大又是斜体,小孩依然能够轻松辨识出来。

George 表示,他们发现大脑在接受视觉时,会自然出现一些假设,但过去使用的深度学习并没有相同情况。 为了让 AI 也具有这种特性,Vicarious 团队改为采用递归皮质网络(RCN)技术,让 AI 即使在较少的培训之下,也能够更好的推理出看到的内容。

在训练阶段,AI 在看到字母后便会建构出它所认知的字母模型概念,理解并猜测字母的轮廓、内部、背景等,之后新的图片出现时,AI 便会试着运用过去建立的理解去解释这张图片,当字母出现部分重迭, 它便能理解部分的缺失是因为字母的部分隐藏在另一个字母后面。

Vicarious 团队提到,CAPTCHA 有非常多种类型,但无论哪种只要被算法达到 1% 以上的准确度,就能够被视为破解。 而这款 AI 算法模型在 reCAPTCHAs 的测试中,准确率达到 66.6%,BotDetect 上达到 64.4%,Yahoo 和 PayPal 上则都达到 57% 左右。

虽然 Vicarious 的演算模型确实在通过 CAPTCHA 验证机制上达到不错的成效,但这项研究的主要目标其实是要让机器人在视觉上能像人类一样理性思考,和破解 CAPTCHA 并没有太大关系。

George 表示,团队的长远目标是建立像是人脑一样的 AI,CAPTCHA 只是一个自然而然的测试,因为这正好能够检测系统是否能像人脑一样工作。

George 强调,机器人需要认识周遭的世界,能够理解并操作物体,在人们打算应用的领域中,AI 必须要在较少的培训之下,运用快速推论、非常灵活的方式处理事情。

「这是技术的必然进步方向,人们必须接受这件事:计算机将会像人脑一样工作。 」

目前尚不清楚这项研究对信息安全会有多大影响,George 指出,Google 已经开始从基于文字的 CAPTCHA 转移到更进步的测试之中,随着人工智能越来越聪明,这些验证机制也必须找出新的方式,来确保用户的人类身分。

点击查看原文

相关链接