reCAPTCHA 验证码是否太难辨认了？如果是，为什么要做成这个样子？

Question

reCAPTCHA 验证码是否太难辨认了？如果是，为什么要做成这个样子？

我不知道大家有没有这样的感觉? 现在很多国外网站使用reCAPTCHA提供的验证码, 比如ifile.it, 但是每次我遇到reCAPTCHA的验证码…

关注者

113

被浏览

77,501

登录后你可以

不限量看优质回答私信答主深度交流精彩内容一键收藏

查看全部 13 个回答

细节可以看这篇文章：

reCAPTCHA的起源其他答主也介绍了。这个项目既完成了验证码的功能，又无形中让万亿用户参与到纸质古籍的识别，简直太有意义了，所以 Google 2009年把它买了下来……

进入 Google 体系后，当然不仅仅可以用来识别古籍了，Google 立马把最头疼的事情交给 reCAPTCHA—— Google 街景的识别，包括路上的门牌号、车辆、车牌号、路灯、红绿灯等各种物体，人肉OCR以后，结合Google map、Google Earth，把Google地图体系的数据校验得更加精准。

为什么不用人工智能来识别呢？这里涉及到有监督机器学习的概念。人工智能并不是一开始就认得所有图形的，在项目早期，需要有标记的样本来告诉它：“这个图形是红绿灯”、“这个图形是一般的路灯”，样本的标记是一个很头疼的事，但是这是有监督机器学习里绕不开的砍，很多外包公司通过把样本交给亚非拉的低成本人力去做标注，细节可以看机器之心的这篇：

如果互联网上的海量用户能够免费做样本标注，为什么还要花费成本专门找人去标注呢？

所以就出现了Google街景版reCAPTCHA。现在已经有noCAPTCHA了，大家一定见过：

正常情况下，打个勾就过了，打个勾看似简单，转圈的时候 Google 会判断你所处的环境是不是人类操作的环境，如果怀疑不是，会再让你做个人肉OCR，但是大多数用户已经不用了，极大提升了体验。最近还升级成Invisible reCAPTCHA，对用户完全无感，看来Google的算法已经可以识别绝大多数Google体系内的图片了，开始注重用户体验的提升，或许哪天有新的内容需要人肉标注时，reCAPTCHA会再次进化

发布于 2019-08-17 09:42

查看全部 13 个回答