reCAPTCHA 验证码是否太难辨认了?如果是,为什么要做成这个样子?

我不知道大家有没有这样的感觉? 现在很多国外网站使用reCAPTCHA提供的验证码, 比如ifile.it, 但是每次我遇到reCAPTCHA的验证码…
关注者
113
被浏览
77,501
登录后你可以
不限量看优质回答私信答主深度交流精彩内容一键收藏

细节可以看这篇文章:

reCAPTCHA的起源其他答主也介绍了。这个项目既完成了验证码的功能,又无形中让万亿用户参与到纸质古籍的识别,简直太有意义了,所以 Google 2009年把它买了下来……

进入 Google 体系后,当然不仅仅可以用来识别古籍了,Google 立马把最头疼的事情交给 reCAPTCHA—— Google 街景的识别,包括路上的门牌号、车辆、车牌号、路灯、红绿灯等各种物体,人肉OCR以后,结合Google map、Google Earth,把Google地图体系的数据校验得更加精准。

为什么不用人工智能来识别呢?这里涉及到有监督机器学习的概念。人工智能并不是一开始就认得所有图形的,在项目早期,需要有标记的样本来告诉它:“这个图形是红绿灯”、“这个图形是一般的路灯”,样本的标记是一个很头疼的事,但是这是有监督机器学习里绕不开的砍,很多外包公司通过把样本交给亚非拉的低成本人力去做标注,细节可以看机器之心的这篇:

如果互联网上的海量用户能够免费做样本标注,为什么还要花费成本专门找人去标注呢?

所以就出现了Google街景版reCAPTCHA。现在已经有noCAPTCHA了,大家一定见过:

正常情况下,打个勾就过了,打个勾看似简单,转圈的时候 Google 会判断你所处的环境是不是人类操作的环境,如果怀疑不是,会再让你做个人肉OCR,但是大多数用户已经不用了,极大提升了体验。最近还升级成Invisible reCAPTCHA,对用户完全无感,看来Google的算法已经可以识别绝大多数Google体系内的图片了,开始注重用户体验的提升,或许哪天有新的内容需要人肉标注时,reCAPTCHA会再次进化