这些年来,验证码的形式越来越丰富,不少网友“吐槽",没有足够的知识储备,连验证码都看不懂了。不知你有没有想过,这种明显让用户体验不佳的东西,存在的意义到底是什么?
其实,验证码的用处可以用简单的一句话来解释清楚:区分计算机和真正的人。
2000年年初,互联网的浪潮刚刚在全世界掀起,当时最让用户苦恼的一件事就是垃圾邮件太多。甚至有一些家伙还特意设计了程序,可以终日无休止地大量注册新邮箱账号,用来发送垃圾推广邮件。一位名叫路易斯的天才程序员就想到了法子,他发现计算机程序很难认清手写的文本,而人类可以轻松看懂。所以,可以在注册账号的时候设一道门槛一一必须输入“歪曲”的文本才能完成注册,用来识别计算机和真人。验证码由此而生,无数的黄牛 、垃圾邮件、爬虫程序就这样被验证码挡在了门槛外面。
有网友计算过,全世界的网民每天要输入近2亿次验证码,每次输入按花费10秒计算,人类每天花在验证码上的时间己经超过55万个小时。
或许有人会说:“浪费时间就是浪费生命!验证码浪费了人类大量的生命!”不过说起来你可能不信,实际上输入验证码的时间并没有全被浪费。每一次输入验证码,你都可能在为人类的文化事业或者为人工智能贡献一份力量。
还是那个发明了验证码的天才程序号路易斯,他发现许多公益组织在把旧书扫描成电子版。对计算机来说,那些斑驳的文字太难识别了。他想,书籍的内容大部分是文本,验证码也是文本,把扫描版的文本对接到验证码上,让用户用来识别不就行了?于是,一个叫“reCAPTCHA”的新式验证码系统诞生了。
"reCAPTCHA"会提供两个单词让用户识别这两个单词都是书籍扫描版的一部分。计算机其实已经知道第一个单词是啥了,不过第二个单词计算机暂时还没能力认出来。面对第二个单词一旦有10个人输入了同样的答案,那么这个答案就会被当作正确答案。靠这种方法,“reCAPTCHA”每年能让230多万本旧书转化为电子版。
除此之外,你输入的验证码,还可能成为人工智能训练的养料。有一类街景验证码,是让人们洗小轿车、路牌或者自行车等图片。在费眼又费脑地输入它们的时候,你其实在为谷歌的人工智能免费打工。因为这些图片大都来自谷歌街景,其中的一部分图片是AI(人工智能)己经识别出来的,用来识别你是否为真人,另外还会夹杂着几张AI难以识别的街景,需要借助于你的劳动力。而这些数据,最后都会被用于培训人工智能。在各位的“辛勤喂养"之下,运用了谷歌AI技术的无人驾驶汽车Waymo,已经在自动驾驶领域处于遥遥领先的地位。
随着OCR(光学字符识别)技术和AI的发展,验证码也在不断被破解,过去简单扭曲一下的宇母,已挡不住现在的程序了。但无论验证码怎么进化,只要你是真真切切的人,验证码这一关都不可能真正挡住你。就像“reCAPTCHA”一直所倡导的那样:Tough on bots,easy on hurmans (对机器人困难,对人类简单)。