科技俱乐部菌|他婉拒了比尔盖兹将两个产品卖了给谷歌!这位教授用免费来赚钱( 三 )


回到卡内基梅隆大学当讲师的vonAhn还是继续思考「人类」和「电脑」如何搭配 。 这时 , 他忽然想起使用CAPTCHA人每次都要花5~10秒的时间 , 输入验证码 。 但由于使用者很多 , 所以这些时间累积起来也非常可观 。 于是 , 他开始思考如何更好的利用这些时间 。
在这个时 , 随着电子储存技术的进步 , 很多公司都开始研究如何将过去数以万计的纸本书籍数位化 。 而可行的方法只有两种 , 第一是手动输入 , 但这个方法耗时耗力 , 而且容易出现输入错误 。
另一种方法 , 就是将纸本扫描后 , 利用光学文字辨识技术(OCR)去辨别这些文字 。 但是 , 辨识技术一般来说大概有20%的字是无法辨识的 。 而那些年代久远导致文字不清晰的书 , 就更难被辨识了 。
于是 , vonAhn再次想起了人类「看图说故事」的能力 。 于是 , 他改良了CAPTCHA的做法 , 并将它命名为「reCAPTCHA」 , 然后又免费的提供给有需要的网站 。 唯一不同的是 , 使用这个服务的网站需要将使用者输入的字回传给vonAhn 。
reCAPTCHA和CAPTCHA最大的分别 , 是在于它不是提供使用者一组扭曲了的文字 , 而是两组 。 其中一组是系统已经知道答案的文字 , 另一组则是从扫描纸本得来的 。 只要使用者能够正确的回答前一组 , 那系统就会认为后一组的解答也是正确的 。
系统同时还会将同一张扫描内容发送给多个使用者交叉验证 , 以确保不会有人答对了前一组 , 却不小心打错了后一组的状况 。 所以 , 使用者在输入验证码时 , 同时也在为纸本的电子化尽一份力 。
科技俱乐部菌|他婉拒了比尔盖兹将两个产品卖了给谷歌!这位教授用免费来赚钱
文章图片
图说:reCAPTCHA提供两组扭曲文字(图片来源:Wikipedia)
系统上线后 , vonAhn找了一些小网站合作 , 但在2006年 , 有一家新兴的网站主动联络他 , 想要使用这个服务 。 这个网站就是后来著名的脸书 , 而这也让reCAPTCHA的使用量暴增 。
之后一场演讲中 , vonAhn分享了reCAPTCHA如何能够协助电子化既有的纸本资讯 , 而纽约时报技术长正好在场 。 会后 , 这位技术长就告诉vonAhn , 纽约时报在全面电子化之前 , 有约130年的纸本内容 。 他想要vonAhn报个价 , 看看要将全部内容电子化大概需要多少钱 。
一开始 , vonAhn并没有想到reCAPTCHA能够如何赚钱 , 甚至也没有想要用它来赚钱(就如CAPTCHA和ESP游戏一样 , 只是他的研究) 。 因此 , 他只好急忙的想办法估算需要的费用 。 最后 , 他不知从如何算出电子化一年的内容 , 要收42,000美元这个数字 。 但纽约时报没有讨价还价 , 只是要求他每完成转换一年的内容 , 就请款一年的费用 。
托脸书的福 , reCAPTCHA那时候已经有非常多的用户 , 所以只要一周就大约能将纽约时报一年的资本电子化 。 更好的是 , vonAhn其实并没有需要做些什么 , 只要确保reCAPTCHA的系统有正常运作 , 就可以每周收到42,000美元 。
VonAhn的老客户Google在这个时候 , 正好启动了自己的电子书计划 。 它们看到了reCAPTCHA后 , 就决定再次向vonAhn购买这个系统 。 就这样 , vonAhn再次将他的研究卖给Google 。
科技俱乐部菌|他婉拒了比尔盖兹将两个产品卖了给谷歌!这位教授用免费来赚钱
文章图片
图说:LuisvonAhn(图片来源:PopTech)
在收购了reCAPTCHA后 , vonAhn因为合约的关系 , 短暂的进入了Google工作 。 而在2012年 , reCAPTCHA每天大概能够协助辨识1.5一个需要被电子化的字 。
但vonAhn的研究并没有停止 。 很快的 , 他又在为「看图说故事」找到新的应用 , 而且还设计出一个线上语言学习App 。 不过 , 这又是另一个故事了!


推荐阅读