|他婉拒了比尔盖兹将两个产品卖了给谷歌!这位教授用免费来赚钱( 三 )
4. 想要免费使用服务 , 就要「义务」协助电子化资本内容
博班毕业后 , von Ahn 打算继续留在卡内基梅隆大学做研究 。 但这时 , 他接到了来自比尔盖兹的电话 。 由于von Ahn 之前曾在微软实习 , 所以里面的主管都很想招揽他加入微软研究团队 。 但von Ahn 一直坚持要做自己的研究而婉拒 。 微软因此决定要出绝招 , 找来了创办人比尔盖兹亲自打电话给von Ahn 。 他们在电话中聊了约半小时 , 但von Ahn 最后还是没有加盟微软 。
回到卡内基梅隆大学当讲师的von Ahn 还是继续思考「人类」和「电脑」如何搭配 。 这时 , 他忽然想起使用CAPTCHA 人每次都要花5 ~ 10 秒的时间 , 输入验证码 。 但由于使用者很多 , 所以这些时间累积起来也非常可观 。 于是 , 他开始思考如何更好的利用这些时间 。
在这个时 , 随着电子储存技术的进步 , 很多公司都开始研究如何将过去数以万计的纸本书籍数位化 。 而可行的方法只有两种 , 第一是手动输入 , 但这个方法耗时耗力 , 而且容易出现输入错误 。
另一种方法 , 就是将纸本扫描后 , 利用光学文字辨识技术(OCR) 去辨别这些文字 。 但是 , 辨识技术一般来说大概有20% 的字是无法辨识的 。 而那些年代久远导致文字不清晰的书 , 就更难被辨识了 。
于是 , von Ahn 再次想起了人类「看图说故事」的能力 。 于是 , 他改良了CAPTCHA 的做法 , 并将它命名为「reCAPTCHA」 , 然后又免费的提供给有需要的网站 。 唯一不同的是 , 使用这个服务的网站需要将使用者输入的字回传给von Ahn 。
reCAPTCHA 和CAPTCHA 最大的分别 , 是在于它不是提供使用者一组扭曲了的文字 , 而是两组 。 其中一组是系统已经知道答案的文字 , 另一组则是从扫描纸本得来的 。 只要使用者能够正确的回答前一组 , 那系统就会认为后一组的解答也是正确的 。
系统同时还会将同一张扫描内容发送给多个使用者交叉验证 , 以确保不会有人答对了前一组 , 却不小心打错了后一组的状况 。 所以 , 使用者在输入验证码时 , 同时也在为纸本的电子化尽一份力 。
本文插图
图说:reCAPTCHA提供两组扭曲文字(图片来源:Wikipedia)
系统上线后 , von Ahn 找了一些小网站合作 , 但在2006 年 , 有一家新兴的网站主动联络他 , 想要使用这个服务 。 这个网站就是后来著名的脸书 , 而这也让reCAPTCHA 的使用量暴增 。
之后一场演讲中 , von Ahn 分享了reCAPTCHA 如何能够协助电子化既有的纸本资讯 , 而纽约时报技术长正好在场 。 会后 , 这位技术长就告诉von Ahn , 纽约时报在全面电子化之前 , 有约130 年的纸本内容 。 他想要von Ahn 报个价 , 看看要将全部内容电子化大概需要多少钱 。
一开始 , von Ahn 并没有想到reCAPTCHA 能够如何赚钱 , 甚至也没有想要用它来赚钱(就如CAPTCHA 和ESP 游戏一样 , 只是他的研究) 。 因此 , 他只好急忙的想办法估算需要的费用 。 最后 , 他不知从如何算出电子化一年的内容 , 要收42,000 美元这个数字 。 但纽约时报没有讨价还价 , 只是要求他每完成转换一年的内容 , 就请款一年的费用 。
托脸书的福 , reCAPTCHA 那时候已经有非常多的用户 , 所以只要一周就大约能将纽约时报一年的资本电子化 。 更好的是 , von Ahn 其实并没有需要做些什么 , 只要确保reCAPTCHA 的系统有正常运作 , 就可以每周收到42,000 美元 。
Von Ahn 的老客户Google 在这个时候 , 正好启动了自己的电子书计划 。 它们看到了reCAPTCHA 后 , 就决定再次向von Ahn 购买这个系统 。 就这样 , von Ahn 再次将他的研究卖给Google 。
推荐阅读
- 互联网|多名知名人物推特被黑,拜登奥巴马都“中招”,比尔盖茨也在其内
- 互联网|“我,比尔盖茨,打钱!双倍返还”,美国多名政商名流推特账号被黑
- 账号|史诗级比特币骗局!巴菲特、比尔盖茨、奥巴马、马斯克等几十个社媒大V账号同时被盗
- 中年|比尔盖茨都看不下去了!力挺中国
- |顶尖科学家回国,临走带走8千亿,比尔盖茨怒斥美国:还能相信谁