|谷歌是怎样扫描2500万本书的?出错图片揭开了谷歌的土味操作( 二 )


本文插图

当然 , 谷歌也不是没试过全自动扫描 。 从公开的专利记录来看 , 谷歌的一个叫做 Dany Qumsiyeh 的工程师就曾设计了一款价格很并夕夕的全自动扫描仪 。
这个小哥造的自动扫描仪原型机只需要1500美金的材料费 。 使用的字符数字转化软件也都是开源的 , 意思就是不要钱 。
它工作起来是这样的——

|谷歌是怎样扫描2500万本书的?出错图片揭开了谷歌的土味操作
本文插图

书被架在一个三角形的金属架上面来回运动 。 在经过这条缝的地方 , 下方传感器会扫描页面——

|谷歌是怎样扫描2500万本书的?出错图片揭开了谷歌的土味操作
本文插图

在书经过这个开口的地方 , 就会翻页 。

|谷歌是怎样扫描2500万本书的?出错图片揭开了谷歌的土味操作
本文插图

这个翻页的技术看起来也很简单 , 就是用吸尘器一样的装置把一页纸吸住 , 然后让它自动滑到三角架的另一边去 。

|谷歌是怎样扫描2500万本书的?出错图片揭开了谷歌的土味操作
本文插图

小哥用了50来本不同类型的书做了测试 , 其中60%的书都能用这款扫描仪扫 。 整体来看300页的书只要半小时就能扫好 。
不过可惜的是 , 这款原型机在扫描时 , 45%的书出现了折页或撕破的情况 。
虽然小哥的全自动扫描仪在2011年被谷歌申请了专利(US8711448B1) , 不过谷歌允许任何人无偿使用这种设计 , 看来是不太看好它的前景了 。

|谷歌是怎样扫描2500万本书的?出错图片揭开了谷歌的土味操作
本文插图

谷歌允许无偿使用这种全自动扫描仪设计 。 图片来源:code.google.com/archive/p/linear-book-scanner/
难道说都2020年了 , 世界上还没有真正的全自动扫描仪吗?
有是有 , 但是贼贵 , 而且出错率未知 。 世界上第一台全自动扫描仪是瑞士4DigitalBooks 公司制造的DL (Digitizing Line) scanner , 斯坦福大学在2001年入手了一台 。

|谷歌是怎样扫描2500万本书的?出错图片揭开了谷歌的土味操作
本文插图

4DigitalBooks 公司制造的全自动扫描仪
Kirtas 公司也有全自动扫描仪 , 是靠一个类似人手的机械臂上的真空吸口翻页的 。

|谷歌是怎样扫描2500万本书的?出错图片揭开了谷歌的土味操作
本文插图

|谷歌是怎样扫描2500万本书的?出错图片揭开了谷歌的土味操作
本文插图

但是 , Kirtas 家的扫描仪可不便宜 , 价格最低的型号也要9千美金一台 , 家用是不太可能了 。 约翰霍普金斯大学在2008年购入了 Kirtas 家出的一台APT 2400 。 上海商学院的古籍部也曾入手一台用于无接触扫描古籍 。
另外一家比较大的自动扫描仪公司出品的 Treventus ScanRobot 也是一页一页吸纸 , 边吸边扫描 。 这个机器刚上市的时候价格达到了10万美金 。

|谷歌是怎样扫描2500万本书的?出错图片揭开了谷歌的土味操作
本文插图

2012年 , 东京大学的 Ishikawa Oku 实验室也研发了一款更为华丽的全自动扫描仪 BFS-Auto 。

|谷歌是怎样扫描2500万本书的?出错图片揭开了谷歌的土味操作
本文插图

它每分钟最多只能扫300页 , 尚未达到量子波动速读的水平
|谷歌是怎样扫描2500万本书的?出错图片揭开了谷歌的土味操作
本文插图




推荐阅读