把现存的纸质书电子化是个费力不讨好的事,耗时耗力回报慢,像豆瓣字节社这样的精品电子书提供商一直占少数。怎样能建立一种平台让所有网上书店能共享电子化的成果

首先,录入并不算费时费力。不知提问者是否了解 OCR 技术?事实上 Google 的网上图书馆就是基于此项技术的,即将纸质书扫描入系统,并在扫描过程中识别印刷字的内容并转换为纯文本。这项技术现在还没有彻底完善,在部分场合——特别是图文混排比较多的情况下——暂时还得不到满意的效果。所以输入后的校对仍然无法避免。技术问题随着时间总能解决,但我们最大的挑战来自法律层面:图书电子化意味着这些书将可以自由在网上传播,你怎么保证著作权人或出版商不用起诉的方法对抗这种行为?当初 Google 开始她们的图书馆计划时,就遭到了出版商的诉讼。官司一打就是七年,直到去年才和解,而且最终实际上是妥协了,只扫描部分内容。别家小公司这么干,估计早就被告倒了。参考:Optical character recognitionGoogle 圖書和解方案Google 結束與出版商 7 年的訴訟,線上圖書館不再是夢!


    推荐阅读