但一直以来使用翻译软件都有一个限制,那就是不管软件本身的翻译能力有多强,你得先录入原文然后才能看到译文,这有一个什么问题呢?有一些外语的原文我不知道怎么通过英文键盘输入,譬如日文、德文、法文,相信不是专门学这些语言的朋友都有和我同样的困扰 。
现在有了OCR就方便多了,只需要直接拍照就能提取文字,不但解决了输入问题,效率还要高得多,有些翻译软件干脆就在原图上P上译文,更加直接明了,让我对翻软件有一种耳目一新的感觉 。
除了翻译软件,OCR给我们熟悉的产品带来的改变还有很多,毕竟只要可以从图片中准确提取文字,就有太多的地方等待着我们发挥广阔的想象力 。譬如说,通过OCR技术,即使是扫描生成的PDF也支持文本搜索了 。
如果觉得这个例子太小,那就说搜索引擎,现在的搜索引擎还笨得很,输入文字只能搜到文字,输入图片只能搜到图片,文字和图片是泾渭分明,如果你想用文字搜带有这段文字的图片呢?对不起不行 。
不过使用了OCR,以后也可以以文搜图了 。譬如你翻老照片时找到一张你光着屁股坐在一块写着一段文字的石头上,你想知道这张照片在哪拍的 。可是现在你去搜这段文字,很可能要么就什么都找不到,要么就找到一大堆无关的内容 。
未来如果搜索引擎支持搜索图中文字的功能,你就能马上找到带有这段文字的其它照片,没准其中就有你想要找的内容 。
文章插图
OCR就介绍到这里,相信大家对于OCR是什么,能做什么,未来会有怎样的发展已经有了初步的了解 。可是,OCR技术的原理是什么,传统的做法是什么,现在和深度学习又是怎样结合在一起?
我推荐大家阅读前面提过的这本专门介绍这些问题的书,《深度实践OCR:基于深度学习的文字识别》 。这本书对OCR的介绍很全面,先从OCR的发展历程和经典的技术原理说起,然后介绍了深度学习的主要技术,最后再仔细介绍OCR和深度学术如何结合,而且还对如何通过代码实现进行了详细说明 。看完这本书,对OCR的全貌、原理和应用,应该就能有比较清晰的了解 。
作者简介:莫凡,网名木羊同学 。娱乐向机器学习解说选手,《机器学习算法的数学解析与Python实现》作者,前沿技术发展观潮者,擅长高冷技术的“白菜化”解说,微信公众号“睡前机器学习”,个人知乎号“木羊” 。
【12306验证码为什么那么变态?都是这项深度学习应用给逼的】
推荐阅读
- php获取远程页面html状态码的方法
- 2022年北京行程码带星号的可以下高速吗,为什么行程卡突然带星号了
- 账号密码记在哪里安全 账号与密码管理
- 智能手机|扬州姑娘上海一游的手机找到了 怕红码随机附证明:网友点赞暖心正能量
- 30段极简Python代码:这些小技巧你都Get了么
- 计算机编码ASCII、GBK、Unicode、UTF-8和URL编码的区别
- 10行PHP代码快速获取小程序openid
- 刷票在淘宝怎么买 12306官网抢票神器
- 60行C代码实现一个shell
- 阿里P7架构师浅析:如何优化Java程序设计、编码提高性能