OCR是什么(爆改ocr是什么梗)

先说一下中文OCR的发展:
国家863计划信息领域项目组织清华大学、北京信息学院、沈阳自动化学院联合开发中文OCR软件 。1989年,清华大学在国内率先推出了第一套中文OCR软件——清华文同TH-OCR 1.0版 。至此,中国OCR正式从实验室走向市场 。
【OCR是什么(爆改ocr是什么梗)】清华OCR印刷体汉字识别软件后来又推出了TH-OCR 92高性能实用简体/繁体、多字体、多功能印刷体汉字识别系统,使印刷体汉字识别技术有了很大的进步 。
1994年推出的高性能中英文混合印刷文本识别系统TH-OCR 94,被专家鉴定为“国内外推出的第一个中英文混合印刷文本识别系统,整体上居国际领先水平” 。
20世纪90年代中后期,清华大学电子工程系提出并开展了汉字识别的综合研究,在印刷体文字、联机手写汉字识别、脱机手写汉字识别、脱机手写数字符号识别等方面取得了重要成果 。代表成果是TH-OCR 97集成汉字识别系统,可以完成多种语言(中、英、日)的印刷文本、联机手写汉字、脱机手写汉字、手写数字的识别和输入 。
2003年,移动终端OCR应用普及(OCR识别SDK链接APP);到2006年,随着app数量的增加,移动OCR应用出现了爆发式增长 。这时,市场逐渐明朗,北京文同科技的市场份额始终排名第一 。
其实OCR识别技术的门槛很低,现在网上也有开源的OCR识别数据库 。真正参与OCR的公司屈指可数 。这是为什么呢?因为要达到理想的识别率和识别速度,需要做大量的深度机器学习 。这是一个巨大的工程 。
现在,很多企业都跃跃欲试OCR 。有一部分是目前成功的,当然是偷技术的(这里就不说是谁了) 。但实际上,如果你想成为一家伟大的公司,你必须始终把技术放在第一位,你必须拥有巨大的R&D能力 。投机取巧赚钱的公司不值得我们尊敬 。
我相信五年、十年甚至几百年后 。市场会做一个筛选 。真正留下来,能够为OCR识别行业做出贡献的,只能是文同这样的老企业,因为我们始终秉持技术第一的理念,尤其是在OCR领域 。


    推荐阅读