达观@科创100|达观数据创始人、CEO陈运文:“人工智能皇冠上的明珠“(NLP)如何走出“学院派”?

达观@科创100|达观数据创始人、CEO陈运文:“人工智能皇冠上的明珠“(NLP)如何走出“学院派”?
文章图片

《科创板日报》(上海 , 采访人员 金小莫)讯 , 5月20日 , 人工智能企业达观数据上线新产品财债通 , 目标客户为券商、证券交易所等金融类企业 。 《科创板日报》采访人员注意到 , 达观数据近期刚宣布完成2.7亿元B轮+融资 。
据公开资料 , 达观数据成立于2015年底 , 是一家NLP(采访人员注:即自然语言处理技术)+RPA(采访人员注:即流程自动化机器人)研发企业 。 据达观数据创始人、CEO陈运文表示 , 其客户已有中国银联、深交所、新华财经等龙头企业 。
NLP在业内被誉为"人工智能皇冠上的明珠" , 搜狗、腾讯、科大讯飞等巨头企业均有相关业务 , 但因其商业化能力疲弱而备受争议 。 初创企业达观数据是如何完成学术攻关与商业化?就此 , 《科创板日报》采访人员对陈运文进行了采访 。
机器可换初级财务
对于前述问题 , 陈运文认为 , "将自然语言处理的学术思想和工程实践相结合 , 实事求是的选择方法解决问题 , 才能真正发挥它的价值 。 " 随即 , 他向《科创板日报》采访人员展示了其demo产品 , 并称:"软件产品这样你可以有直观感受 。 "
首先 , 他在运行界面上传一份某企业招股书 , 经过算法读取后 , 运行界面右侧边栏标示出部分疑似错误数据 。 "这可能是算错了 , 也可能是数据内部的逻辑错了 , 计算机可以提示给财务 , 减少财务的工作量 。 "陈运文解释说 。
像财务报表这样严谨的操作规范还会犯这样低级的错误?对于采访人员的疑惑 , 陈运文解释 , 此工具是为财务报表在"出厂"时进行检验用的 , 也可为财务报表接收方在"进厂"时进行初步核对 。
"其实这个业务最早是客户向我们提出的需求 。 此前 , 我们也不知道它的错误率可以这样高 , 比如财务数字间逗号点错、与英文句号混淆、错别字等等 。 "陈运文说 , 这些错误如果让人来"纠错"是一项"非常反人性的工作" 。
据比对数据显示 , 同样的工作如果交给人类来做 , 需要花几小时 , 机器只要几分钟 , 准确率为98% 。
金融领域或是翘板
与前文所述巨头企业选择2C商业模式不同 , 达观数据在一开始就选择了2B , 且将金融类龙头企业作为主要服务行业之一 。
"首先 , 领域越细分与巨头的正面竞争就越少 , 这有利于初创企业生存 。 其次 , 选择金融一是因为其固有的信息化水平远高于其他行业;二是因为金融业务有其固定的规则 , 算法较易切入;三是这类企业对降本增效有刚需 。 "陈运文说 。
同时 , 该客户群体属性也必然会出现客户过于强势的现状 , 进而使企业的市场开拓面临一定不确定因素 。
【达观@科创100|达观数据创始人、CEO陈运文:“人工智能皇冠上的明珠“(NLP)如何走出“学院派”?】对此 , 陈运文表示 , 在刚接触一些政企客户 , 其确有一定"不信任感" , 而信任感的建立需要时间 。 为此 , 达观数据做了两件事:一是选择避开微软底层开发框架 , 完全使用自主研发;二是于2019年将业务线从NLP与RPA领域进行了融合 。
一方面满足了金融企业对"自主可控"的要求;一方面则可在客户企业数据库不开放的前提下 , 让机器自动录入信息 , 从而完成数据读取、信息审核 , 报表填写与校对等工作 。
"达观RPA产品是市场上唯一不采用微软底层开发框架的产品 , 虽然研发代价更高更困难 , 但是回头来看是非常值得的 。 "陈运文对《科创板日报》采访人员表示 。
盛大系创业
具体到企业经营层面 , 达观数据未透露具体财务数字 , 但表示其营收在稳健增长中 。 《科创板日报》采访人员从团队成员及专利数方面进行简要分析 。
其创始人陈运文系复旦大学计算机技术专业博士毕业 , 曾就职于盛大文学首席数据官、腾讯文学高级总监等 。据天眼查 , 达观数据核心成员出自盛大创新院 , 后者系陈天桥于2008年打造的创新孵化器 , 云知声、WiFi万能钥匙、UCloud等创始人均出自该孵化器 。


推荐阅读