科技资讯眺望|三篇论文,纵览深度学习在表格识别中的最新应用( 十 )
表 3. ICDAR 2013 数据集中计算准确度、召回率和 F1 分数的实验结果
3、小结
针对表格结构识别任务 , 本文提出了一种基于 GRU 序列模型的表格结构抽取方法 。 与启发式算法和基于 CNN 的模型相比 , 基于序列的模型可以有效捕捉表格中重复的行 / 列结构 , 因此大大改进了表格结构抽取的性能 。 作者表示 , 后续工作将集中于开发一个从表格单元格中提取信息的连贯框架 。
四、本文小结
在这篇文章中 , 我们讨论了表格识别问题 。 表格是一种非常重要也非常常见的公文格式、文档形式 , 因此 , 有效对表格进行分析和识别 , 从表格中抽取信息 , 具有非常重要的应用价值 。 表格中具有复杂的层次结构 , 除了存在行、列、表头结构外 , 还存在分割线、合并单元格等元素 。 这就导致传统的信息抽取、文档分析与识别方法直接应用在表格识别中效果都不好 。
本文结合表格识别数据集构建、表格检测与结构识别任务、表格结构识别任务等三个方面的应用 , 分析了三篇最新的研究论文 , 了解了深度学习方法在表格识别任务中的应用 。 其中 , 第一篇文章的主要目的是提出一种应用中文语言的、适用于金融领域的表格识别任务数据集 , 并在此基础上提出了本数据集的基线任务方法 。 该方法主要解决经典的表格识别问题 , 即从表格中提取单元格中的内容 。 作者将表格中的单元格组织成为图结构 , 利用图神经网络技术实现表格识别 。 第二篇文章主要目的是同时解决表格检测与表格中的结构识别问题 。 因此 , 为了能够同时解决两项任务且有效利用两项任务之间的相关信息 , 作者使用了编码器 - 解码器结构的深度学习模型 , 通过共享编码器的方式完成表格检测与结构识别任务 。 第三篇文章目的是提出一种表格结构抽取方法 。 由于表格中的行和列具有典型的相互关联、相互影响的特点 , 本文作者使用了带有门控递归单元的双向递归神经网络 。 双向递归神经网络可以有效捕捉表格中重复的行 / 列结构 , 因此大大改进了表格结构抽取的性能 。
近年来 , 针对表格的分析和处理从基本的结构识别、信息抽取 , 逐渐转向公式提取、交叉内容验证等更高层次的研究和应用 。 表格是与我们日常生活和工作都紧密相关的一种文档形式 , 对表格的自动化处理能力的不断提升 , 也将会给人们的生活和工作带来更大的便利性 。
本文参考引用的文献:
[1] A. Shigarov, A. Altaev, A. Mikhailov, V. Paramonov, E. Cherkashin, “TabbyPDF: Web-Based System for PDF Table Extraction,” 2018, 24th International Conference on Information and Software Technologies.
[2] Institute of Computer Science and Techonology of Peking University, Institute of Digital Publishing of Founder R&D Center, “Marmot Dataset,” 2011, China,
[3] Asif Shahab, “Table Ground Truth for the UW3 and UNLV datasets,” 2013, German Research Center for Artificial Intelligence (DFKI),Ground Truth for the UW3 and UNLV datasets.
[4] M. G¨obel , T. Hassan , E. Oro , G. Orsi, “ICDAR 2013 Table Competition,“ 2013, Proceedings of the 2013 12th International Conference on Document Analysis and Recognition, p.1449-1453.
[5] L. Gao, Y. Huang, H. Dejean, J. Meunier, “ICDAR 2019 Competition on Table Detection and Recognition (cTDaR),” 2019, International Conference on Document Analysis and Recognition (ICDAR), pp. 1510-1515,cTDaR.
[6] X. Zhong, J. Tang, A. J. Yepes, “PubLayNet: largest dataset ever for document layout analysis,” 2019, International Conference on Document Analysis and Recognition (ICDAR),
推荐阅读
- 所持股份|万兴科技:公司控股股东、实际控制人吴太兵质押150万股
- 发布公告|数量过半!博创科技:天通股份累计减持约150万股
- 英雄科技聊数码|蔡崇信有实力买下篮网,那身价3200亿的马云,能买下几支NBA球队
- 科技前沿阵地|涨疯了!海思安防芯片遭哄抬“围剿”
- 中加投资资讯|北美媒体人评价不错,《花木兰》终于来了!神仙姐姐超能打
- 游戏资讯小驿站|我的世界拔刀剑模组:独特设定!帮助玩家更深入了解刀的制作
- 月影浓|吴亦凡机械造型走秀 垫肩披风搭银框眼镜科技感足
- 资讯早知道|9年后再看《步步惊心》,发现若曦无论跟谁都不会幸福
- 中国历史发展过程|中国历史发展过程.中国的科技史界过去半个多世纪
- 天津|桂发祥:不再持有昆汀科技股份