问题19:识别提取文字的常用工具有哪些?

问题19:识别提取文字的常用工具有哪些?

在日常工作中,也许会遇到需要将纸质文档转化为电子版、需要复制网络资料时受限、收集他人私信时担心输入有误等情形。当内容量大时,重新打字转化信息不是首选方案。这时,可以采用识别提取文字的技术工具来解决这些问题。

识别提取文字的技术,常简称为OCR(Optical Character Recognition,光学字符识别),其原理是利用电子设备辨认目标载体上的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字。由于OCR技术门槛较高,非专业群体选取相关工具会有一定难度。表19-1和表19-2分别整理了在电脑端和移动端适用的识别提取文字工具,并提供它们的主要功能亮点、局限以及适用场景,可以根据需要选择使用。

表19-1 电脑端适用的文字识别提取工具

如果经常使用移动端处理事务,可以关注以下移动端的识别提取文字的工具。

表19-2 移动端适用的文字识别提取工具

关注科技推出的文档工具是成熟的文档创建者所应具备的特质。关于文字和音视频之间的转换工具,请参看本书的“问题20:文字转音频的常用工具有哪些?”,以及“问题21:音视频转写文字的常用工具有哪些?”。