数据科学家根据 OCR 技术的用途和应用将该技术分类为不同的类型,器类型包括:1、简单光学字符识别软件;2、智能字符识别软件;3、智能文字识别;4、光学标记识别。
一、OCR 有哪些类型?
数据科学家根据 OCR 技术的用途和应用将该技术分类为不同的类型。以下是几个示例:
1、简单光学字符识别软件
简单 OCR 引擎存储许多不同的字体和文本图像模式作为模板。OCR 软件使用模式匹配算法将文本图像与其内部数据库进行逐字符对比。如果系统逐字匹配文本,则称为光学文字识别。此解决方案存在限制,因为字体和手写风格几乎无限多,数据库中无法捕获和存储每个单独类型。
2、智能字符识别软件
现代 OCR 系统使用智能字符识别 (ICR) 技术,以像人类一样阅读文本。其使用机器学习软件,采用训练机器像人类一样行为的高级方法。机器学习系统,又称神经网络,在多个级别分析文本并反复处理图像。其查找不同的图像属性(例如曲线、线条、交点和环),并结合所有这些不同级别的分析结果获得最终结果。即使 ICR 在处理图像时每次通常只处理一个字符,但速度很快,数秒内即可获得结果。
3、智能文字识别
智能文字识别系统与 ICR 的工作原理相同,但其处理的是整个文字图像,而不是将图像预处理为字符。
4、光学标记识别
光学标记识别识别文档中的徽标、水印和其他文本符号。