数据表格软件的光学标记识别

什么是光学标记识别?

Tim Filzinger

分析文件并不总是需要复杂的技术。有时,只需捕捉大量的简单标记即可。这就需要一种既简单易用又高效的解决方案:光学标记识别技术(OMR)提供了一种补救措施,它能将生物标记转化为可分析的数据。

这种方法不应与 光学字符识别 (OCR) 的一种特殊技术。 文本识别.我们将在本博文中更详细地介绍 OMR 和 OCR 之间的确切区别。

什么是光学标记识别?

OMR 定义

光学标记识别是一种允许机器识别文件中的标记,特别是表格中的标记的技术。通常情况下,手写的"√"、"叉 "或 "圆 "都可以用这种方式识别。这些标记通常是纸质的,因此 OMR 需要相应的硬件,如扫描仪。有些特殊的 OMR 设备已经集成了必要的功能。进一步的分析和解释步骤通常由 OMR 软件的工作流程执行,但这两个组件之间的任务分配可能各不相同:在某些情况下,由于文件的制备完全数字化,扫描仪是多余的。

由于获取数据的速度快,OMR 非常适合处理来自调查、选举或多项选择测试的大量纸张。由于该技术在很大程度上仅限于捕捉特定的标记,因此需要与其他方法相结合,如 条形码- 或文本识别。

光学标记识别如何工作?

流程的细节和各个组件的任务分配可能因具体实施方式而异。不过,一般来说,传统 OMR 硬件的重要性会有所下降,而功能强大的软件则更受青睐。

OMR 设备

OMR 设备通常有一个特殊的扫描仪,可以用光照射表格。在预计会有标记的地方,例如问卷的复选框周围,就会测量反射对比度。如果反光减弱,则表明标记就在此处。另一方面,有些设备使用透明纸,并确定通过的光量。不过,由于成本相对较高,这些方法正逐渐成为过去式。

从外观上看,这些设备通常类似于扫描仪、打印机和传真机的混合体。典型的例子包括 DATAWIN 的 OMR 23E 或 AXM960。 

OMR 软件

近年来,OMR 软件获得了大量的专业知识,并逐渐取代了对额外硬件的需求。现在,市面上的扫描仪通常已经足够,所有后续步骤都以数字方式进行。这主要是指 模板由一个空白表格组成,其中定义了标记的预期位置。A 例如徽标。与此相关,可以通过计算像素来更精确地估计和确定标记的位置。具体的软件有 QS-Beleg 或 Evasys 等。

通过使用以下方法,可以大大提高形式分析的灵活性 人工智能.使用神经网络,如 卷积神经网络(CNN) 只需几个训练实例,就能自动准确地识别标记甚至文本。在此基础上,类似的技术已经存在,但它们不应与光学标记识别相混淆。

OMR 与 OCR 的区别

光学字符识别 (OCR) 也用于分析文件和表格,但侧重于 字符识别.因此,这是一种技术上相似但复杂得多的方法,与 OMR 不同,它不仅限于捕捉简单标记的位置。相反,通过对单个(手写)字母的识别,可以将光学文本转换为数字格式。

差异OMROCR
意义自动检测标记光学字符识别
数据基础标准化文件、表格和调查问卷PDF 文件、图像或其他光学格式的文本
输出数据集JSON 等数字格式的可搜索文本
应用面试、选票和体检的评估从发票、发货单或付款通知单等文件中自动提取数据

OMR 的优势

OCR 的性能范围通常更为复杂,但这并不意味着 OMR 是多余的。只要看一看标记识别的优势,就会明白什么时候以及为什么这种技术更可取。

准确度

在分析表格时,光学标记识别是一种精度非常高的方法,可以达到 99.9%。这主要得益于该技术与特定表格的标准化匹配所实现的特别一致的数据采集。此外,OMR 还能防止人工转录时出现人为错误。

简约

与许多其他分析方法相比,光学标记识别的系统要求较低,实施和使用所需的专业知识也较少。因此,对特殊表格类型的定制并不复杂,而且基于界面。

效率

OMR 每小时可分析数千份表格,是最快的数据收集方法之一。此外,还可将人员和后勤成本降至最低,从而节省大量资源。

因此,对于基于标记的简单数据采集,光学标记识别技术是最明显的选择。其他技术也可以实现类似的性能,但需要更多的资源。只有当标记识别达到极限时,即识别字符时,才必须使用光学字符识别等技术。

结合标记和字符识别

公司通常有各种文件,其中既有特定标记,也有手写笔记。分析这些内容既费钱又费时。试图使用单独的工具来捕捉各种要素的做法往往会因整合问题而失败,或者由于耗费精力,最多只能节省少量费用。

该解决方案是一个灵活结合 OMR 和 OCR 的平台:Konfuzio。此外,基于人工智能的文档软件还具有计算机视觉、条形码识别和 智能字符识别(ICR)该功能尤其侧重于手写输入。支持各种图像格式、PDF 文件和电子邮件附件,并可与服务提供商集成进行外部扫描。这使得 无需 OMR 设备.

所有相关形式的数据都可以通过适当的技术方法进行数字化采集、提取和处理。其中包括 130 多种语言的手写文字、200 多种语言的印刷文字、二维和一维条形码以及各种标记。通过查看一份示范性的异构文件,我们可以了解到这种多功能方法的必要性。 

或者您想在 Konfuzio 上使用 OMR 功能 市场 想自己测试吗?免费注册链接: app.confuzio.com

示例 - 公务申报

一个典型的使用案例是就业义务声明。在这些情况下,雇主向保险公司提供有关雇员工作或疾病状况的重要信息。因此,这些表格包含以下内容,其中各种 数据采集系统 可以分配:

  • 带标记的复选框 光学标记识别(OMR)
  • 印刷文本: 光学字符识别(OCR)
  • 手写体(如姓名和合同编号): 智能字符识别 (ICR)
光学标记表格示例

数据集信息

# 字段: 17

的 # 复选框: 6

其中 # 手稿: 11

# 文件:50

# 页数: 100

为了能够有针对性地、精确地使用各种技术,教科文组织需要 来自 Konfuzio 的 AI 接受了 50 种 DOE 表格的培训.每个表格有 2 页,共 100 页。每个表格包含 17 个字段,包括 6 个复选框和 11 个可填写文本字段(手写)。在训练运行中进行分析时,软件能够正确读取总共 600 个复选框中的 422 个。这相当于超过 70% 的准确率--一个非常好的结果。在进一步的使用过程中,Konfuzio 会根据用户的个人文档和定制进行学习,以达到最高的准确性。

光学标记识别形式检查标记

选定质量

所有复选框的 #:600

正确读数:422

故障:175

克服误差

手工填写表格时,精确度会有很大差异。选中的内容并不总是准确无误地出现在复选框中。为了弥补这一缺陷,首先要在模板中定义一个比打印时更大的标记区域。如果最近的字段填写正确,则可以通过增加的色素沉淀来排除被修正的字段,例如过度涂抹的字段。打标灵敏度也可以单独设置。校正算法使用这些标准来检查是否可以进行可靠的分类,或是否应将相关病例提交进行后续检查。

集成的操作规则和数据同步有助于进一步验证。如果出现偏差,Konfuzio 可提供一个验证站,通过与原始数据进行比较,随时确保准确性。如有需要,也可通过网络界面手动完成。这样,尽管自动化程度很高,用户仍可保持持续控制。

应用领域和用例

光学标记识别应用案例

单就 OMR 的具体应用而言,就有数不清的使用案例--几乎每家公司都能找到一些。该技术在以下领域尤为重要。

政治

标记识别的主要任务是精确、快速地评估选举结果。选票通常以匿名形式提供,只包含少量叉号。OMR 可以很容易地捕捉到这些标记--最好是在第一次投影之前捕捉数千次。

医疗保健

医疗问卷通常主要由复选框组成,例如询问是否存在某些既存病症或过敏症。例如,这不仅与核磁共振检查前有关,也与一般病人数据有关。OMR 可以更方便地分析和管理这些数据。

教育

多项选择测试是许多教育机构和大学的另一个使用案例。标记识别可以快速确定结果。在商业领域,评估也是一种合适的对应方法。

总结

光学标记识别是一种精确、高效和易于使用的标记自动分析技术。它可以在短时间内对基于十字、刻度线或圆圈的表格进行大量分析。现在,这项工作越来越多地通过软件以数字方式完成,这意味着传统的 OMR 设备不再是必需品。这也使得将 OMR 与光学字符识别等辅助技术结合起来处理异质文件成为可能。使用基于人工智能的完整解决方案,提供所有必要的功能和控制实例,是一个显而易见的选择。这将带来高质量的结果、基于数据的洞察力并节省宝贵的资源。

您想进一步了解 OMR 为企业带来的益处吗?请给我们留言。我们的专家将尽快与您联系。

    关于我

    更多精彩文章

    数据组织:利用人工智能自动编写关键字

    为了高效地使用数据,公司需要根据自己的要求以深思熟虑的方式组织数据。关键词在其中发挥着特别重要的作用...

    阅读故事
    琼浆玉液

    JSONata - JSON 数据概述和示例

    JSONata 是一种功能强大的数据转换语言,用于转换和查询 JSON 数据。它提供了一种简单而灵活的...

    阅读故事
    特征工程机器学习

    特征工程:从原始数据到训练集

    特征工程可用于为人工智能模型的最有效训练准备数据。为此,我们采用了多种技术,包括...

    阅读故事
    箭头向上