Was ist Optical Mark Recognition?

Bei der Analyse von Dokumenten muss es nicht immer technisch kompliziert werden. Manchmal geht es lediglich um die Erfassung einfacher Markierungen in großer Stückzahl. Dafür ist eine ebenso einfach anwendbare wie effiziente Lösung gefragt: Optical Mark Recognition (OMR) schafft Abhilfe und verwandelt Kugelschreiber-Kreuze in auswertbare Daten.

Nicht zu verwechseln ist dieser Ansatz mit Optical Character Recognition (OCR), einer speziellen Technik zur Texterkennung. Auf die genauen Unterschiede zwischen OMR und OCR gehen wir im Verlauf dieses Blogposts noch näher ein.

Was ist Optical Mark Recognition?

OMR Definition

Optical Mark Recognition ist eine Technologie, die eine maschinelle Erkennung von Markierungen in Dokumenten, insbesondere in Formularen erlaubt. Typischerweise werden auf diesem Weg handschriftlich vorgenommene Häkchen, Kreuze oder Kreise erfasst. Diese liegen häufig in Papierform vor, sodass OMR entsprechende Hardware, wie z. B. einen Scanner erfordert. Dafür gibt es spezielle OMR-Geräte, die notwendige Funktionalitäten bereits integriert haben. Weitere Schritte der Analyse und Interpretation entfallen in der Regel auf die Workflows einer OMR Software, allerdings kann die individuelle Aufgabenverteilung der beiden Komponenten unterschiedlich aussehen: In manchen Fällen ist ein Scanner durch die komplett digitale Aufbereitung der Dokumente überflüssig.

Aufgrund der Schnelligkeit beim Datengewinn ist OMR gut für die Verarbeitung großer Papiermengen aus Umfragen, Wahlen oder Multiple-Choice-Tests geeignet. Da die Technologie weitgehend auf die Erfassung bestimmter Markierungen beschränkt ist, kommen für stärker ausdifferenzierte Dokumententypen häufig Kombinationen mit weiteren Ansätzen wie Barcode– oder Texterkennung zum Tragen.

Wie funktioniert Optical Mark Recognition?

Die Einzelheiten des Prozesses sowie die Aufgabenverteilung auf die einzelnen Komponenten können sich je nach individueller Umsetzung unterscheiden. Im Allgemeinen ist jedoch ein Bedeutungsverlust klassischer OMR Hardware zugunsten leistungsfähiger Software beobachtbar.

OMR-Geräte

OMR-Geräte verfügen meist über einen speziellen Scanner, der ein Formular mit Licht bestrahlt. Überall dort, wo Markierungen zu erwarten sind, z. B. rund um die Checkboxen eines Fragebogens, wird anschließend der reflektierende Kontrast gemessen. Eine verminderte Reflexion weist auf dort positionierte Kennzeichnungen hin. Manche Geräte funktionieren hingegen unter Verwendung von transparentem Papier und stellen die Menge des durchscheinenden Lichts fest. Aufgrund der vergleichsweise hohen Kosten gehören diese Ansätze allerdings immer mehr der Vergangenheit an.

Optisch ähneln die Apparate oft einer Mischung aus Scanner, Drucker und Faxgerät. Typische Vertreter sind z. B. der OMR 23E oder AXM960 von DATAWIN. 

OMR-Software

OMR-Software hat in den vergangenen Jahren stark an Kompetenzen hinzugewonnen und löst die Notwendigkeit ergänzender Hardware zunehmend ab. Mittlerweile sind handelsübliche Scanner oftmals ausreichend und alle weiteren Schritte erfolgen digital. Das ist in erster Linie die Festlegung eines Templates, bestehend aus einem unausgefüllten Formular, in welchem die erwarteten Positionen der Markierungen definiert werden. Dafür dient ein Anker, der in jedem Exemplar an der gleichen Stelle auftaucht – z. B. ein Logo. In Relation dazu kann die Position der Markierungen abgeschätzt und durch Pixelzählungen genauer bestimmt werden. Spezifische Software ist z. B. QS-Beleg oder Evasys.

Ein bedeutend höherer Grad an Flexibilität bei der Formularanalyse entsteht durch den Einsatz von künstlicher Intelligenz. Mittels neuronaler Netze wie einem Convolutional Neural Network (CNN) ist anhand weniger Trainingsbeispiele eine automatisierte und treffsichere Erfassung von Markierungen und sogar Text möglich. Auf dieser Basis gibt es bereits ähnliche Technologien, die jedoch nicht mit Optical Mark Recognition zu verwechseln sind.

Unterschiede zwischen OMR und OCR

Optical Character Recognition (OCR) dient ebenfalls der Analyse von Dokumenten und Formularen, fokussiert sich dabei aber auf die Erkennung von Schriftzeichen. Es handelt sich also um einen technisch zwar ähnlichen, aber bedeutend komplexeren Ansatz, der anders als OMR nicht auf die Positionserfassung einfacher Markierungen beschränkt ist. Stattdessen wird über die Identifikation einzelner (handschriftlicher) Buchstaben die Umwandlung von optisch vorliegenden Texten hin zu digitalen Formaten ermöglicht.

Unterschiede inOMROCR
BedeutungMaschinelle Erfassung von MarkierungenOptische Zeichenerkennung
DatengrundlageStandardisierte Dokumente,  Formulare und FragebögenText in PDFs, Bildern oder anderen optischen Formaten
OutputDatensatzDurchsuchbarer Text in einem digitalen Format wie JSON
AnwendungAuswertung von Befragungen, Wahlscheinen und medizinischen TestsAutomatisierte Datenextraktion aus Dokumenten wie Rechnungen, Lieferscheinen oder Zahlungsavisen

Stärken von OMR

Die allgemein komplexere Leistungsumfang von OCR bedeutet nicht, dass OMR überflüssig ist. Ein Blick auf die Stärken der Markierungserkennung verdeutlicht, wann und warum diese Technologie vorzuziehen ist.

Genauigkeit

Bei der Analyse von Formularen ist Optical Mark Recognition eine Methode von sehr hoher Präzision, die bis zu 99,9% erreichen kann. Das liegt hauptsächlich an der besonders konsistenten Datenerfassung, die durch die einheitliche Abstimmung der Technologie auf bestimmte Formulare ermöglicht wird. Darüber hinaus beugt OMR menschlichen Fehlern im Falle einer manuellen Transkription vor.

Einfachheit

Im Vergleich zu vielen anderen Analysemethoden hat Optical Mark Recognition geringere Systemanforderungen und setzt weniger Know-How bei der Implementierung und Anwendung voraus. Die Anpassung auf spezielle Formulartypen ist damit unkompliziert und interface-basiert möglich.

Effizienz

OMR erlaubt die Analyse von tausenden Formularen pro Stunde und ist somit eine der schnellsten Erhebungsmethoden. Zudem werden die personellen und logistischen Kosten auf ein Minimum reduziert, was zu einer deutlichen Ressourcenersparnis führt.

Für einfache Datenerfassungen auf Basis von Markierungen ist Optical Mark Recognition damit die naheliegendste Wahl. Eine ähnliche Leistung kann zwar auch von anderen Technologien abgebildet werden, diese bedeuten jedoch einen höheren Ressourcenverbrauch. Erst wenn die Markierungserkennung an ihre Grenzen stößt – nämlich bei der Identifikation von Schriftzeichen – ist der Einsatz von z. B. Optical Character Recognition unverzichtbar.

Markierungs- und Zeichenerkennung kombinieren

Häufig tauchen in Unternehmen verschiedene Dokumente auf, die sowohl bestimmte Markierungen, als auch handschriftliche Anmerkungen enthalten. Deren personelle Auswertung ist ein kosten- und zeitintensiver Prozess. Der Versuch, stattdessen separate Tools einzusetzen, um jeweils die verschiedenen Elemente zu erfassen, scheitert hingegen oft an der Integration oder führt aufgrund des Aufwands allenfalls zu marginalen Einsparungen.

Die Lösung ist eine Software, die OMR und OCR flexibel kombiniert: Konfuzio. Darüber hinaus verfügt die KI-basierte Dokumenten-Software über Computer Vision, Barcode-Erkennung und intelligente Zeichenerkennung (ICR), die sich besonders auf Handschrift fokussiert. Es werden diverse Bildformate, PDFs und E-Mail-Anhänge unterstützt, ebenso wie die Integration mit Dienstleistern für externes Scannen. Dadurch ist kein OMR-Gerät notwendig.

Alle relevanten Datenformen lassen sich digital durch die jeweils passenden technischen Ansätze erfassen, extrahieren und weiterverarbeiten. Das umfasst Handschrift in über 130 Sprachen, gedruckten Text in über 200 Sprachen, 2D- und 1D-Barcodes sowie diverse Markierungen. Der Blick auf ein beispielhaftes, heterogenes Dokument verdeutlicht die Notwendigkeit dieses vielseitigen Ansatzes. 

Oder möchten Sie die OMR-Funktion auf dem Konfuzio Marktplatz lieber direkt selbst testen? Der Link zur kostenlosen Registierung: app.konfuzio.com

Beispiel – Dienstobliegenheitserklärung

Ein typischer Anwendungsfall ist die Dienstobliegenheitserklärung. Darin übermitteln Arbeitgeber wichtige Informationen über den Arbeits- bzw. Krankheitsstatus von Angestellten an Versicherer. Die Formulare enthalten daher folgende Elemente, denen sich die verschiedenen Data Capture Systeme zuordnen lassen:

  • Checkboxen mit Markierungen: Optical Mark Recognition (OMR)
  • Gedruckter Text: Optical Character Recognition (OCR)
  • Handschrift (z. B. Namen und Vertragsnummern): Intelligent Character Recognition (ICR)
optical mark data form example

Informationen zum Datensatz

# Felder: 17

davon # Checkbox: 6

davon # Handschrift: 11

# Dokumente: 50

# Seiten: 100

Um die verschiedenen Technologien zielgerichtet und präzise einsetzen zu können, wurde die KI von Konfuzio auf 50 DOE Formularen trainiert. Jedes davon umfasst 2 Seiten, sodass sich insgesamt 100 Seiten ergeben. Die Formulare beinhalten jeweils 17 Felder, darunter 6 Checkboxen und 11 ausfüllbare Textfelder (Handschrift). Bei der Analyse im Trainingsdurchlauf konnte die Software von insgesamt 600 Checkboxen 422 korrekt auslesen. Das entspricht einer Genauigkeit von über 70% – ein außergewöhnlich gutes Ergebnis. Bei der weiteren Anwendung lernt Konfuzio von den individuellen Dokumenten und Anpassungen des Nutzers, um so die maximale Genauigkeit zu erzielen.

optical mark recognition form checkmarks

Ausgelesene Qualität

# aller Checkboxen: 600

Korrekt ausgelesen: 422

Fehlerhaft: 175

Ungenauigkeit überwinden

Beim handschriftlichen Ausfüllen von Formularen kann die Präzision stark variieren. Nicht immer landet eine Markierung exakt in der dafür vorgesehenen Checkbox. Um das zu kompensieren, wird im Template in erster Instanz jeweils ein größerer Markierungsbereich definiert als abgedruckt. Korrigierte Felder, beispielsweise durch Übermalen, lassen sich durch die erhöhte Pigmentierung ausschließen, wenn das nächstgelegene Feld korrekt ausgefüllt ist. Auch die Markierungsempfindlichkeit ist individuell einstellbar. Ein Korrekturalgorithmus prüft anhand dieser Kriterien, ob eine sichere Klassifizierung möglich ist, oder ob der jeweilige Fall zur Nachuntersuchung vorgelegt wird.

Bei der weiteren Validierung helfen integrierte Handlungsregeln und Datenabgleiche. Für den Fall von Abweichungen stellt Konfuzio eine Überprüfungsstation zu Verfügung, um die Genauigkeit durch Vergleiche mit dem Original jederzeit sicherzustellen. Das ist bei Bedarf auch manuell über das webbasierte Interface möglich. So behalten Nutzer trotz hohen Automatisierungsgrads konstant die Kontrolle.

Anwendungsgebiete und Use Cases

Optical Mark Recognition Software Use Cases

Allein für den spezifischen Einsatz von OMR gibt es zahllose Anwendungsfälle – manche tauchen in nahezu jedem Unternehmen auf. Besonders wertvoll ist die Technologie für folgende Bereiche.

Politik

Die Paradedisziplin der Markierungserkennung ist die präzise und schnelle Auswertung von Wahlergebnissen. Stimmzettel liegen normalerweise in anonymisierter Form vor und umfassen nur wenige Kreuze. Diese lassen sich durch OMR problemlos erfassen – am besten gleich tausendfach vor den ersten Hochrechnungen.

Gesundheitswesen

Medizinische Fragebögen bestehen oft zu großen Teilen aus Checkboxen, die z. B. das Vorliegen bestimmter Vorerkrankungen oder Allergien abfragen. Das ist etwa vor einer MRT-Untersuchung, aber ebenso bei allgemeinen Patientendaten relevant. OMR kann deren Analyse und Verwaltung erheblich erleichtern.

Bildungswesen

Multiple-Choice-Tests sind ein weiterer Anwendungsfall, der in vielen Bildungseinrichtungen und Universitäten auftaucht. Durch Markierungserkennung ist eine schnelle Ermittlung der Ergebnisse möglich. Assessments sind ein dazu passendes Pendant aus der Wirtschaft.

Fazit

Zur maschinellen Auswertung von Markierungen ist Optical Mark Recognition eine präzise, effiziente und einfach anwendbare Technologie. Damit lassen sich in kurzer Zeit und großer Quantität Formulare analysieren, die auf eingetragenen Kreuzen, Haken oder Kreisen basieren. Inzwischen kann das zunehmend digital durch Software erfolgen, sodass klassische OMR-Geräte kein Muss mehr sind. So ergibt sich zudem die Möglichkeit, OMR bei heterogenen Dokumenten mit ergänzenden Techniken wie Optical Character Recognition zu kombinieren. Dafür liegt der Einsatz einer KI-basierten Komplettlösung nahe, die alle notwendigen Funktionalitäten und Kontrollinstanzen mitbringt. Das führt zu hochwertigen Ergebnissen, datenbasierten Erkenntnissen und spart wertvolle Ressourcen.

Möchten Sie mehr über den Nutzen von OMR für Unternehmen erfahren? Hinterlassen Sie uns gerne eine Nachricht. Unsere Experten setzen sich zeitnah mit Ihnen in Verbindung.








    «
    »
    Avatar von Tim Filzinger

    Neueste Artikel