Reconnaissance optique des marques pour les logiciels de présentation des données

Qu'est-ce que la reconnaissance optique de marques ?

Tim Filzinger

L'analyse de documents ne doit pas toujours être techniquement compliquée. Parfois, il s'agit simplement de détecter des marques simples en grand nombre. Il faut alors une solution aussi simple à utiliser qu'efficace : Optical Mark Recognition (OMR) apporte une solution et transforme les croix des stylos en données exploitables.

Il ne faut pas confondre cette approche avec Reconnaissance optique des caractères (OCR), une technique spéciale de Reconnaissance de texte. Nous reviendrons plus en détail sur les différences exactes entre OMR et OCR au cours de ce blog post.

Qu'est-ce que la reconnaissance optique de marques ?

OMR Définition

L'Optical Mark Recognition est une technologie qui permet la reconnaissance automatique des marques dans les documents, en particulier dans les formulaires. Typiquement, les coches, croix ou cercles manuscrits sont détectés de cette manière. Ceux-ci se présentent souvent sous forme de papier, de sorte que l'OMR nécessite un matériel adéquat, comme un scanner par exemple. Il existe à cet effet des appareils OMR spéciaux qui intègrent déjà les fonctionnalités nécessaires. D'autres étapes de l'analyse et de l'interprétation sont généralement confiées aux flux de travail d'un logiciel OMR, mais la répartition individuelle des tâches entre les deux composants peut être différente : Dans certains cas, le traitement entièrement numérique des documents rend un scanner superflu.

En raison de la rapidité d'obtention des données, la ROM est bien adaptée au traitement de grandes quantités de papier provenant d'enquêtes, d'élections ou de tests à choix multiples. Étant donné que la technologie se limite en grande partie à la capture de certains marqueurs, des combinaisons avec d'autres approches telles que Code à barres- ou la reconnaissance de texte.

Comment fonctionne la reconnaissance optique des marques ?

Les détails du processus ainsi que la répartition des tâches entre les différents composants peuvent varier en fonction de la mise en œuvre individuelle. En général, on observe toutefois une perte d'importance du matériel OMR classique au profit de logiciels performants.

Appareils OMR

Les appareils OMR disposent généralement d'un scanner spécial qui irradie un formulaire avec de la lumière. Le contraste de réflexion est ensuite mesuré partout où des marquages sont attendus, par exemple autour des cases à cocher d'un questionnaire. Une réflexion réduite indique que des marquages ont été positionnés à cet endroit. En revanche, certains appareils fonctionnent en utilisant du papier transparent et détectent la quantité de lumière transmise. Toutefois, en raison de leur coût relativement élevé, ces approches appartiennent de plus en plus au passé.

Visuellement, ces appareils ressemblent souvent à un mélange de scanner, d'imprimante et de télécopieur. Les représentants typiques sont par exemple l'OMR 23E ou l'AXM960 de DATAWIN. 

Logiciel OMR

Les logiciels OMR ont fortement gagné en compétences au cours des dernières années et remplacent de plus en plus la nécessité d'un matériel complémentaire. Entre-temps, les scanners disponibles dans le commerce sont souvent suffisants et toutes les étapes ultérieures sont numériques. Il s'agit en premier lieu de la définition d'un ModèlesIl s'agit d'un formulaire vierge dans lequel sont définies les positions attendues des marqueurs. Pour cela, un AncreLe nombre de points de repère peut être calculé à partir d'un nombre de points de repère. Par rapport à cela, la position des marques peut être estimée et déterminée plus précisément par le comptage des pixels. Les logiciels spécifiques sont par exemple QS-Beleg ou Evasys.

L'utilisation d'un logiciel de gestion des formulaires permet d'augmenter considérablement le degré de flexibilité de l'analyse des formulaires. l'intelligence artificielle. Au moyen de réseaux neuronaux comme un Réseau neuronal convolutif (CNN) il est possible, à l'aide de quelques exemples d'entraînement, d'effectuer une saisie automatisée et précise de marques et même de texte. Des technologies similaires existent déjà sur cette base, mais elles ne doivent pas être confondues avec la reconnaissance optique de marques (Optical Mark Recognition).

Différences entre OMR et OCR

Reconnaissance optique des caractères (OCR) sert également à l'analyse de documents et de formulaires, mais se concentre sur la Reconnaissance des caractères. Il s'agit donc d'une approche techniquement similaire, mais beaucoup plus complexe, qui, contrairement à la ROM, ne se limite pas à la détection de la position de simples marques. Au lieu de cela, l'identification de lettres individuelles (manuscrites) permet de convertir des textes optiques en formats numériques.

Différences enOMROCR
SignificationSaisie automatique des marquagesReconnaissance optique des caractères
Base de donnéesDocuments, formulaires et questionnaires standardisésTexte en PDF, images ou autres formats optiques
SortieEnsemble de donnéesTexte interrogeable dans un format numérique tel que JSON
ApplicationÉvaluation des entretiens, des cartes d'électeur et des tests médicauxExtraction automatisée de données à partir de documents tels que les factures, les bons de livraison ou les avis de paiement

Points forts d'OMR

Les performances généralement plus complexes de l'OCR ne signifient pas que l'OMR est superflue. Un coup d'œil sur les points forts de la reconnaissance des marques permet de comprendre quand et pourquoi cette technologie est préférable.

Précision

Dans le cadre de l'analyse de formulaires, la reconnaissance optique de marques est une méthode d'une très grande précision, pouvant atteindre 99,9%. Cela est principalement dû à la saisie particulièrement cohérente des données, rendue possible par l'adaptation uniforme de la technologie à certains formulaires. De plus, OMR prévient les erreurs humaines en cas de transcription manuelle.

Simplicité

Comparée à de nombreuses autres méthodes d'analyse, la reconnaissance optique de marques requiert moins de système et moins de savoir-faire lors de l'implémentation et de l'utilisation. L'adaptation à des types de formulaires spécifiques est donc simple et basée sur l'interface.

Efficacité

OMR permet d'analyser des milliers de formulaires par heure, ce qui en fait l'une des méthodes d'enquête les plus rapides. De plus, les frais de personnel et de logistique sont réduits au minimum, ce qui permet de réaliser des économies de ressources considérables.

Pour les saisies de données simples basées sur des marques, la reconnaissance optique des marques est donc le choix le plus évident. D'autres technologies peuvent certes offrir des performances similaires, mais elles impliquent une consommation de ressources plus élevée. Ce n'est que lorsque la reconnaissance de marques atteint ses limites - à savoir l'identification de caractères - que l'utilisation de la reconnaissance optique de caractères, par exemple, devient indispensable.

Combiner la reconnaissance des marques et des caractères

Il arrive souvent que des documents divers apparaissent dans les entreprises, contenant à la fois certaines marques et des annotations manuscrites. Leur évaluation par le personnel est un processus coûteux et chronophage. La tentative d'utiliser à la place des outils séparés pour saisir à chaque fois les différents éléments échoue en revanche souvent au niveau de l'intégration ou ne permet tout au plus que de réaliser des économies marginales en raison de la charge de travail.

La solution est une plateforme qui combine l'OMR et l'OCR de manière flexible : Konfuzio. En outre, le logiciel documentaire basé sur l'IA dispose de la vision par ordinateur, de la reconnaissance des codes à barres et de reconnaissance intelligente des caractères (ICR)qui se concentre particulièrement sur l'écriture manuscrite. Divers formats d'image, de PDF et de pièces jointes à des e-mails sont pris en charge, de même que l'intégration avec des prestataires de services pour la numérisation externe. Cela permet aucun appareil OMR nécessaire.

Toutes les formes de données pertinentes peuvent être saisies, extraites et traitées numériquement grâce à des approches techniques adaptées à chaque cas. Cela comprend l'écriture manuscrite dans plus de 130 langues, le texte imprimé dans plus de 200 langues, les codes-barres 2D et 1D ainsi que divers marquages. L'examen d'un document exemplaire et hétérogène illustre la nécessité de cette approche polyvalente. 

Ou bien vous souhaitez utiliser la fonction OMR sur le Konfuzio Place du marché vous préférez tester vous-même ? Le lien pour s'inscrire gratuitement : app.konfuzio.com

Exemple - Déclaration des obligations de service

Un cas d'application typique est la déclaration des obligations de service. Les employeurs y transmettent aux assureurs des informations importantes sur le statut de travail ou de maladie des employés. Les formulaires contiennent donc les éléments suivants, auxquels les différents organismes de sécurité sociale se conforment. Systèmes de capture de données peuvent être attribués :

  • Cases à cocher avec marqueurs : Reconnaissance optique des marques (OMR)
  • Texte imprimé : Reconnaissance optique des caractères (OCR)
  • l'écriture (par exemple, les noms et les numéros de contrat) : Reconnaissance intelligente des caractères (ICR)
exemple de forme de marque optique

Informations sur l'ensemble des données

# Champs : 17

dont # case à cocher : 6

dont # manuscrit : 11

# Documents : 50

# pages : 100

Afin de pouvoir utiliser les différentes technologies de manière ciblée et précise, la IA de Konfuzio entraîné sur 50 formulaires DOE. Chacun d'entre eux comprend 2 pages, ce qui donne un total de 100 pages. Les formulaires contiennent chacun 17 champs, dont 6 cases à cocher et 11 champs de texte remplissables (écriture manuscrite). Lors de l'analyse effectuée pendant la formation, le logiciel a pu lire correctement 422 cases à cocher sur un total de 600. Cela correspond à une précision de plus de 70% - un résultat exceptionnellement bon. Dans la suite de l'application, Konfuzio apprend des documents individuels et des adaptations de l'utilisateur afin d'obtenir une précision maximale.

optical mark recognition form checkmarks

Qualité sélectionnée

# de toutes les cases à cocher : 600

Lecture correcte : 422

Défaut : 175

Surmonter l'imprécision

Lorsque l'on remplit des formulaires à la main, la précision peut varier considérablement. Une marque n'atterrit pas toujours exactement dans la case à cocher prévue à cet effet. Pour compenser cela, une zone de marquage plus grande que celle imprimée est définie dans le modèle en première instance. Les zones corrigées, par exemple par surimpression, peuvent être exclues grâce à la pigmentation accrue si la zone la plus proche est correctement remplie. La sensibilité du marquage peut également être réglée individuellement. Un algorithme de correction vérifie, sur la base de ces critères, si une classification sûre est possible ou si le cas en question doit être soumis à un examen complémentaire.

Des règles d'action intégrées et des comparaisons de données aident à la validation ultérieure. En cas de divergences, Konfuzio met à disposition une station de vérification afin de garantir à tout moment la précision par comparaison avec l'original. Si nécessaire, cela est également possible manuellement via l'interface basée sur le web. Ainsi, les utilisateurs gardent constamment le contrôle malgré le haut degré d'automatisation.

Domaines d'application et cas d'utilisation

Cas d'utilisation de la reconnaissance optique de marques

Rien que pour l'utilisation spécifique de l'OMR, il existe d'innombrables cas d'application - certains apparaissent dans presque toutes les entreprises. La technologie est particulièrement précieuse dans les domaines suivants.

Politique

La discipline de prédilection de la reconnaissance des marques est l'évaluation précise et rapide des résultats électoraux. Les bulletins de vote sont normalement disponibles sous forme anonyme et ne comportent que quelques croix. Celles-ci peuvent être saisies sans problème par OMR - de préférence des milliers de fois avant les premières extrapolations.

Santé publique

Les questionnaires médicaux sont souvent constitués en grande partie de cases à cocher qui demandent, par exemple, la présence de certaines maladies ou allergies antérieures. C'est important avant un examen IRM, par exemple, mais aussi pour les données générales des patients. OMR peut faciliter considérablement leur analyse et leur gestion.

Éducation

Les tests à choix multiples sont un autre cas d'application que l'on rencontre dans de nombreux établissements d'enseignement et universités. La reconnaissance des marques permet de déterminer rapidement les résultats. Les évaluations en sont un pendant approprié dans l'économie.

Conclusion

Pour l'analyse automatique des marques, la reconnaissance optique des marques est une technologie précise, efficace et facile à utiliser. Elle permet d'analyser en peu de temps et en grande quantité des formulaires basés sur des croix, des crochets ou des cercles inscrits. Entre-temps, cela peut se faire de plus en plus par voie numérique à l'aide de logiciels, de sorte que les appareils OMR classiques ne sont plus indispensables. Il est ainsi possible de combiner l'OMR avec des techniques complémentaires telles que la reconnaissance optique des caractères pour les documents hétérogènes. Pour cela, il est évident d'utiliser une solution complète basée sur l'IA, qui apporte toutes les fonctionnalités et instances de contrôle nécessaires. Cela permet d'obtenir des résultats de grande qualité, des connaissances basées sur les données et d'économiser de précieuses ressources.

Vous souhaitez en savoir plus sur les avantages d'OMR pour les entreprises ? N'hésitez pas à nous laisser un message. Nos experts prendront rapidement contact avec vous.

    À propos de moi

    Autres grands articles

    Réglage des hyperparamètres pour l'optimisation des modèles d'apprentissage automatique

    Réglage des hyperparamètres - Une question de réglage

    Même si l'apprentissage automatique permet de prendre des décisions automatisées, il existe certaines caractéristiques des modèles qu'ils ne peuvent pas optimiser de manière autonome. Précisément

    Lire l'article
    Logiciel de gestion immobilière

    Logiciel pour la gestion d'appartements et de propriétés

    Pour garantir des processus de travail efficaces, un logiciel adapté est devenu un outil important pour les gestionnaires immobiliers. Mais comment peut-on...

    Lire l'article
    Recherche d'images

    Reconnaissance d'images - Fonctionnement et applications

    La technologie de reconnaissance d'image peut aider les gens de plusieurs façons. Elle peut les aider à se protéger contre plusieurs tentatives d'escroquerie, des images libres de droits...

    Lire l'article
    Arrow-up