software de reconocimiento óptico de marcas para formularios de datos

¿Qué es el reconocimiento óptico de marcas?

Tim Filzinger

El análisis de documentos no siempre tiene que ser técnicamente complicado. A veces se trata simplemente de capturar marcas sencillas en grandes cantidades. Para ello se necesita una solución tan fácil de usar como eficaz: el reconocimiento óptico de marcas (OMR) pone remedio y transforma los cruces de birlos en datos analizables.

Este enfoque no debe confundirse con Reconocimiento óptico de caracteres (OCR), una técnica especial para Reconocimiento de textos. A lo largo de esta entrada del blog analizaremos con más detalle las diferencias exactas entre OMR y OCR.

¿Qué es el reconocimiento óptico de marcas?

Definición de OMR

El reconocimiento óptico de marcas es una tecnología que permite el reconocimiento automático de marcas en documentos, especialmente en formularios. Normalmente, se reconocen de este modo las marcas, cruces o círculos escritos a mano. Suelen estar en papel, por lo que el OMR requiere el hardware correspondiente, como un escáner. Existen dispositivos OMR especiales que ya tienen integradas las funcionalidades necesarias. Los pasos posteriores de análisis e interpretación suelen realizarse mediante los flujos de trabajo del software OMR, aunque la distribución individual de tareas entre ambos componentes puede variar: En algunos casos, un escáner es superfluo debido a la preparación completamente digital de los documentos.

Debido a la velocidad a la que se obtienen los datos, el OMR es muy adecuado para procesar grandes volúmenes de papel procedentes de encuestas, elecciones o pruebas de respuesta múltiple. Dado que la tecnología se limita en gran medida a la captura de marcadores específicos, las combinaciones con otros enfoques como Código de barras- o el reconocimiento de texto.

¿Cómo funciona el reconocimiento óptico de marcas?

Los detalles del proceso y la asignación de tareas a los distintos componentes pueden variar en función de cada aplicación. En general, sin embargo, se observa una pérdida de importancia del hardware OMR clásico en favor de un potente software.

Dispositivos OMR

Los dispositivos OMR suelen tener un escáner especial que irradia un formulario con luz. Allí donde se esperan marcas, por ejemplo alrededor de las casillas de verificación de un cuestionario, se mide el contraste de reflexión. Una reflexión reducida indica que allí hay marcas. Algunos dispositivos, en cambio, funcionan con papel transparente y determinan la cantidad de luz que lo atraviesa. Sin embargo, debido a los costes comparativamente elevados, estos enfoques son cada vez más cosa del pasado.

Visualmente, los dispositivos suelen parecerse a una mezcla de escáner, impresora y fax. Algunos ejemplos típicos son el OMR 23E o el AXM960 de DATAWIN. 

Software OMR

El software OMR ha adquirido una gran experiencia en los últimos años y está sustituyendo cada vez más la necesidad de hardware adicional. En la actualidad, los escáneres disponibles en el mercado suelen ser suficientes y todos los pasos posteriores se llevan a cabo digitalmente. Esta es principalmente la definición de un Plantillasconsistente en un formulario en blanco en el que se definen las posiciones previstas de los marcadores. A Anclaque aparece en el mismo lugar en todos los ejemplares, por ejemplo, un logotipo. En relación con esto, la posición de las marcas puede estimarse y determinarse con mayor precisión mediante el recuento de píxeles. Los programas informáticos específicos son, por ejemplo, QS-Beleg o Evasys.

Un grado significativamente mayor de flexibilidad en el análisis de la forma se consigue mediante el uso de inteligencia artificial. Utilizando redes neuronales como Red neuronal convolucional (CNN) El reconocimiento automatizado y preciso de marcas e incluso de texto es posible utilizando sólo unos pocos ejemplos de entrenamiento. Ya existen tecnologías similares sobre esta base, pero no deben confundirse con el reconocimiento óptico de marcas.

Diferencias entre OMR y OCR

Reconocimiento óptico de caracteres (OCR) también se utiliza para analizar documentos y formularios, pero se centra en la Reconocimiento de caracteres. Se trata, por tanto, de un enfoque técnicamente similar pero bastante más complejo que, a diferencia del OMR, no se limita a captar la posición de marcas simples. En cambio, la identificación de letras individuales (manuscritas) permite la conversión de textos ópticos a formatos digitales.

Diferencias enOMROCR
SignificadoDetección automática de marcasReconocimiento óptico de caracteres
Base de datosDocumentos, formularios y cuestionarios normalizadosTexto en PDF, imágenes u otros formatos ópticos
SalidaConjunto de datosTexto consultable en un formato digital como JSON
AplicaciónEvaluación de entrevistas, papeletas de voto y pruebas médicasExtracción automatizada de datos de documentos como facturas, albaranes o avisos de pago.

Puntos fuertes de OMR

El ámbito de actuación generalmente más complejo del OCR no significa que el OMR sea superfluo. Un vistazo a los puntos fuertes del reconocimiento de marcadores deja claro cuándo y por qué es preferible esta tecnología.

Precisión

En el análisis de formularios, el reconocimiento óptico de marcas es un método de altísima precisión que puede alcanzar hasta el 99,9%. Esto se debe principalmente a la captura de datos especialmente coherente, que es posible gracias a la adaptación estandarizada de la tecnología a formularios específicos. Además, el OMR evita los errores humanos en caso de transcripción manual.

Simplicidad

En comparación con muchos otros métodos de análisis, el reconocimiento óptico de marcas tiene menos requisitos de sistema y requiere menos conocimientos técnicos para su aplicación y uso. La adaptación a tipos de formularios especiales es, por tanto, sencilla y se basa en la interfaz.

Eficacia

El OMR permite analizar miles de formularios por hora, lo que lo convierte en uno de los métodos de recopilación de datos más rápidos. Además, los costes de personal y logística se reducen al mínimo, lo que supone un importante ahorro de recursos.

El reconocimiento óptico de marcas es, por tanto, la opción más obvia para la captura sencilla de datos basados en marcas. También se pueden conseguir prestaciones similares con otras tecnologías, pero éstas requieren más recursos. Sólo cuando el reconocimiento de marcas llega a sus límites -es decir, cuando se trata de identificar caracteres- es indispensable utilizar, por ejemplo, el reconocimiento óptico de caracteres.

Combinar el reconocimiento de marcadores y caracteres

Las empresas suelen tener varios documentos que contienen tanto marcas específicas como notas manuscritas. Analizarlos es un proceso costoso y lento. En cambio, los intentos de utilizar herramientas independientes para capturar los distintos elementos suelen fracasar debido a la integración o, en el mejor de los casos, solo suponen un ahorro marginal debido al esfuerzo que conllevan.

La solución es una plataforma que combina de forma flexible OMR y OCR: Konfuzio. Además, el software documental basado en IA cuenta con visión por ordenador, reconocimiento de códigos de barras y Reconocimiento inteligente de caracteres (ICR)que se centra especialmente en la escritura a mano. Es compatible con varios formatos de imagen, PDF y archivos adjuntos de correo electrónico, así como con la integración con proveedores de servicios para el escaneado externo. Esto hace que No es necesario ningún dispositivo OMR.

Todas las formas relevantes de datos pueden capturarse, extraerse y procesarse digitalmente utilizando los enfoques técnicos adecuados. Esto incluye escritura a mano en más de 130 idiomas, texto impreso en más de 200 idiomas, códigos de barras 2D y 1D y diversas marcas. Un ejemplo de documento heterogéneo ilustra la necesidad de este enfoque versátil. 

O desea utilizar la función OMR en el Konfuzio Mercado ¿Prefieres probarlo tú mismo? El enlace al registro gratuito: app.confuzio.com

Ejemplo - Declaración de funciones

Un caso de uso típico es la declaración de obligaciones laborales. En ellas, los empresarios facilitan a las aseguradoras información importante sobre la situación laboral o de enfermedad de los empleados. Por ello, los formularios contienen los siguientes elementos, a los que las distintas Sistemas de captura de datos pueden asignarse:

  • Casillas con marcas: Reconocimiento óptico de marcas (OMR)
  • Texto impreso: Reconocimiento óptico de caracteres (OCR)
  • Escritura manuscrita (por ejemplo, nombres y números de contrato): Reconocimiento inteligente de caracteres (ICR)
ejemplo de formulario de marca óptica

Información sobre el conjunto de datos

# Campos: 17

de los cuales # casilla de verificación: 6

de los cuales # manuscrito: 11

# Documentos: 50

# Páginas: 100

Para poder utilizar las distintas tecnologías de forma selectiva y precisa, el AI de Konfuzio formados en 50 formularios del DOE. Cada uno de ellos consta de 2 páginas, lo que da un total de 100 páginas. Cada uno de los formularios contiene 17 campos, entre ellos 6 casillas de verificación y 11 campos de texto rellenables (escritura a mano). Cuando se analizó en la ejecución de entrenamiento, el software fue capaz de leer correctamente 422 de un total de 600 casillas de verificación. Esto corresponde a una precisión de más de 70%, un resultado excepcionalmente bueno. Durante el uso posterior, Konfuzio aprende de los documentos y personalizaciones individuales del usuario para lograr la máxima precisión.

reconocimiento óptico de marcas

Calidad seleccionada

# de todas las casillas: 600

Léase correctamente: 422

Defectuoso: 175

Superar la imprecisión

Al rellenar formularios a mano, la precisión puede variar mucho. Una selección no siempre acaba exactamente en la casilla prevista para ello. Para compensarlo, en el modelo se define en primer lugar un área de marcado mayor que la impresa. Los campos corregidos, por ejemplo por sobrepintado, pueden excluirse por la mayor pigmentación si el campo más próximo se rellena correctamente. La sensibilidad de marcado también puede ajustarse individualmente. Un algoritmo de corrección utiliza estos criterios para comprobar si es posible una clasificación fiable o si el caso correspondiente debe someterse a un examen de seguimiento.

Las reglas de actuación integradas y la sincronización de datos contribuyen a una mayor validación. En caso de desviaciones, Konfuzio proporciona una estación de verificación para garantizar la precisión en todo momento mediante la comparación con el original. En caso necesario, esto también puede hacerse manualmente a través de la interfaz basada en web. Esto permite a los usuarios mantener un control constante a pesar del alto grado de automatización.

Ámbitos de aplicación y casos de uso

Casos prácticos de reconocimiento óptico de marcas

Existen innumerables casos de uso para la aplicación específica del OMR por sí solo - algunos se pueden encontrar en casi todas las empresas. La tecnología es particularmente valiosa para las siguientes áreas.

Política

La principal disciplina del reconocimiento de marcadores es la evaluación precisa y rápida de los resultados electorales. Las papeletas electorales suelen estar disponibles de forma anonimizada y sólo contienen unas pocas cruces. Éstas pueden captarse fácilmente mediante OMR, preferiblemente miles de veces antes de las primeras proyecciones.

Sanidad

Los cuestionarios médicos suelen consistir en gran medida en casillas de verificación en las que se pregunta, por ejemplo, por la presencia de determinadas enfermedades preexistentes o alergias. Esto es relevante antes de un examen de resonancia magnética, por ejemplo, pero también para los datos generales del paciente. OMR puede facilitar enormemente el análisis y la gestión de estos datos.

Educación

Los exámenes tipo test son otro caso de uso que se da en muchas instituciones educativas y universidades. El reconocimiento de marcas permite determinar rápidamente los resultados. Las evaluaciones son una contrapartida adecuada del mundo empresarial.

Conclusión

El reconocimiento óptico de marcas es una tecnología precisa, eficaz y fácil de usar para analizar automáticamente las marcas. Puede utilizarse para analizar formularios basados en cruces, marcas de verificación o círculos en poco tiempo y en grandes cantidades. Cada vez más, esto puede hacerse digitalmente mediante software, lo que significa que los dispositivos OMR clásicos ya no son imprescindibles. Esto también permite combinar el OMR con técnicas complementarias como el reconocimiento óptico de caracteres para documentos heterogéneos. El uso de una solución completa basada en IA que proporcione todas las funcionalidades e instancias de control necesarias es una elección obvia. De este modo se obtienen resultados de alta calidad, se obtienen conocimientos basados en datos y se ahorran valiosos recursos.

¿Desea obtener más información sobre las ventajas del OMR para las empresas? Déjenos un mensaje. Nuestros expertos se pondrán en contacto con usted lo antes posible.

    Sobre mí

    Más artículos interesantes

    Empresas de IA

    87 Empresas de IA - Actualización 2023

    Estamos en la edad de oro de la inteligencia artificial (IA) y el aprendizaje automático, una era en la que los algoritmos avanzados...

    Leer el artículo
    Ajuste de hiperparámetros para la optimización de modelos de aprendizaje automático

    Ajuste de hiperparámetros: una cuestión de configuración

    Aunque el aprendizaje automático permite tomar decisiones automatizadas, hay ciertas propiedades de los modelos que no pueden optimizar de forma independiente. Exactamente...

    Leer el artículo
    Inteligencia Artificial Autónoma

    Comprender la inteligencia artificial autónoma: Pros y contras

    ¿Qué es la Inteligencia Artificial Autónoma? La IA autónoma se define como una forma de inteligencia artificial que puede realizar tareas sin intervención humana.

    Leer el artículo
    Flecha arriba