Ya no es una imagen demasiado típica, pero siguen existiendo: clientes bancarios que rellenan un formulario de transferencia y lo entregan al banco. Hace tiempo que los empleados de los bancos dejaron de introducir manualmente los datos de estos formularios en el sistema interno. Al igual que el tratamiento de los propios documentos, el escaneado de estos formularios también está automatizado. Esta tecnología se denomina OCR, Reconocimiento óptico de caracteres o el reconocimiento óptico de caracteres. Para las industrias con grandes volúmenes de procesamiento, la implantación de este tipo de soluciones merece la pena. Pero, ¿qué ocurre con las empresas sin departamento de desarrollo o con un enfoque empresarial diferente? Aquí es donde entran en juego las soluciones de OCR en línea.
Este artículo ha sido traducido al alemán y se ha traducido automáticamente a otros idiomas. Nos complacerá recibir sus comentarios al final del artículo.
Soluciones de OCR en línea de un vistazo
El uso del OCR suele ser sutil, como función de apoyo dentro de procesos más complejos. El OCR es importante tanto para los clientes como para los procesos internos de las empresas.
Reconocimiento de texto en línea para consumidores
Como consumidores expertos en tecnología, lo más probable es que ya hayan utilizado aplicaciones de OCR en línea al menos una vez. Este es el caso, por ejemplo, cuando uno quiere convertir rápidamente datos de imágenes o archivos PDF a un formato que le permita seguir trabajando con estos datos, para la contabilidad doméstica, la investigación genealógica u otras aficiones. En este caso, las plataformas en línea ofrecen la forma más rápida de extraer texto y datos del documento. El usuario no tiene que instalar ningún programa en su ordenador y a menudo puede elegir entre varios formatos de salida. Por ejemplo, los archivos PDF pueden convertirse a Excel o Word, en función del diseño y el contenido. También pueden utilizarse archivos de imagen como JPG o TIFF. Los archivos se cargan en la plataforma seleccionada para su conversión. El procesamiento tiene lugar en el servidor del proveedor. En cuanto esté listo el archivo de salida, por ejemplo un archivo Excel, el usuario podrá descargarlo.
Integrar el OCR en la empresa
Para las empresas, a menudo surgen otros requisitos. En este caso, un proceso manual con plataformas públicas no es un método fiable para la tramitación en línea. Por otro lado, es mucho más importante que el procesamiento OCR se integre en los procesos existentes de la empresa. Para ello existen interfaces técnicas, en resumen APIsa los proveedores de servicios OCR de la red. A continuación, la API permite a las aplicaciones informáticas de la empresa acceder directamente en línea a los servicios de OCR.
Un ejemplo de ello son las entradas Facturas. Se envían directamente al buzón del empresario en formato PDF por correo electrónico. Del mismo modo, la factura puede seguir recibiéndose en el clásico formato en papel. En el caso de las facturas en papel, se escanean todas las páginas para convertirlas en una imagen digital JPG, PNG o TIFF. Después, el proceso vuelve a ser el mismo para ambos casos. A través de la API, los documentos pueden reenviarse automáticamente al servicio en línea para el tratamiento de textos. Los archivos convertidos se procesan directamente, por ejemplo, para leer datos de cuentas, listas de precios o detalles de destinatarios.
Un documento de Word también puede servir de base para nuevos contenidos. Y si, por ejemplo, se ha utilizado una imagen JPG, la información de la imagen puede utilizarse directamente para AnotacionesLos títulos o las descripciones de las imágenes pueden utilizarse para su presentación en Internet.
Ventajas de las soluciones en línea
Delegar tareas de OCR en línea tiene varias ventajas. Empieza por la infraestructura. El complejo procesamiento, especialmente con grandes volúmenes de documentos, requiere hardware adicional en la empresa. Tanto el hardware como el propio software deben mantenerse y actualizarse periódicamente. Esto supone una carga adicional para el equipo informático o la necesidad de contratar más personal o proveedores de servicios.
Con las soluciones internas, los picos de rendimiento también son más difíciles de absorber. Si se necesita más potencia de cálculo durante poco tiempo, los empresarios sólo pueden acumular recursos internos lentamente. Las soluciones de OCR en línea funcionan con recursos variables y pueden reaccionar de inmediato a mayores demandas gracias a las modernas arquitecturas en la nube. Actualizaciones de software, Mejoras en los algoritmos de OCR etc. están disponibles inmediatamente para los usuarios de los servicios en línea sin necesidad de actualizaciones manuales.
¿Debo utilizar soluciones de OCR comerciales o de código abierto?
Para las pequeñas y medianas empresas, la cuestión principal es si un software de código abierto de uso gratuito es suficiente para la solución de OCR. ¿O lo más eficaz es una plataforma comercial? En este caso, depende en gran medida de las competencias de la empresa. Soluciones de OCR de código abierto como Tesseract no conllevan costes de adquisición del propio software. Ya sea PDF o imagen, se pueden leer muchos formatos y se reconocen muchos idiomas. Sin embargo, requiere conocimientos técnicos para integrarlo como componente en línea en la infraestructura informática existente. No se ofrece asistencia técnica, pero se pueden encontrar instrucciones y documentación en Internet. Los administradores de TI pueden utilizarlo para configurarlo para la empresa.
Los proveedores comerciales, en cambio, ofrecen un servicio directo de atención al cliente. El uso del hardware y la conexión a la nube para el software suelen estar ya incluidos. Merece la pena comparar los servicios y precios entre los proveedores. Habría que preguntarse:
- ¿Ofrece la solución en línea todas las funciones de OCR que necesito?
- ¿Es fácil integrar la API en mi sistema?
- ¿Puedo utilizar la API de la plataforma para mis formatos de entrada establecidos (utilizo más archivos PDF o imágenes, más texto largo o formularios complejos)?
- ¿Pueden las herramientas convertir mis documentos a los formatos de salida requeridos (Excel, Word, JSON, XML, etc.)?
- ¿Permite seguir el ritmo de las futuras perspectivas de crecimiento?
- ¿Es posible que esté pagando por muchos servicios que nunca necesitaré?
Gracias a este análisis, se pueden seleccionar los candidatos pertinentes.
Considere también la seguridad de la solución de OCR en línea
A pesar de todas las ventajas, es importante no olvidar la seguridad. En muchos casos, los datos sensibles se transmiten en línea. Al elegir un proveedor, hay que prestar mucha atención a la forma en que se transmiten los datos. Al fin y al cabo, un PDF o una imagen pueden contener datos muy personales. Puede tratarse de cualquier texto, como información financiera, cumpleaños, direcciones privadas o datos médicos. En cualquier caso, los archivos sólo deben transferirse con un cifrado fuerte para que nadie pueda interceptar los datos en el camino entre sistemas. El propio sistema del proveedor de OCR también debe estar fuertemente protegido contra ataques externos. Este debe ser un criterio importante a la hora de elegir un proveedor.
Además de la seguridad de los datos, su protección también desempeña un papel importante. Especialmente en Europa, esto está estrictamente regulado por el Reglamento de Protección de Datos, el Reglamento Básico de Protección de Datos. A ser posible, los servidores del proveedor online deben estar situados en Europa (Más información sobre terceros países). No debe haber derivación de datos a otras regiones. Ni el documento original (por ejemplo, la factura escaneada o el archivo PDF) ni los archivos convertidos (por ejemplo, la tabla Excel terminada) deben permanecer en el servidor del sistema OCR tras el procesamiento en línea.
Precisión del reconocimiento de texto
Ejemplo de recibo
Imagen original

El OCR en línea convencional no suele reconocer todos los elementos del texto. Los elementos de texto reconocidos aparecen atenuados.
Konfuzio OCR reconoce todas las palabras

Ejemplo de documento de identidad escaneado en línea
Imagen original

El OCR convencional sólo reconoce las letras con errores.
Konfuzio OCR en línea

Móvil e inteligente: el futuro del OCR
En cuanto se establece la conexión del sistema propio con las soluciones en línea, surgen muchas posibilidades nuevas para mejorar los procesos internos o la comunicación con los clientes o socios comerciales. El reconocimiento de textos también es fácil de hacer desde dispositivos móviles gracias a la potencia de cálculo distribuida. Debido a la continua expansión de las plataformas de OCR, se dispone rápidamente de nuevos servicios. Algoritmos inteligentes con inteligencia artificial (IA) permiten reconocer la escritura a mano y la información fragmentada en varias páginas.
Las fuentes de vídeo también están cobrando protagonismo. Las herramientas de reconocimiento de texto a partir de vídeos pueden convertir los contenidos sin sacrificar el rendimiento de sus propios sistemas. El texto extraído puede utilizarse, por ejemplo, para mejorar la libre accesibilidad de las fuentes de vídeo. Y no sólo el procesamiento OCR, sino también el fases de tratamiento posteriores pueden trasladarse gradualmente a la nube. Esto permite a la empresa concentrarse en su actividad principal sin tener que preocuparse de las tecnologías de servidor y la administración informática.
Fuentes
- Normativa sobre terceros países dentro del Reglamento General de Protección de Datos DSGVO: https://dsgvo-gesetz.de/themen/drittland/
- Documentación de Tesseract, solución OCR de código abierto: https://tesseract-ocr.github.io/tessdoc/
La diferencia entre las aplicaciones de OCR en línea y locales es la transmisión de documentos a través de Internet. Esta transmisión debe ser demostrablemente segura. Además, el proveedor debe proteger los datos de sus propios servidores contra usos indebidos. Todos los proveedores acreditados pueden facilitar más información sobre las medidas previa solicitud.
Los usuarios particulares disponen de varias plataformas para la conversión directa de archivos PDF. El archivo PDF debe estar disponible en el dispositivo local (ordenador de sobremesa, tableta, smartphone). A continuación, el archivo puede cargarse en el servidor del proveedor a través de un formulario. Otras opciones permiten seleccionar el formato de salida. En cuanto finaliza el procesamiento OCR, el documento resultante está disponible para su descarga.
La calidad de los resultados del procesamiento OCR por plataformas en línea no difiere fundamentalmente de las aplicaciones en el propio ordenador. Mucho más importantes son los algoritmos que se utilizan. Aquí suele haber diferencias visibles, sobre todo con contenidos más complejos y documentos de lectura rápida. A menudo, las aplicaciones locales no están a la última después de unos años en el ordenador. En cambio, las plataformas en línea ofrecen siempre la última versión porque se actualizan automáticamente para todos los usuarios. El aprendizaje automático también funciona mucho mejor en plataformas en línea, ya que se dispone de muchos más datos para entrenar los algoritmos.