¿Le gustaría encontrar una forma de extraer rápidamente información de cualquier documento sin tener que entrenar antes un modelo? Existe una solución para ello:
Utilice Amazon Textract integrado, disponible en el mercado de Konfuzio, en combinación con la interfaz de usuario de validación de documentos (DVUI) para procesar documentos de forma eficaz y visualizar o modificar los resultados.
Junto con la Interfaz de validación de documentos (DVUI) de Konfuzio, le permite procesar documentos de forma eficiente y visualizar o modificar sus resultados. En este blogpost, escribimos sobre Amazon Textract y su funcionalidad, así como las posibles formas de ampliarlo integrando Konfuzio.
En este contexto, también arrojamos luz sobre Amazon A2I Le mostraremos cómo se integra Amazon Textract con Konfuzio, lo compararemos con DVUI de Konfuzio y le daremos consejos útiles sobre cómo aprovechar al máximo la integración de Amazon Textract con Konfuzio en el mercado.
Leíste una versión traducida automáticamente del post original en alemán.
¿Qué es Amazon Textract?
Amazon Textract es una tecnología desarrollada por Amazon Web Services (AWS). Extrae datos textuales y estructurados de todo tipo de documentos. La información que AWS puede procesar incluye texto, datos de tablas, datos de formularios, OMR (reconocimiento óptico de marcas), escritura a mano y firmas. Cuando un usuario introduce su API los resultados del tratamiento del documento se muestran en forma de JSON presentados con relaciones jerárquicas entre los objetos extraídos, como pares clave-valor.
Amazon Textract y Konfuzio - La integración
Amazon Textract es una potente herramienta por sí misma. Pero en conjunción con Konfuzio, esta tecnología desata aún más potencia, llevando la aplicación a un nivel globalmente superior. Es posible realizar una llamada API a Textract y, de este modo, permitir que se utilice como un Extracción AI en un wrapper y crear un pipeline de procesamiento de documentos en Konfuzio.
Textract utiliza los datos devueltos para crear anotaciones en los documentos procesados. A continuación, estas anotaciones se agrupan en conjuntos lógicos denominados Key-Value Annotation Sets. Cuando los formularios ofrecen múltiples opciones para elegir, se etiquetan las opciones como "Seleccionadas" y "NoSeleccionadas". Ejemplos típicos de estos grupos son:
- Clave: Nombre
- Valor: Erika
- Clave: Estado civil
- Seleccionado: Individual
- NoSeleccionado: Casado
- NoSeleccionado: Divorciado
Los datos de una tabla suelen agruparse en un único conjunto de anotaciones para los valores contenidos en la tabla. Una vez procesado y anotado un documento, el usuario puede acceder a la DVUI para comprobar si las anotaciones son correctas y, en su caso, añadir nuevas anotaciones si falta información.
Amazon también tiene una interfaz para validar anotaciones automáticas llamada A2I, que veremos con más detalle en la siguiente sección.
Konfuzio DVUI vs. Amazon A2I - Una comparación
Para comprobar que las anotaciones son correctas o para editar documentos antes de anotarlos -por ejemplo, para dividir un documento apilado formado por varios subdocumentos-, el usuario debe acceder a una interfaz de validación. Tanto Konfuzio como Amazon ofrecen sus propios desarrollos para este fin. Veamos qué tienen en común y qué diferencias presentan.
Característica | Amazon A2I | Konfuzio DVUI |
---|---|---|
Humanos en el bucle | ✔ | ✔ |
Accesibilidad para anotadores externos | ✔ | ✔* |
Tratamiento de distintos tipos de datos y tareas | ✔ | ✖ |
Visualización de múltiples anotaciones de diferentes grupos de anotaciones | ✖ | ✔ |
Añadir nuevas anotaciones mientras se conduce | ✖ | ✔ |
Modificación de documentos (división, rotación, reordenación) | ✖ | ✔ |
Posibilidad de integración en soluciones personalizadas | ✔ | ✔ |
Como se muestra en la tabla anterior, Amazon A2I tiene características que le permiten manejar con flexibilidad diferentes tipos de datos procesados o tareas para los validadores humanos. Konfuzio DVUI tiene características únicas que le permiten trabajar mejor con la anotación de documentos.
Posibles casos de uso
La integración de Amazon Textract y Konfuzio es aplicable a todo tipo de documentos.
La solución combinada de Amazon Textract y Konfuzio
Los siguientes idiomas son compatibles según el estado actual (09/2023):
- Inglés
- Alemán
- Español
- Francés
- Italiano
- Turco
Estados Unidos como zona de demanda de Amazon Textract y Konfuzio DVUI
Echemos un vistazo a una de las mayores áreas de demanda de procesamiento de documentos: el mercado estadounidense. En la actualidad, hay varios grupos principales de documentos con los que empresas y particulares tratan a diario. Entre ellos figuran, sobre todo
- Facturas y recibos
- Impuestos
- Contratos
- Extractos de cuenta y transacciones
- Documentos relacionados con la asistencia sanitaria y los seguros
- Formularios relacionados con vehículos
Todos estos documentos son casos de uso potenciales para la integración de Amazon Textract y Konfuzio, ya que automatizar el trabajo con estos documentos acelera enormemente el procesamiento en comparación con el procesamiento manual.
Formularios comunes aptos para la automatización
Algunas de las formas más comunes que se prestan a la automatización son:
- CMS 40BSolicitud de afiliación a Medicare
- CMS R-285: Solicitud de información sobre prestaciones de jubilación
- Formulario 4506-C del IRSFormulario fiscal
- Identificación de la tarjeta de seguro de Medicare
- CMS-1500: Solicitud de seguro de enfermedad
- CMS-100Solicitud de empleo
- Formularios W3 y W4: Declaraciones fiscales
Cómo funciona Amazon Textract con Konfuzio - Un ejemplo
Este ejemplo práctico ilustra cómo funciona Amazon Textract en combinación con Konfuzio, cómo el usuario obtiene acceso y prueba la integración.
Echemos un vistazo a un documento de Amazon Textract. Contiene texto y casillas de verificación, así como tablas. El documento ya está integrado en Konfuzio y está siendo procesado. Nuestro documento por defecto es un recibo de un proveedor de Internet. Contiene los tres tipos de datos.
Una vez finalizado el procesamiento, comprobamos que los tres tipos de datos se han anotado correctamente:
Explicación del ejemplo
- Campos negros: Representan los pares clave-valor de los datos de texto.
- Campos rojos: Representan los datos de la tabla.
- Campos Razones: Marcan las casillas OMR y los datos del formulario.
¿Le gustaría probar por sí mismo la combinación de Amazon Textract y Konfuzio? La integración está disponible actualmente en el mercado de Konfuzio.
Para utilizarlo, debe tener una cuenta en app.confuzio.com y solicite acceso al listado de formularios. Nuestros expertos se pondrán en contacto con usted cuando la solicitud de acceso haya sido aceptada.
Conclusión
Amazon Textract es fácil de integrar y es ideal para utilizarlo junto con Konfuzio y su DVUI para proporcionar una solución rápida y precisa. Extracción de datos sin entrenamiento previo de los modelos. Tiene la opción de probar la integración en el Konfuzio Marketplace y probar usted mismo la extracción de cualquier tipo de documento. Amazon Textract procesa fácilmente datos de texto y tablas, así como formularios y casillas de verificación, y puede validar los resultados a través de la DVUI de Konfuzio.
¿Tiene alguna pregunta sobre Amazon Textract o Document Validation UI by Konfuzio? Póngase en contacto con nosotros en cualquier momento a través del Formulario de contacto.