Amazon Textract DVUI Konfuzio

Amazon Textract y Konfuzio DVUI - Extracción de datos sin formación

Elizaveta Ezhergina

¿Le gustaría encontrar una forma de extraer rápidamente información de cualquier documento sin tener que entrenar antes un modelo? Existe una solución para ello:

Utilice el Amazon Textract integrado, que está disponible en el Mercado de Konfuzio está disponible y, en combinación con la interfaz de usuario de validación de documentos (DVUI), permite procesar eficazmente los documentos y visualizar o modificar los resultados.

Junto con la Interfaz de validación de documentos (DVUI) de Konfuzio, le permite procesar documentos de forma eficiente y visualizar o modificar sus resultados. En este blogpost, escribimos sobre Amazon Textract y su funcionalidad, así como las posibles formas de ampliarlo integrando Konfuzio.

En este contexto, también arrojamos luz sobre Amazon A2I Le mostraremos cómo se integra Amazon Textract con Konfuzio, lo compararemos con DVUI de Konfuzio y le daremos consejos útiles sobre cómo aprovechar al máximo la integración de Amazon Textract con Konfuzio en el mercado.

¿Qué es Amazon Textract?

Amazon Textract es una tecnología desarrollada por Amazon Web Services (AWS). Extrae datos textuales y estructurados de todo tipo de documentos. La información que AWS puede procesar incluye texto, datos de tablas, datos de formularios, OMR (reconocimiento óptico de marcas), escritura a mano y firmas. Cuando un usuario introduce su API los resultados del tratamiento del documento se muestran en forma de JSON presentados con relaciones jerárquicas entre los objetos extraídos, como pares clave-valor.

Amazon Textract y Konfuzio - La integración

Amazon Textract es una potente herramienta por sí misma. Pero en conjunción con Konfuzio, esta tecnología desata aún más potencia, llevando la aplicación a un nivel globalmente superior. Es posible realizar una llamada API a Textract y, de este modo, permitir que se utilice como un Extracción AI en un wrapper y crear un pipeline de procesamiento de documentos en Konfuzio.

Textract utiliza los datos devueltos para crear anotaciones en los documentos procesados. A continuación, estas anotaciones se agrupan en conjuntos lógicos denominados Key-Value Annotation Sets. Cuando los formularios ofrecen múltiples opciones para elegir, se etiquetan las opciones como "Seleccionadas" y "NoSeleccionadas". Ejemplos típicos de estos grupos son:

  • Clave: Nombre
  • Valor: Erika
  • Clave: Estado civil
  • Seleccionado: Individual
  • NoSeleccionado: Casado
  • NoSeleccionado: Divorciado

Los datos de una tabla suelen agruparse en un único conjunto de anotaciones para los valores contenidos en la tabla. Una vez procesado y anotado un documento, el usuario puede acceder a la DVUI para comprobar si las anotaciones son correctas y, en su caso, añadir nuevas anotaciones si falta información.

Amazon también tiene una interfaz para validar anotaciones automáticas llamada A2I, que veremos con más detalle en la siguiente sección.

Konfuzio DVUI vs. Amazon A2I - Una comparación

Para comprobar que las anotaciones son correctas o para editar documentos antes de anotarlos -por ejemplo, para dividir un documento apilado formado por varios subdocumentos-, el usuario debe acceder a una interfaz de validación. Tanto Konfuzio como Amazon ofrecen sus propios desarrollos para este fin. Veamos qué tienen en común y qué diferencias presentan.

CaracterísticaAmazon A2IKonfuzio DVUI
Humanos en el bucle
Accesibilidad para anotadores externos✔*
Tratamiento de distintos tipos de datos y tareas
Visualización de múltiples anotaciones de diferentes grupos de anotaciones
Añadir nuevas anotaciones mientras se conduce
Modificación de documentos (división, rotación, reordenación)
Posibilidad de integración en soluciones personalizadas
* siempre que el usuario tenga acceso

Como se muestra en la tabla anterior, Amazon A2I tiene características que le permiten manejar con flexibilidad diferentes tipos de datos procesados o tareas para los validadores humanos. Konfuzio DVUI tiene características únicas que le permiten trabajar mejor con la anotación de documentos.

Posibles casos de uso

Casos de uso de Amazon Textract Konfuzio

La integración de Amazon Textract y Konfuzio es aplicable a todo tipo de documentos.

La solución combinada de Amazon Textract y Konfuzio

Los siguientes idiomas son compatibles según el estado actual (09/2023):

  • Inglés
  • Alemán
  • Español
  • Francés
  • Italiano
  • Turco

Estados Unidos como zona de demanda de Amazon Textract y Konfuzio DVUI

Echemos un vistazo a una de las mayores áreas de demanda de procesamiento de documentos: el mercado estadounidense. En la actualidad, hay varios grupos principales de documentos con los que empresas y particulares tratan a diario. Entre ellos figuran, sobre todo

  • Facturas y recibos
  • Impuestos
  • Contratos
  • Extractos de cuenta y transacciones
  • Documentos relacionados con la asistencia sanitaria y los seguros
  • Formularios relacionados con vehículos

Todos estos documentos son casos de uso potenciales para la integración de Amazon Textract y Konfuzio, ya que automatizar el trabajo con estos documentos acelera enormemente el procesamiento en comparación con el procesamiento manual.

Formularios comunes aptos para la automatización

Algunas de las formas más comunes que se prestan a la automatización son:

  • CMS 40BSolicitud de afiliación a Medicare
  • CMS R-285: Solicitud de información sobre prestaciones de jubilación
  • Formulario 4506-C del IRSFormulario fiscal
  • Identificación de la tarjeta de seguro de Medicare
  • CMS-1500: Solicitud de seguro de enfermedad
  • CMS-100Solicitud de empleo
  • Formularios W3 y W4: Declaraciones fiscales

Cómo funciona Amazon Textract con Konfuzio - Un ejemplo

Este ejemplo práctico ilustra cómo funciona Amazon Textract en combinación con Konfuzio, cómo el usuario obtiene acceso y prueba la integración.

Echemos un vistazo a un documento de Amazon Textract. Contiene texto y casillas de verificación, así como tablas. El documento ya está integrado en Konfuzio y está siendo procesado. Nuestro documento por defecto es un recibo de un proveedor de Internet. Contiene los tres tipos de datos.

Documento de muestra de Amazon Textract
Documento de muestra 2 de Amazon Textract

Una vez finalizado el procesamiento, comprobamos que los tres tipos de datos se han anotado correctamente:

Amazon Textract Konfuzio
Amazon Textract Konfuzio 2

Explicación del ejemplo

  • Campos negros: Representan los pares clave-valor de los datos de texto.
  • Campos rojos: Representan los datos de la tabla.
  • Campos Razones: Marcan las casillas OMR y los datos del formulario.

¿Le gustaría probar por sí mismo la combinación de Amazon Textract y Konfuzio? La integración se encuentra actualmente en Mercado Konfuzio disponible.

Para utilizarlo, debe tener una cuenta en app.confuzio.com y solicite acceso al listado de formularios. Nuestros expertos se pondrán en contacto con usted cuando la solicitud de acceso haya sido aceptada.

Conclusión

Amazon Textract es fácil de integrar y es ideal para utilizarlo junto con Konfuzio y su DVUI para proporcionar una solución rápida y precisa. Extracción de datos sin entrenamiento previo de los modelos. Tiene la opción de probar la integración en el Konfuzio Marketplace y probar usted mismo la extracción de cualquier tipo de documento. Amazon Textract procesa fácilmente datos de texto y tablas, así como formularios y casillas de verificación, y puede validar los resultados a través de la DVUI de Konfuzio.

¿Tiene alguna pregunta sobre Amazon Textract o Document Validation UI by Konfuzio? Póngase en contacto con nosotros en cualquier momento a través del Formulario de contacto.

Quiénes somos

Más artículos interesantes

Matriculación de vehículos OCR

Escanear el permiso de circulación y registrar los datos con IA | Actualización 2024

El software de escáner AI captura todos los datos en solo unos segundos para la industria del automóvil, las compañías de seguros y las autoridades. Optimice sus procesos con un...

Leer el artículo
Automatización W-2 AI Marketplace Konfuzio

Cómo automatizar el tratamiento de los formularios W-2

Estados Unidos, fecha límite 15 de abril, cada año de nuevo: cada primavera, la temporada de impuestos está en pleno apogeo y la fecha límite para presentar...

Leer el artículo

Modelo de IA para la exposición inmobiliaria en el mercado Konfuzio

Al utilizar una solución de IA para procesar las exposiciones inmobiliarias, no solo los prestamistas ahorran tiempo y recursos, sino que los agentes inmobiliarios...

Leer el artículo
Flecha arriba