Amazon Textract DVUI Konfuzio

Amazon Textract et Konfuzio DVUI - Extraction de données sans formation

Elizaveta Ezhergina

Vous souhaitez trouver un moyen d'extraire rapidement des informations de n'importe quel document sans avoir à entraîner un modèle au préalable ? Il existe une solution pour cela :

Utilisez l'Amazon Textract intégré qui se trouve sur le Marché de Konfuzio et qui, en combinaison avec l'interface utilisateur de validation de documents (DVUI), permet de traiter efficacement les documents et de visualiser ou de modifier les résultats.

En collaboration avec la Validation de documents UI (DVUI) de Konfuzio, il permet de traiter efficacement les documents et de visualiser ou de modifier vos résultats. Dans ce blog post, nous parlons d'Amazon Textract et de ses fonctionnalités, ainsi que des moyens possibles de les étendre en intégrant Konfuzio.

De plus, dans ce contexte, nous mettons en lumière Amazon A2I Nous vous donnerons des conseils utiles sur la manière d'utiliser l'intégration d'Amazon Textract avec Konfuzio sur la place de marché.

Qu'est-ce qu'Amazon Textract ?

Amazon Textract est une technologie développée par Amazon Web Services (AWS). Elle permet d'extraire des données textuelles et structurées de tous les types de documents. Les informations qu'AWS peut traiter comprennent les textes, les données de tableaux, les données de formulaires, l'OMR (Optical Mark Recognition), l'écriture et les signatures. Lorsqu'un utilisateur saisit son API les résultats du traitement des documents sont affichés sous la forme d'un tableau imbriqué. JSON avec des relations hiérarchiques entre les objets extraits, telles que les paires clé-valeur, sont présentées.

Amazon Textract et Konfuzio - L'intégration

Amazon Textract est en soi un outil puissant. Mais en combinaison avec Konfuzio, cette technologie est encore plus performante, ce qui porte l'application à un niveau supérieur. Il est possible de faire un appel à l'API de Textract et de l'utiliser ainsi comme une application personnalisée. IA d'extraction dans un wrapper ainsi que de créer un pipeline de traitement de documents sur Konfuzio.

Textract utilise les données renvoyées pour créer des annotations dans les documents traités. Ces annotations sont ensuite regroupées en groupes logiques appelés Key-Value Annotation Sets. Lorsque les formulaires proposent plusieurs options à choisir, celles-ci sont identifiées par les termes "Selected" et "NotSelected". Des exemples typiques de tels groupes sont

  • Clé : Nom
  • Valeur : Erika
  • Clé : état civil
  • Sélectionné(e) : Célibataire
  • N'a pas été sélectionné : Marié(e)
  • N'a pas été sélectionné : Divorcé(e)

Les données des tableaux sont généralement regroupées dans un seul ensemble d'annotations pour les valeurs contenues dans le tableau. Une fois qu'un document a été traité et annoté, un utilisateur peut faire appel à la DVUI pour vérifier l'exactitude des annotations et éventuellement en ajouter de nouvelles - si des informations manquent.

Amazon dispose également d'une interface de validation des annotations automatiques appelée A2I, que nous allons tous deux examiner de plus près dans la section suivante.

Konfuzio DVUI vs. Amazon A2I - Une comparaison

Pour vérifier l'exactitude des annotations ou pour modifier les documents avant de les annoter - par exemple pour diviser un document empilé composé de plusieurs sous-documents - l'utilisateur doit avoir accès à une interface de validation. Tant Konfuzio qu'Amazon proposent leurs propres développements à cet effet. Voyons quels sont leurs points communs et leurs différences.

FonctionnalitéAmazon A2IKonfuzio DVUI
Homme dans la boucle
Accessibilité pour les annotateurs externes✔*
Traitement de différents types de données et de tâches
Affichage de plusieurs annotations de différents groupes d'annotations
Ajouter de nouvelles annotations en cours de route
Modification de documents (diviser, faire pivoter, réorganiser)
Possibilité d'intégration dans des solutions spécifiques au client
* à condition que l'utilisateur ait accès

Comme le montre le tableau ci-dessus, Amazon A2I dispose de fonctions qui permettent de traiter de manière flexible différents types de données traitées ou de tâches pour les validateurs humains. Konfuzio DVUI possède des fonctions uniques qui permettent de travailler au mieux avec l'annotation de documents.

Cas d'application possibles

Amazon Textract Konfuzio Cas d'utilisation

L'intégration d'Amazon Textract et de Konfuzio s'applique à tous les types de documents.

La solution combinée d'Amazon Textract et de Konfuzio

Les langues suivantes sont prises en charge selon l'état actuel (09/2023) :

  • Anglais
  • Allemand
  • Espagnol
  • Français
  • Italien
  • Turc

Les États-Unis comme zone de demande pour Amazon Textract et Konfuzio DVUI

Jetons un coup d'œil à l'un des plus grands domaines de demande pour le traitement des documents : le marché américain. Actuellement, il existe plusieurs groupes principaux de documents auxquels les entreprises et les particuliers sont confrontés quotidiennement. Il s'agit principalement

  • Factures et reçus
  • Impôts
  • Contrats
  • Relevés de compte et transactions
  • Documents liés à la santé et aux assurances
  • Formulaires relatifs aux véhicules

Tous ces documents sont des cas d'application potentiels pour l'intégration d'Amazon Textract et de Konfuzio, car l'automatisation du travail avec ces documents accélère énormément le traitement par rapport au traitement manuel.

Formulaires courants adaptés à l'automatisation

Voici quelques-uns des formulaires les plus courants qui se prêtent à l'automatisation :

  • CMS 40B: Demande d'inscription à Medicare
  • CMS R-285: Demande d'informations sur les prestations de retraite
  • Formulaire IRS 4506-C: Formulaire d'impôt
  • ID de la carte d'assurance Medicare
  • CMS-1500: Demande d'assurance maladie
  • CMS-100: Demande d'emploi
  • Formulaires W3 & W4: Déclarations d'impôts

Comment fonctionne Amazon Textract avec Konfuzio - Un exemple

Cet exemple pratique illustre comment Amazon Textract fonctionne en combinaison avec Konfuzio, comment l'utilisateur obtient l'accès et teste l'intégration.

Examinons de plus près un document d'Amazon Textract. Il contient à la fois du texte, des cases à cocher et des tableaux. Le document est déjà intégré dans Konfuzio et est en cours de traitement. Notre document standard est un reçu d'un fournisseur d'accès à Internet. Il contient les trois types de données.

Amazon Textract Sample Document
Amazon Textract Sample Document 2

Une fois le traitement terminé, nous constatons que les trois types de données ont été correctement annotés :

Amazon Textract Konfuzio
Amazon Textract Konfuzio 2

L'explication de l'exemple

  • Champs noirs: Elles représentent les paires clé-valeur des données textuelles.
  • Champs rouges: Ils représentent des données de tableau.
  • Raisons Champs: Ceux-ci mettent en évidence les cases de contrôle OMR et les données de formulaire.

Vous voulez essayer vous-même la combinaison d'Amazon Textract et de Konfuzio ? L'intégration est actuellement disponible sur le Konfuzio Marché disponibles.

Pour l'utiliser, vous devez créer un compte sur app.konfuzio.com et demander l'accès au listing Forms. Nos experts vous contacteront une fois la demande d'accès effectuée avec succès.

Conclusion

Amazon Textract s'intègre facilement et s'utilise idéalement avec Konfuzio et son DVUI pour fournir un service rapide et précis. Extraction de données sans formation préalable des modèles. Vous avez la possibilité de tester l'intégration sur la place de marché Konfuzio et d'essayer vous-même l'extraction de documents de tout type. Amazon Textract traite facilement les données textuelles et tabulaires ainsi que les formulaires et les cases à cocher - et vous pouvez valider les résultats via la Konfuzio DVUI.

Vous avez des questions concernant Amazon Textract ou Document Validation UI de Konfuzio ? Contactez-nous à tout moment via le Formulaire de contact.

À propos de nous

Autres grands articles

W-2 automation AI Marketplace Konfuzio

Comment automatiser le traitement des formulaires W-2

États-Unis, date limite du 15 avril, tous les ans : chaque printemps, la saison des impôts bat son plein et la date limite de...

Lire l'article
Konfuzio Marché Marketplace IA Expertise

Konfuzio Marketplace - Présentez votre expertise en IA

La place de marché Konfuzio est une offre qui aide les entreprises, les développeurs et les passionnés à relever les défis du développement de l'IA. Que ce soit ...

Lire l'article
Scanners de codes-barres

Scanner de codes-barres - Comment il fonctionne et ses domaines d'application

En 1974, le premier code-barres a fait son apparition dans le monde. Depuis, les lignes verticales ont révolutionné la façon de travailler des entreprises. Car : elles...

Lire l'article
Arrow-up