Amazon Textract 和 Konfuzio DVUI - 无需培训即可提取数据

您想找到一种无需先训练模型就能从任何文档中快速提取信息的方法吗?现在就有一个解决方案:

使用 Konfuzio 市场上集成的 Amazon Textract,结合文档验证用户界面 (DVUI),可高效处理文档并可视化或修改结果。

文件验证用户界面 (Amazon Textract 是 Konfuzio 的 DVUI,它允许您高效地处理文档并可视化或修改结果。在这篇博文中,我们将介绍 Amazon Textract 及其功能,以及通过集成 Konfuzio 对其进行扩展的可能方法。

在这方面,我们还阐明了 亚马逊 A2I 我们将向您展示 Amazon Textract 与 Konfuzio 的集成方式,将其与 Konfuzio 的 DVUI 进行比较,并为您提供如何在市场中充分利用 Amazon Textract 与 Konfuzio 集成的有用提示。

什么是亚马逊 Textract?

Amazon Textract 是亚马逊网络服务(AWS)开发的一项技术。它可以从所有类型的文档中提取文本和结构化数据。AWS 可以处理的信息包括文本、表格数据、表单数据、OMR(光学标记识别)、手写和签名。当用户输入他们的 API 文件处理结果以嵌套的 JSON 呈现提取对象之间的层次关系,如键值对。

亚马逊 Textract 和 Konfuzio - 集成

Amazon Textract 本身就是一个强大的工具。但与 Konfuzio 结合使用时,这项技术将释放出更大的能量,将应用程序提升到一个更高的水平。可以对 Textract 进行 API 调用,从而将其用作定制的 提取人工智能 并在 Konfuzio 上创建文档处理流水线。

Textract 使用返回的数据在处理过的文档中创建注释。然后将这些注释归入所谓的 "键值注释集 "逻辑组中。当表单提供多个选项供选择时,会将这些选项标记为 "已选 "和 "未选"。这类组的典型例子有

  • 键: 名称
  • 价值: Erika
  • 关键词:婚姻状况
  • 已选定:单人
  • 未选择:已婚
  • 未选择:离婚

表格数据通常被归类为表格所含值的单组注释。文档处理和注释完成后,用户可以访问 DVUI 检查注释的正确性,如果缺少信息,还可以添加新的注释。

亚马逊还有一个用于验证自动注释的接口,称为 A2I,我们将在下一节详细介绍。

Konfuzio DVUI 与亚马逊 A2I 的比较

要检查注释的正确性或在注释前编辑文档(例如,分割由多个子文档组成的堆叠文档),用户必须访问验证界面。为此,Konfuzio 和亚马逊都提供了自己的开发工具。让我们看看它们有哪些共同点和不同点。

特点亚马逊 A2IKonfuzio DVUI
人在回路中
外部注释者的无障碍访问✔*
处理不同的数据类型和任务
显示不同注释组的多个注释
在驾驶过程中添加新注释
修改文件(分割、旋转、重新排列)
可集成到定制解决方案中
* 只要用户有访问权限

如上表所示,亚马逊 A2I 的功能使其能够灵活地处理不同类型的处理数据或人工验证人员的任务。Konfuzio DVUI 具有独特的功能,使其能够最好地处理文档注释。

可能的用例

亚马逊 Textract Konfuzio 使用案例

Amazon Textract 和 Konfuzio 的集成适用于所有类型的文档。

亚马逊 Textract 和 Konfuzio 的组合解决方案

根据当前状态(09/2023),支持以下语言:

  • 英语
  • 德国
  • 西班牙语
  • 法语
  • 意大利语
  • 土耳其语

美国是亚马逊 Textract 和 Konfuzio DVUI 的需求地区

让我们来看看文档处理需求最大的地区之一:美国市场。目前,企业和个人每天都要处理几大类文件。主要包括

  • 发票和收据
  • 税收
  • 合同
  • 账户报表和交易
  • 与医疗保健和保险有关的文件
  • 车辆相关表格

所有这些文档都是亚马逊 Textract 和 Konfuzio 集成的潜在用例,因为与人工处理相比,自动处理这些文档可大大加快处理速度。

适合自动化的常见形式

适合自动化的最常见形式包括

  • CMS 40B申请加入医疗保险
  • CMS R-285文件:要求提供有关退休福利的信息
  • 国税局 4506-C 表格税表
  • 医疗保险卡 ID
  • CMS-1500医疗保险申请表
  • CMS-100申请就业
  • W3 和 W4 表格报税表

亚马逊 Textract 如何与 Konfuzio 配合使用 - 示例

本实例说明了 Amazon Textract 如何与 Konfuzio 结合使用,用户如何获得访问权限并测试集成。

让我们仔细看看亚马逊 Textract 文档。它包含文本、复选框和表格。该文档已集成到 Konfuzio 中并正在处理中。我们的默认文档是来自互联网提供商的收据。它包含所有三种数据类型。

亚马逊 Textract 文档样本
亚马逊 Textract 文档样本 2

处理完成后,我们发现所有三种数据类型都已正确标注:

亚马逊 Textract Konfuzio
亚马逊 Textract Konfuzio 2

对示例的解释

  • 黑色田野表示文本数据的键值对。
  • 红色田野代表表格数据。
  • 原因领域勾选 OMR 复选框和表格数据。

您想亲身体验亚马逊 Textract 与 Konfuzio 的结合吗?目前,Konfuzio 市场上已有该集成产品。

要使用它,您必须在以下网站拥有一个账户 app.confuzio.com 并申请访问表格列表。访问请求成功后,我们的专家将与您联系。

总结

Amazon Textract 易于集成,最好与 Konfuzio 及其 DVUI 一起使用,以提供快速、准确的 数据提取 无需事先训练模型。您可以选择在 Konfuzio Marketplace 上测试集成,并亲自尝试提取任何类型的文档。Amazon Textract 可轻松处理文本和表格数据以及表单和复选框,您还可以通过 Konfuzio DVUI 验证结果。

您是否对 Amazon Textract 或 Konfuzio 的文档验证 UI 有任何疑问?请随时通过 联系表格.

"
"
Elizaveta Ezhergina 的头像

最新文章