人工智能被成功地用于业务流程的自动化,例如,在应用中的数据提取。 IDP软件 用过的。
尽管技术先进,但在数据提取方面几乎不可能达到100 %的准确性。在某些行业,即使是1个%的错误也会造成数百万欧元的损失。
尽管有IDP软件,人工智能和机器学习也有无法克服的限制。为了获得成功,它们需要以人在回路中的自动化形式与人类的反馈相结合。

本文章以德语撰写,可自动翻译成其他语言并进行重读。我们欢迎您在文章末尾进行反馈。
人在回路中 - 定义
人在回路(HITL)描述了一种机制,它使用人类互动来训练、完善或测试特定系统,如人工智能模型或机器,以达到最准确的结果。
这方面的一个简单例子是超市里的自动扫描机。虽然顾客可以自己扫描他们的产品,但总有工作人员在现场帮助解决任何问题并防止欺诈企图。
对HITL和KI来说,方法是类似的。
人在囧途
现代技术并不完美。这就是为什么人们必须参与到自动化中来,并始终使其与当前的目标和需求保持一致。
人工智能不仅需要在开始时接受人类的训练,以做出正确的决定,人类还需要干预并纠正任何错误。这被称为反馈回路,用于提高人工智能的准确性。
你可以在以下应用领域使用HITL。
- OCR软件
- 自动驾驶汽车
- 文件和电子邮件处理
- 处理忠诚行动的收据
- 应付账款的发票处理
- 敏感信息的匿名化,以利于合规
- 用于KYC流程的徽章验证
通过HITL,你可以快速发现问题,并通过反馈回路(也叫HITL注释)进行改进。
这个过程解释如下。

循环中的人和注释
当人工智能模型被开发时,人类对数据的标记通常是这个过程的一部分。
为了获得可靠的结果,人工智能模型需要大量的数据由人类进行注释、标记和组织,这需要大量的时间、金钱和努力。
数据注释器和人在环帮助人工智能模型专注于特定的数据领域,以做出最佳预测。
例如,公司可能需要送入数千张贴有标签的收据以获得可靠的结果。
虽然有多种解决方案可以达到97 %的准确度,但HITL自动化是获得标记数据集以训练AI模型的更好选择。

HITL 自动化的优势
对于复杂的过程,没有任何解决方案可以达到0 %的错误率,一个完全自动化的解决方案没有人类的协助。
为了尽可能地接近这一错误率,同时减少人工工作量,通过人在回路中的过程,将人工智能与自动化相结合,已被证明是成功的。
使用HITL来训练AI模型或改进工作流程有几个好处,包括。
- 减少风险。 减轻因数据不正确而产生的财务风险,如发票金额、发票地址、信贷金额等。
- 简化异常处理。 轻松实现人工审查和异常处理的工作流程。
- 高效的人员部署。 管理、监督和提高从事人类审查的工作人员的生产力。
- 成本控制。 用可配置的过滤器控制人工审查成本。
- 数据的完整性。 确保提取的数据对下游的商业应用是完整的。
- HITL的应用导致了 提高精度 在预测、提取、分类和验证方面,以及提高结果的质量。
- 人的输入可以用来 逐步改进算法 和人工智能所以为 更多可用的应用领域 来做。
- ǞǞǞ 效率 人工智能模型的质量不受训练它们的数据质量的限制。
- 改进和有效的处理 的不完整和困难的数据集
然而,这个程序有一些限制,你必须遵守。
挑战
如果你想使用HITL,你应该意识到它所带来的挑战和限制。
- 识别环中人。 公司需要找出谁将操作自动化流程的哪一部分和哪一个界面,以确定人在环形系统。
- 大数据。 HITL不能总是有效地处理大量的数据,因为在自动化循环中更需要人类的参与。为了以可操作的方式规划公司的战略目标,解决方案的连续扩展直至最终的综合人工智能解决方案在此尤为关键。
- 有限的可扩展性。 当人类参与到一个过程中时,可扩展性会成为一个问题。挑战在于调整置信度,以便只有不确定的情况需要人工验证。
然而,与人工形式的相同工作流程的挑战和缺点相比,这些限制是次要的,不应妨碍你在业务中使用人工智能。
什么时候应该进行 "人在回路"?
在周期的开始或结束时使用人在回路是最有意义的。
开始时的HITL
如果没有标准的解决方案,你应该在周期开始时就加入HITL。
如果你目前没有人工智能模型或算法来实现特定流程的自动化,但你有大量的原始数据,你可以使用人在回路来标记和清理(删除或纠正不准确的数据)这些数据。
数据被标记后,你可以用它来训练你自己的AI模型,以 账单 或从中提取数据。
例如,你可以标记许多不同的发票来训练AI模型进行发票识别。
这样,你可以从0 %自动化到+80 %自动化。
因此,在以下情况下,把人放在循环的起点是有意义的。
- 数据集的结构
- 创建你自己的AI模型
- 无自动化或低自动化,目标为+80 % 自动化
- 有自己的数据注释者和人工智能专家
最后的HITL
在许多情况下,使用人在回路中完成流程是很常见的。这种方法结合了自动化处理重复性任务和人类智慧,以确保所有事情都能正确完成。
通常80 %的工作流程已经自动化,20 %是由人完成的。那么,什么时候值得选择这种方法而不是以前的方法呢?
- 他们在数据检索、预测、验证、匿名化等方面努力追求最大的精度。
- 你希望减少20个%的人工干预需求,以降低管理成本。
- 你想减少昂贵的错误(如不准确的数据、重复的数据等)。
- 你想优化执行时间,同时保持高精确度。
外部与自我管理的HITLS
有两种不同的方式来遵循HITL方法。
- 外部管理的HITL: 由外部方(如SaaS提供商、数据注释服务提供商)提供的人在环。
- 自我管理的HITL:让人自己参与循环的公司。
方法 | 优势 | 劣势 |
外部管理的HITL | 在高峰期管理大量的数据 | 如果软件供应商不允许将许可证安装在自己的服务器上,即所谓的on-prem,那么数据就会流向外部方 |
快速,通常是24/7的可用性 | SaaS解决方案的安全措施取决于外部方(解决方案:预制)。 | |
更具成本效益 | SaaS供应商的法律合规性大多不明确 | |
不需要为员工培训投入时间 | ||
自我管理的HITL | 数据仍在公司内 | 初次安装所需的IT能力 |
员工获得更多的知识 | 培训和实施可能是成本密集型的 | |
收集数据的好机会 | ||
发展自己的服务项目 |
结论--通过人机交互 OCR 优化人工智能
通过人在回路的自动化,你可以实现以下目标。
- 提高数据提取的准确性
- 加快处理时间
- 减少管理费用
- 提高员工参与度
- 通过人工智能的提前工作,将昂贵的人为错误降到最低。
- 通过人工智能和人类的结合实现四眼原则
你可以通过回答以下问题找到合适的供应商。
- 你的组织是否需要在数据提取方面达到接近100 %的准确度?
- 你需要外部或内部管理的HITL吗?
- 你有内部的人工智能专家吗?
- 数据在你的内部基础设施中保持100 %这一事实有多重要?
- 什么对你的应用是重要的?
- 你想建立你自己的数据集吗?
人工智能的优势在于,它可以像人类一样执行功能,快速准确地开发和理解重要的见解。
无论你的商业模式如何,使用AI的OCR解决方案可以帮助你让数据为你工作。
更多关于该主题的文章。