本文章以德语撰写,可自动翻译成其他语言并进行重读。我们欢迎您在文章末尾进行反馈。
通过OCR和NLP进行AI驱动的输入管理
在保险公司,通过输入管理系统将流程数字化早已不是什么新鲜事。这些系统接管了传入邮件的处理,直至归档。主要目标是以结构化的方式准备数据,然后将其传递给下游系统,如ERP系统。然而,这些工具往往是过时的,而且非常昂贵。通过结合各种人工智能(AI)解决方案来扩大输入管理,如自动文本识别(OCR)和文本处理(NLP)已经被用于今天保险公司的62个%的客户互动[1]。ǞǞǞ 智能OCR 使用关键字和 萃取 的文本字段或文件或电子邮件中的整个文本部分,并将基于规则的方法的准确性提高6 %至93 %。此外,保险公司通过使用智能自动化解决方案(如超自动化)来节省时间。
AI OCR是如何工作的?
利用OCR技术进行自动化文件处理

图1.利用OCR技术进行自动化文件处理
图1显示了用OCR自动处理文件的顺序。一般来说,它们都遵循相同的结构。
- 输入
数据输入(文件)来自数据库,来自一个前端系统,如机器人流程自动化机器人,电子邮件或其他。更多 低代码和无代码供应商 你会在我们下面的文章中发现。
- 预处理
无论文件类型、扫描质量和页数如何,文件都是经过预处理的。
- 智能检测
基于神经的自动文件分类技术可以通过识别文本内容和图像模式,将文件按类型(如驾驶执照、银行对账单、税单、合同、发票)和用户定义的子类别(如供应商A的发票、供应商B的发票)进行分类。
- 指派和归类
用于分类的神经机定义了一个文件类型,并选择一个正确的文件定义进行进一步的内容处理。
- 主题数据提取
在识别了某些字段后,结构化或半结构化的文本被从文件中提取出来并输出到目标系统。
如果需要或需要,人工智能OCR允许人类审查,这是通过设置一个置信度阈值来实现的。这种人类反馈有助于人工智能不断学习。人的反馈,也被称为人在回路中,可以通过以下方式灵活地单独提供。 文件验证用户界面 在每个过程中,都要建立起一套完整的程序。如果没有达到设定的阈值,在数据输出到目标系统之前会进行人工检查。这个过程的最终输出可以是一个XML、JSON、CSV、XLSX/XLS、TXT或HOCR文件。
输入管理功能的范围
1.信件邮寄
收到的信件邮件由相应的邮政物流供应商接收。
2. 信件分类
收到的信件按照 "打开 "或 "不打开 "的标准进行分类。
3.开信
被归类为 "开放 "的信件被打开。开信技术通常用于这一目的。
4.精细分选
所有为后续信件数字化而进行的分拣和准备活动都归入精细分拣区。这包括根据特殊格式、客户、流程类型和流程子类型进行分拣,也包括扫描准备:拆封、准备单个页面、平滑、插入分隔页或应用条形码进行流程/文件分离。
5.扫描
扫描是使用多功能一体机、台式或生产型扫描仪将基于纸张的模拟文件转换为数字文件格式的过程。
6.移动扫描
通过移动应用程序,客户或合作伙伴可以将纸质文件直接扫描到输入管理中。
7.传真导入
当导入传真时,传真直接来自传真服务器。此外,还可以进行图像增强,例如在压缩和缩放方面。
8.电子邮件导入
通过电子邮件导入,电子文件可以从电子邮件系统(Exchange、Lotus Notes)导入输入管理。
9.电子邮件准备
电子邮件的转换方式是,在随后的处理步骤中可以分别分析电子邮件正文和电子邮件附件。通常情况下,这也需要将电子邮件附件转换为机器可读的格式。
10. OCR, OMR, OBR
光学字符识别(OCR)是一种将不是机器可读的字符形式而是图像格式的文本转换为可由计算机处理的编码字符串(编码信息)的方法。此外,光学标记识别(OMR)可用于识别标记(如复选框),光学条形码识别(OBR)可用于识别条形码和数据矩阵代码。
11.网络/门户/文件导入
通过网络/门户导入,电子文件可以从网站或互联网门户导入输入管理。通过文件导入,电子文件可以从文件系统导入到输入管理中。
12.语音信息
例如,语音信息从电话系统导入输入管理。
13 语音转文字
语音转文本将口语转换为可处理的字符串。
14 分类
为扫描的文件自动分配一个文件类型或文件类别。
15.提取
通过机器从扫描的文件中读取文件字段。
16.合理性检查
对照参考数据库,对通过提取捕获的文件字段进行容错检查。
17.数据充实
利用参考数据库对提取的文件字段进行充实。
18 手动校正
在分类和提取中未被识别的文件类型或文件字段,将被手动重新处理并完成数据。
19.特别处理和第一层
进一步处理所需的缺失数据是通过查询的方式手动获得的。一级处理、广泛处理或简单处理是指简单的商业交易被逐一处理。例如,退货的处理,包括必要的地址确定,都属于这个领域。
20.电子邮箱的交接
元数据和文件被发送到电子邮箱进行进一步处理。
21. 移交电子档案
元数据和文件被转移到电子档案馆,以便进行防审计归档。
22.电子邮件回复管理
元数据、文件和电子邮件的原始格式被转移到一个系统中,用于自动回复电子邮件。通过使用电子邮件回复管理,传入的电子邮件可以被更有效地处理和回复,优化与客户和合作伙伴的沟通。
保险业的流程自动化与超自动化
鉴于大流行病和由此产生的经济危机,优化和稳定保险公司的流程变得越来越重要。自动化技术的进步,如OCR、RPA(机器人流程自动化)和AI,正在产生经济上和技术上先进的流程自动化解决方案--超自动化。许多公司的目标是提高服务质量或增加收入,并使现有的流程更加健全,以适应公司的数字化未来。超自动化的使用使流程的自动化超出了基于规则的标准应用。
保险公司通过人工智能自动检测欺诈行为
保险业正日益与欺诈案件作斗争,这些案件每年造成数十亿欧元的损失。根据德国保险协会的数据,在德国支付的索赔中,有10 %进入了欺诈者的账户[2]。为了更好地检测出欺诈企图,需要有技术解决方案,能够始终适应新的情况和欺诈模式,并超越基于规则的输入管理方法。这是因为那里的错误率很高,需要额外的人工努力。通过人工智能和OCR,可以检查损失报告的明显内容模式,并自动检测出异常情况。通过使用人工智能,在一家平均索赔金额约为3000欧元的保险公司中,可以实现超过310万欧元的节约潜力,并发现1029个欺诈案件。
保险业的人工智能使客户的方法个性化
个人化和个性化是2020年代的大趋势之一。标准的解决方案不能给客户带来太多的灵感,对客户个性化的要求也在增加。保险公司可以通过使用基于人工智能的解决方案作为支持,将这一发展作为交叉销售和向上销售的绝佳机会。根据客户信息,可以自动生成个别的电子邮件,并可持续地提高沟通的质量。在这一过程中,自动生成的文本不再能与人工创建的文本区分开来,回复率可以从大约1.5 %提高到35 %。人工智能应用允许通过新的输入进行自动学习,缩小知识差距并独立建立新的联系。预先训练的语言模型,如GPT-3,是强大的文本生成器,可以独立写出连贯的文本,并用于成功解决客户问题[3]。
通过 保险业的人工智能 更好地理解文件
保险公司、经纪人和其他合作伙伴之间的保险文件转移基本上由BiPRO标准430实现标准化,但没有实现自动化[4]。人工智能处理数以百万计的文件中的数据,帮助员工在客户组合中找到交叉销售的潜力,并在合同谈判和投入管理中节省资金。通过使用人工智能,文件中的内容可以以结构化的方式进行检索。打字、重命名、归档和验证等工作步骤几乎完全消除了。这使得纯粹以数字方式处理这些文件成为可能,用已知的主数据充实这些文件,并在各系统之间进行协调。人工智能软件学习理解和构建文件信息的速度比人类快24倍。因此,保险公司从更快和更有效的文件处理中受益。
资料来源
[2] Friedrich, S. (2018).Du Lügst!载于GDV Positions杂志,第3/2018期,第24-26页。
[3] Tan, B., Yang, Z., AI-Shedivat, M., Xing, E. P., & Hu, Z. (2020).长文本的渐进式生成。
照片:Adrianna Calvo