这不再是一个非常典型的形象,但它们仍然存在:银行客户填写转账表格并提交给银行。这些表格上的数据早已不再由银行员工手动输入内部系统。就像文件本身的处理一样,这些表格的扫描也是自动化的。这项技术被称为OCR。 光学字符识别 或光学字符识别。对于加工量大的行业,实施这种解决方案是值得的。但是,没有开发部门或公司重点不同的公司怎么办?这就是在线OCR解决方案发挥作用的地方。
本文章以德语撰写,可自动翻译成其他语言并进行重读。我们欢迎您在文章末尾进行反馈。
在线OCR解决方案一目了然
OCR的使用往往是微妙的,作为更复杂的过程中的一个辅助功能。OCR对客户和公司内部流程都很重要。
为消费者提供在线文本识别
作为精通技术的消费者,你至少已经使用过一次在线OCR应用程序的机会是最高的。例如,当人们想把图像或PDF文件中的数据快速转换为允许继续处理这些数据的形式时,就是这种情况,用于家庭会计、家谱研究或其他嗜好。在这里,在线平台提供了从文件中提取文本和数据的最快方式。用户不需要在他的电脑上安装任何软件,而且通常可以选择各种输出格式。例如,PDF文件可以转换为Excel或Word,这取决于版面和内容。也可以使用JPG或TIFF等图像文件。文件被上传到选定的平台进行转换。然后在供应商的服务器上进行处理。一旦输出文件准备好了,比如一个Excel文件,用户就可以下载它。
在公司中整合OCR
对于公司来说,经常会出现其他要求。在这里,使用公共平台的人工流程并不是在线处理的可靠方法。另一方面,更重要的是,OCR处理被整合到公司的现有流程中。为此,有一些技术接口,简而言之就是 APIs,对网络上的OCR服务提供者。然后,该API允许公司的软件应用程序直接在线访问OCR服务。
这方面的一个例子是传入 账单.这些都是通过电子邮件以PDF格式直接发送到企业家的邮箱。以同样的方式,发票仍然可以以经典的纸质形式收到。如果是纸质发票,所有页面都要扫描,以便将其转换成数字JPG、PNG或TIFF图像。之后,两种情况的过程又是一样的。通过API,文件可以自动转发到在线服务进行文字处理。然后直接处理转换后的文件,例如,读出账户数据、价格表或收件人的详细资料。
一个Word文档也可以作为新内容的基础。例如,如果使用了JPG图像,图像信息可以直接用于 注释标题或图像描述可用于在互联网上展示。
在线解决方案的优势
在线委托OCR任务的方法有几个优点。这要从基础设施开始。复杂的处理,特别是在文件量大的情况下,需要在公司增加硬件。硬件以及软件本身都需要定期维护和更新。这需要给IT团队带来额外的负担,或者需要雇用额外的工作人员或服务提供商。
使用内部解决方案,性能峰值也更难吸收。如果短时间内需要更多的计算能力,创业者只能慢慢积累内部资源。在线OCR解决方案利用可变资源工作,并能通过现代云架构对更高的要求立即作出反应。软件更新。 对OCR算法的改进 等,都可以立即提供给在线服务的用户,而无需人工更新。
我应该使用开放源码还是商业OCR解决方案?
对于中小型企业来说,主要问题是一个可自由使用的开源软件是否足以满足OCR解决方案的需要。还是商业平台是更有效的方式?在这里,它在很大程度上取决于公司内部的能力。开源的OCR解决方案,如 宇宙魔方 这并不涉及软件本身的任何购置成本。无论是PDF还是图像,许多格式都可以阅读,许多语言都可以识别。然而,它需要技术专长,将其作为一个在线组件整合到现有的IT基础设施中。没有提供技术支持,但可以在互联网上找到说明和文件。IT管理员可以用它来为公司进行设置。
另一方面,商业供应商则提供直接的客户服务。硬件使用和软件的云连接通常已经包括在内。值得比较各供应商的服务和价格。人们应该问自己。
- 在线解决方案是否提供我需要的所有OCR功能?
- 将API集成到我的系统中去有多容易?
- 我能否将平台的API用于我既定的输入格式(我是否使用更多的PDF文件或图像,更多的长文本或复杂的表格)?
- 这些工具能否将我的文件转换成所需的输出格式(Excel、Word、JSON、XML等)?
- 它是否能跟上未来的增长前景?
- 我是否可能为许多我永远不需要的服务付费?
通过这种分析,可以选择相关的候选人。
还要考虑在线OCR解决方案的安全性
尽管有这么多优点,重要的是不要忘记安全。在许多情况下,敏感数据是在网上传输的。在选择供应商时,必须高度重视数据的传输方式。毕竟,一个PDF或图像可能包含非常个人的数据。这可以是任何文本,如财务信息、生日、私人地址或医疗细节。在任何情况下,文件的传输都必须有强大的加密功能,这样就没有人能够在系统之间拦截数据。OCR供应商的系统本身也必须得到强有力的保护,以防止外部攻击。这应该是选择供应商时的一个重要标准。
除了数据安全之外,数据保护也发挥着重要作用。特别是在欧洲,这受到《数据保护条例》的严格监管,即基本数据保护条例。如果可能的话,在线供应商的服务器应位于欧洲境内(更多关于第三国的信息)。不应将数据推导到其他地区。在线处理后,原始文件(如发票扫描件或PDF文件)和转换后的文件(如完成的Excel表格)都不应该留在OCR系统的服务器上。
文本识别的准确性
收据示例
原始图像

传统的在线OCR通常不能识别所有的文本元素。识别的文本元素是灰色的。
Konfuzio OCR可识别所有单词

身份证在线扫描实例
原始图像

传统的OCR只识别有错误的字母。
Konfuzio在线OCR

移动和智能--OCR的未来
一旦建立了自己的系统与在线解决方案的连接,就会出现许多新的可能性,以改善内部流程或与客户或业务伙伴的沟通。由于分布式计算能力,文字识别也很容易从移动设备上进行。由于OCR平台的不断扩展,新的服务很快就会出现。智能算法与 人工智能 (AI)允许识别多页的手写和零散的信息。
视频资源也正在成为焦点。从视频中进行文字识别的工具可以在不牺牲自身系统性能的情况下转换内容。然后,提取的文本可以被用来,例如,改善视频资源的免费可及性。而且不仅是OCR处理,还包括 后续处理步骤 可以逐步转移到云端。这使该公司能够集中精力于其核心业务,而不必担心服务器技术和IT管理问题。
资料来源
- 在《一般数据保护条例》(DSGVO)中关于第三国的规定。 https://dsgvo-gesetz.de/themen/drittland/
- 开源OCR解决方案Tesseract文档。 https://tesseract-ocr.github.io/tessdoc/
在线OCR应用和本地OCR应用之间的区别在于通过互联网传输文件。这种传输必须是明显安全的。此外,供应商必须保护其自己服务器上的数据不被滥用。关于这些措施的更多信息,可向所有信誉良好的供应商索取。
对于私人用户,有各种平台可用于直接转换PDF文件。该PDF文件应在本地设备(桌面、平板电脑、智能手机)上可用。然后,该文件可以通过一个表格上传到供应商的服务器。附加选项允许选择输出格式。一旦OCR处理完成,结果文件就可以下载了。
在线平台的OCR处理结果的质量与自己电脑上的应用没有本质的区别。更重要的是所使用的算法。这里往往有明显的差异,特别是对于更复杂的内容和可剪切阅读的文件。通常情况下,本地应用程序在计算机上使用几年后就不是最先进的了。另一方面,在线平台总是提供最新的版本,因为它们会自动为所有用户更新。机器学习在网络平台上的效果也更好,因为有更多的数据可以用来训练算法。
Schreibe einen Kommentar