常见问题

常见问题

AI Konfuzio是如何工作的?

该人工智能软件使用监督学习来学习规律性的东西,并将其自动应用于新传入的文件。算法在实例的基础上学习你的专家知识的规律性。学习过程的结果可以与已知的、正确的结果进行比较,也就是特别好地 "监测"。

与经典的OCR解决方案相比,AI软件提供了哪些附加价值?

该软件完全省去了创建规则或布局的工作。这种人工活动,在老的供应商中很常见,被算法所取代。这节省了IT专家的资源,因为软件向非IT专家学习,而且仍有可能对软件进行定制。该软件不使用任何种类的群集智能,因此你的专家知识不会被共享。

你们提供哪些现成的文件模型?

你从我们这里获得的人工智能软件没有经过预训练的模型。如果你希望使用现成的人工智能,我们将把你转给那些已经预付了款项并提供现成模型的合作伙伴。

人工智能软件需要学习多少个例子?

对于每个领域,人工智能需要大约20个单独的案例,以便人工智能能够学习一个所谓的标签。你对读出的每条信息都会收到一个单独的信心值。

人工智能软件是为谁设计的?

该软件旨在满足IT部门、软件制造商、IT系统集成商和数据科学家的需求。

我是否能得到人工智能模型的数据和源代码?

训练你自己的模型的数据可以通过API或Python包获得。源代码只有在超出纯粹的低代码训练的个别模型开发中才可以通过网络界面获取。如果你有兴趣,可以进行知识转让,使你能够训练自己的模型。

OCR软件的操作是在云端托管吗?

是的,Helm & Nagel GmbH在德国和荷兰的服务器上提供人工智能软件作为OTC、Open Telekom云的SaaS变体。

SaaS变体是否符合DSGVO?

我们的技术和组织措施(TOMs)适用。Helm & Nagel GmbH与您(作为客户)之间的GCU(合同处理协议)规定,完全遵守DSGVO第27/28条关于您的个人数据的规定。不仅是GCU,而且保密协议(NDA)也将范围扩大到客户的关联公司。你必须自己检查你所处理的数据是否是个人数据。

是否也提供内部解决方案?

是的,现场安装是在Kubernetes集群中进行的,或者以Docker镜像的形式在没有显卡的Redhat Linux服务器上进行,至少有8个2.6GHz处理器,包括AVX2 CPU指令扩展和64GB内存。

我可以得到一个试用账户吗?

是的,请通过联系表与我们联系。

我在哪里可以找到价格表?

你可以在下面找到价格 https://konfuzio.com/de/aktuelle-preisliste/.该页面有密码保护。请与我们联系以获得密码。

结算是如何进行的?

你将通过电子邮件收到发票。

是否有可能h的规则来存放的?

不,人工智能软件不会取代业务规则引擎(BRE)或工作流程引擎。

训练中涉及哪些努力?

你想提取的每个领域需要大约2小时。一个字段可以是,例如,送货单号或物品号。如果你愿意,Helm & Nagel GmbH将按顺序学习你的模型。

人工智能何时学习?

人工智能的全自动训练可以通过API或网络界面开始。

需要什么样的扫描分辨率?

没有任何限制。请在测试访问的框架内测试你的扫描的文本识别。你会惊讶地发现,即使是车辆登记文件和分辨率不高的扫描件也能被识别。

提供的接口使用了哪些技术?

通过使用成熟的Django Rest框架,可以非常容易地提供和消费多种格式的接口,从而使应用程序可以快速链接到第三方系统,也可以在开发现代单页应用程序或本地移动应用程序时使用。

使用这些接口的要求是什么?

关于如何使用这些接口的更多信息,请参见《Swagger RESTful API文档规范》。

OCR是否能识别手写体?

是的,但是,我们请你重新考虑,手写的自动化是否不能用网络表格来解决。

是否支持复选框?

OCR可以识别文字和手写体。不能保证对文本框的识别。

如何快速提供处理数据?

以100页为例,文本识别平均需要1.4秒。此外,每一个待识别的字段需要大约0.1秒。

我怎样才能得到结果?

你可以通过REST API以JSON格式同步或异步接收结果,或通过手动下载CSV格式接收结果。也可以为每个文件定义一个单独的webhook URL。

文件能否由人工智能自动分离?

全世界都没有可靠的方法来分离具有人工智能的文件。我们正在研究一个,并提供基于规则的分离,直到进一步通知。

我如何解释这些统计值?

统计值的计算以相关文献为基础。维基百科提供了一个介绍,网址是https://en.wikipedia.org/wiki/F-score。我们公开了计算评价的源代码。

培训和生产环境之间是否有分离?

是的,所有的软件创新都是自动测试的,如果没有错误就在测试系统上推出。在每次发布之前,我们都会在暂存环境中进行广泛的集成测试。在所有测试成功完成后,我们会向你提供这些变化。如果与预期相反,你发现有错误,请告知我们。 https://konfuzio.com/support/.

该系统用于哪些负载是有成效的?

SaaS变体可自动扩展,提供每小时10000页的基本容量。现场安装提供了每小时至少6000页的容量,并可作为一个集群完全扩展。

运行期间如何进行监测?

在SaaS模式下,我们为你接管了对应用程序的监控。在现场安装时,通过Grafana和Kubernetes仪表盘进行监控。你还可以通过API访问每个文件的处理状态。

哪些检测率可以得到保证?

我们保证在您的文件上测量的准确性,并根据要求提供记录状态 "测试"。

人工智能在软件中的应用是什么?

一个例子是预测一个新收到的项目的项目编号、单价和总价。 发票.人们通常认为只有一个 "AI "被使用。不幸的是,文件处理要复杂得多,所以我们需要使用不同的AI算法。
在大多数情况下,数字文件不包含任何文本,只提供内容的视觉表现。我们使用OCR从该图像中提取字符、单词、线条、表格和段落。为了给这些文本元素分配一个主题语境,NER算法会分配单个字符、字母、句子或段落。在这一点上,已经出现了各种各样的应用可能性。从货币的确认到合同分析。回到发票的案例中,这个算法可以找到各种物品编号、单个价格和总价格。在最后一步,另一个人工智能算法将发现的文章编号、单个价格和总价格分配给一个技术概念。在这种情况下,该算法会识别出对单一项目的分配。这尤其具有挑战性,因为一个项目的项目编号、单价和总价不一定在一个行内。为了能够实现特别可靠的分配,我们开发了一种人工智能,考虑到相对空间文本信息来识别主题背景,因此可以,例如,将文章编号、单价和总价分割成单独的行项目,并将它们与债权人和债务人相关的信息分开。

箭头向上