FAQ

Häufig gestellte Fragen

Wie funktioniert die KI Konfuzio?

Die KI-Software nutzt überwachtes Lernen, um Gesetzmäßigkeiten zu erlernen und auf neu eingehende Dokumente automatisch anzuwenden. Algorithmen erlernen Gesetzmäßigkeiten Ihres Expertenwissens an Hand von Beispielen. Die Ergebnisse des Lernprozesses können mit den bekannten, richtigen Ergebnissen verglichen, also besonders gut „überwacht“, werden.

Welchen Mehrwert bietet KI-Software ggü. klassischen OCR Lösungen?

Die Software verzichtet vollständig auf das Anlegen von Regeln oder Layouts. Diese bei älteren Anbietern häufig vertretene manuelle Tätigkeit übernehmen Algorithmen. Dies spart Ressourcen von IT-Experten, da die Software von Nicht-IT Experten lernt und es dennoch möglich ist die Software kundenspezifisch anzupassen. Die Software verzichtet auf jede Art von Schwarmintelligenz, sodass Ihr Expertenwissen nicht geteilt wird.

Welche fertigen Dokumentenmodelle bieten Sie an?

Die KI-Software beziehen Sie ohne vortrainierte Modelle von uns. Sofern Sie die Nutzung fertiger KI wünschen, leiten wir Sie hierzu an Partner weiter, die in die Vorleistung gegangen sind und fertige Modelle anbieten.

Wie viele Beispiele benötigt die KI-Software, um zu lernen?

Je Feld benötigt die KI ca. 20 Einzelfälle, damit die KI ein sogenanntes Label erlernen kann. Je ausgelesener Information erhalten Sie einen individuellen Konfidenzwert.

Für wen ist die KI-Software konzipiert?

Die Software erfüllt die Ansprüche von IT-Abteilungen, Softwareherstellern, IT-Systemintegratoren und Data Scientists konzipiert.

Erhalte ich die Daten und den Source Code der KI Modelle?

Die Daten, um eigene Modelle zu trainieren, sind über die API oder das Python Package zugänglich. Der Source Code wird nur bei individuellen Modellentwicklungen zugänglich, die über das reine Low-Code Training über die Weboberfläche hinausgehen. Sofern bei Ihnen Interesse besteht, ist ein Knowledge Transfer möglich, um Sie zum Training eigener Modelle zu befähigen.

Ist ein Betrieb der OCR-Software in der Cloud gehostet?

Ja, Als SaaS Variante bietet die Helm & Nagel GmbH die KI-Software als SaaS Variante in der OTC, Open Telekom Cloud auf Servern in Deutschland und den Niederlande an.

Ist die SaaS Variante DSGVO konform?

Es gelten unsere technischen und organisatorischen Maßnahmen (TOMs). Die AVV, Auftragsverarbeitungs-Vertrag, zwischen der Helm & Nagel GmbH und Ihnen als Kunden regelt gemäß Artikel 27/28 DSGVO die vollständigen Einhaltung der Bestimmungen für Ihre personenbezogenen Daten. Nicht nur die AVV, sondern auch die Vertraulichkeitsvereinbarung (NDA) erweitern den Geltungsbereich ebenfalls auf die verbundenen Unternehmen des Kunden. Ob die von Ihnen zu verarbeitenden Daten personenbezogene Daten sind, müssen Sie selbst prüfen.

Wird auch eine On-Premise Lösung angeboten?

Ja, On-Site erfolgt die Installation in einem Kubernetes Cluster oder als Docker Image auf Redhat Linux Servern ohne Grafikkarte mit mindestens acht 2.6 GHz Prozessoren inkl. AVX2 CPU Befehlserweiterung und 64 GB RAM.

Kann ich ein Testzugang erhalten?

Ja, kontaktieren Sie uns bitte über das Kontaktformular.

Wo finde ich die Preisliste?

Die Preise finden Sie unter https://konfuzio.com/de/aktuelle-preisliste/. Die Seite ist mit einem Passwort geschützt. Bitte kontaktieren Sie uns, um das Passwort zu erhalten.

Wie erfolgt die Abrechnung?

Die Rechnungen erhalten Sie per E-Mail.

Ist es möglich Regeln zu hinterlegen?

Nein, die KI-Software ersetzt keine Business-Rule-Engine (BRE) oder Workflow-Engine.

Welcher Aufwand entsteht beim Anlernen?

Pro Feld, welches Sie extrahieren möchten, benötigen Sie ca. 2 Stunden. Ein Feld kann z. B. die Lieferscheinnummer oder die Artikelnummer sein. Sofern Sie wünschen, lernt die Helm & Nagel GmbH Ihr Modell im Auftrag an.

Wann lernt die KI?

Das vollautomatische Training der KI kann über API oder Web-Interface gestartet werden.

Welche Scanauflösung wird benötigt?

Es gibt keine Beschränkungen. Bitte testen Sie die Texterkennung Ihrer Scans im Rahmen eines Testzugangs. Sie werden überrascht sein, wie gut selbst Fahrzeugscheine und Scans in schlechter Auflösung erkannt werden.

Welche Technologien kommen bei den angebotenen Schnittstellen zum Einsatz?

Durch Einsatz des etablierten Django Rest Frameworks lassen sich sehr einfach Schnittstellen in vielen Formaten bereitstellen und konsumieren, so dass sich die Anwendung schnell mit Drittsystemen verknüpfen kann und auch beim Entwickeln von modernen Single Page Applications oder nativen mobile Apps verwendet werden kann.

Welche Voraussetzungen bestehen zur Nutzung der Schnittstellen?

Weitere Informationen für die Nutzung der Schnittstellen finden Sie unter Swagger RESTful API Documentation Specification.

Erkennt die OCR Handschrift?

Ja. Jedoch bitten wir Sie zu überdenken, ob die Automatisierung von Handschrift nicht durch ein Webformular gelöst werden kann.

Werden Check-Boxen unterstützt?

Die OCR erkennt Text und Handschrift. Die Erkennung von Textboxen kann nicht gewährleistet werden.

Wie schnell können die verarbeitenden Daten bereitgestellt werden?

Gemessen an 100 Seiten dauert die Texterkennung durchschnittlich 1,4 Sekunden. Hinzu kommt je zu erkennendem Feld ca. 0,1 Sekunden.

Wie erhalte ich die Ergebnisse?

Die Ergebnisse erhalten Sie entweder synchron oder asynchron über die REST-API als JSON oder über den manuellen Download als CSV. Zudem ist es möglich je Dokument einen individuelle Webhook-URL zu definieren.

Können Dokumente von der KI automatisch getrennt werden?

Es existiert weltweit kein verlässlicher Ansatz für die Trennung von Dokumenten mit KI. Wir arbeiten an einem solchen und bieten bis auf Weiteres eine regelbasierte Trennung an.

Wie interpretiere ich die statistischen Werte?

Die Berechnung der statistischen Werte richtet sich nach der einschlägigen Literatur. Wikipedia bietet unter https://en.wikipedia.org/wiki/F-score einen Einstieg ein. Den Source Code zur Berechnung der Evaluation legen wir Ihnen offen.

Gibt es eine Trennung zwischen der Trainings- und Produktivumgebung?

Ja. Hierbei werden alle Software Neuerungen automatisiert getestet und beim Fehlerfreiheit auf einem Testsystem ausgerollt. Vor jedem Release führen wir umfangreiche Integrationstests in der Staging-Umgebung durch. Nachdem alle Tests erfolgreich abgeschlossen sind, stellen wir Ihnen die Änderungen zur Verfügung. Bitte informieren Sie uns, sofern Sie wider erwarten einen Fehler feststellen, https://konfuzio.com/support/.

Für welche Lasten kommt das System produktiv zum Einsatz?

Die SaaS Variante skaliert automatisiert und bietet grundsätzlich eine Kapazität von 10.000 Seiten pro Stunde. On-Site Installationen bieten eine Kapazität von mindestens 6.000 Seiten pro Stunde und sind als Cluster voll skalierbar.

Wie erfolgt das Monitoring im laufenden Betrieb?

Bei der SaaS Variante übernehmen wir das Monitoring der Applikation für Sie. Bei einer On-Site Installation erfolgt das Monitoring über Grafana und ein Kubernetes Dashboard. Über die API haben Sie zudem Zugriff auf den Verarbeitungsstatus je Dokument.

Welche Erkennungsraten können garantiert werden?

Wir gewährleisten die auf Ihren Dokumenten mit dem Datensatz Status “Test” gemessene Genauigkeit auf Anfrage.

An welchen Stellen findet KI in der Software Anwendung?

Ein Beispiel ist die Vorhersage der Artikelnummern, Einzelpreise und Gesamtpreise einer Position einer neu eingegangenen Rechnung. Häufig wird angenommen, dass lediglich eine “KI” zum Einsatz kommt. Leider ist die Verarbeitung von Dokumenten sehr viel komplexer, sodass wir unterschiedliche KI-Algorithmen nutzen müssen.
Ein digitales Dokument enthält in den meisten Fällen keinen Text, sondern bietet nur eine optische Darstellung des Inhalts. Wir nutzen OCR, um aus diesem Bild Zeichen, Wörter, Zeilen, Tabellen und Paragraphen zu extrahieren. Um diesen Textelementen einen fachlichen Kontext zuzuweisen weist ein NER-Algorithmus einzelnen Zeichen, Buchstaben, Sätzen oder Paragraphen. Bereits hier ergeben sich unterschiedlichste Anwendungsmöglichkeiten. Von der Erkennung einer Währung bis hin zur Vertragsanalyse. Zurückkommend auf den Fall der Rechnung findet dieser Algorithmus diverse Artikelnummern, Einzelpreise und Gesamtpreise. Im letzte Schritt ordnet ein weiterer KI Algorithmus die gefundenen Artikelnummern, Einzelpreise und Gesamtpreise einem fachlichen Konzept zu. In diesem Fall erkennt der Algorithmus die Zuweisung zu einer Einzelposition. Dies ist besonders herausfordernd, da die Artikelnummer, der Einzelpreis und Gesamtpreis einer Einzelposition nicht notwendigerweise innerhalb einer Zeile steht. Um eine besonders verlässliche Zuweisung zu ermöglichen, haben wir eine KI entwickelt, die relative Raum-Text-Informationen berücksichtigt, um einen fachlichen Kontext zu erkennen und so z. B. Artikelnummern, Einzelpreise und Gesamtpreise in separate Einzelpositionen aufteilen und von Kreditor und Debitor bezogenen Informationen trennen kann.

Arrow-up