KI für die intelligente Automatisierung von Dokumenten

Intelligente OCR dank der Deep Learning KI in Konfuzio, um Dokumente schneller und präziser zu erfassen.

Bieten Sie strukturierte Informationen dort, wo Ihre Kunden und Nutzer diese benötigen, um Prozesse zu automatisieren oder Daten zu analysieren.

Verschiedene Dateiformate von möglichen Input Daten für die KI

oder jetzt Rückruf anfordern

Für welche Arten von Dokumenten eignet sich Konfuzio?

Rechnungen

Unter Rechnung, Stornorechnung oder Gutschrift wird jedes Dokument verstanden, das die Berechnung über eine Lieferung oder sonstige Leistung zum Inhalt hat, gleichgültig, wie dieses Dokument im Geschäftsverkehr bezeichnet wird. 

Zahlungsavise

Ein Zahlungsavis enthält eine detaillierte Aufstellung aller Positionen, die durch die Zahlung beglichen werden. Details je Position sind die Kopfdaten je Rechnung.

Energieausweise

Der Energieausweis ist ein Dokument, das Daten zur Energieeffizienz und zu den anfallenden Energiekosten eines Gebäudes liefern soll. So soll er einen Vergleich zwischen Immobilien ermöglichen, den Miet- oder Kaufinteressenten in ihre Miet- oder Kaufentscheidung einfließen lassen können.

Versicherungspolicen

Bei einer Versicherungspolice handelt es sich um eine Urkunde über einen zwischen Versicherer und Versicherten erfolgreich zustande gekommenen Versicherungsvertrag. Versicherungspolicen enthalten alle wichtigen Daten eines Versicherungsvertrages und werden über Beitragsrechnungen abgerechnet, siehe dazu auch Rechnungen.

Fahrzeugscheine

Der Fahrzeugschein wird von der Kraftfahrzeug-Zulassungsbehörde bei der An- oder Ummeldung von Straßenfahrzeugen ausgestellt und dient der Identifizierung eines zulassungspflichtigen Fahrzeugs.

Mietverträge

Ein Mietvertrag ist ein Vertrag zur zeitweisen Gebrauchsüberlassung gegen Entgelt, durch den sich eine Vertragspartei (der Vermieter) dazu verpflichtet, der anderen Partei (dem Mieter) den Gebrauch der gemieteten Sache zu gewähren, während die Gegenleistung des Mieters in der Zahlung der vereinbarten Miete besteht.

Ausweise

Ein Ausweis ist im weiteren Sinne eine private oder amtliche Urkunde, die die Identität des Inhabers schriftlich und gegebenenfalls mit Feststellungen einer zuständigen Stelle verbindet, wonach bestimmte rechtliche Eigenschaften (Staatsangehörigkeit) oder ähnliches vorliegen.

… und viele mehr. Kontaktieren Sie uns.

Je Dokumentart sind die verfügbaren Felder individuell, die API ist für eine einfach Integration jedoch einheitlich. Ein API JSON Beispiel einer Rechung finden Sie hier.

Welche Optionen für den IT-Betrieb von Konfuzio gibt es?

Public Cloud (SaaS)

Auf unsere hochsicheren, europäischen Rechenzentren mit strengem Datenschutz nach DSGVO können Sie sich verlassen. Die Public Cloud basiert auf OpenStack und garantiert Ihnen so maximale Flexibilität und Zukunftssicherheit.

Private Cloud

Die Dienste einer private Cloud werden nicht für die Allgemeinheit, sondern nur für ausgewählte Benutzer über das Internet oder ein privates internes Netzwerk bereitgestellt. Private Cloud-Computing, auch als interne oder Unternehmens-Cloud bezeichnet, stellt Unternehmen viele der Vorzüge einer öffentlichen Cloud zur Verfügung – wie z.B. Self-Service, Skalierbarkeit und Elastizität –, während es gleichzeitig zusätzliche Kontroll- und Anpassungsmöglichkeiten gibt, die mithilfe von dedizierten Ressourcen über eine lokal gehostete Computinginfrastruktur zur Verfügung gestellt werden.

On-Premises

Sie betreiben die Software unter eigener Verantwortung im eigenen Rechenzentrum (On Premises). Es besteht auch die Möglichkeit, dass Sie die Software auf angemieteten Servern eines Fremdrechenzentrums betreibt, die Software läuft jedoch keinesfalls auf unseren Servern. Neben den Betriebs- und Anschaffungskosten sind zusätzlich Wartungsgebühren einzukalkulieren.

Die IT Dokumentation finden Sie unter dev.konfuzio.com.

Welche Integrationen bietet Konfuzio?

REST API

Man spricht bei REST-API auch von der Maschine-Maschine-Kommunikation, da die verschiedenen Systeme und Geräte zusammengebracht werden und gewissermaßen die „gleiche Sprache“ sprechen. Dank REST-API ist es möglich, Informationen und Aufgaben auf verschiedene Server zu verteilen und mit Hilfe eines HTTP-Requests anzufordern.

RPA

Robotic Process Automation (RPA, deutsch: Robotergestützte Prozessautomatisierung) ist ein Ansatz zur Prozessautomatisierung, bei dem repetitive, manuelle, zeitintensive oder fehleranfällige Tätigkeiten durch sogenannte Softwareroboter (Bots) regelbasiert und automatisiert ausgeführt werden. Bots nutzen Konfuzio als Baustein, um im Gesamtprozess die Inhalte in Dokumenten zu erkennen.

Web UI

Der Fachbereich verschlankt Prozesse über das browserbasierte Web-Interface. Mit einem Klick werden Daten strukturiert. Abtippen gehört der Vergangenheit an. Austauschformate wie Excel o.ä. weichem einem einheitlichen Workflow. Die UI ist technisch sehr einfach in bestehende Prozesse integrierbar.

… und viele mehr. Kontaktieren Sie uns.

Welche Dateiformate werden unterstützt?

PDF

Ein Leser einer PDF-Datei soll das Schriftstück immer in der Form betrachten und ausdrucken können, die der Autor festgelegt hat. In PDF-Dateien werden alle Informationen als nummerierte Objekte abgespeichert. Objekte sind beispielsweise Schriftinformationen, Zeichenbreiten, verwendete Zeichen-Encodings, Seitenbeschreibung, Parameter für Decoder, Crop-Boxes, einzelne Lesezeichen, Farbdefinitionen, Seitenreihenfolgen, Bitmaps, Formulare, Sprungmarken und alles andere, was in PDF-Dateien gespeichert werden kann. Eine hundertseitige PDF-Datei kann ohne Weiteres 10.000 Objekte enthalten. Konfuzio findet die relevanten Informationen automatisch.

Bilder

JPEG, PNG, TIFF, … es gibt so viele Bildformate. Das JPEG-Bildformat wird von allen Betriebssystemen unterstützt. Es ist eines der am meisten verbreiteten Bildformate. Das Verhältnis von Bildqualität zu Dateigrösse ist gut. Das PNG-Format unterstützt den Alpha-Kanal bei der Transparenz. Dieser ist neuer und moderner als der des GIF-Formats. Zudem verwirft das Bildformat, im Vergleich zu anderen Bildformate, beim erneuten Speichern keine Informationen. Keine Qualitätsverluste bei TIFF, da nicht komprimiert. Qualitativ hochwertig und genau. Zudem wird auch wieder die Kanaltransparenz unterstützt.

E-Mails mit Anhang

E-Mails sind intern in zwei Teile geteilt: Den Header mit Kopfzeilen und den Body (Textkörper) mit dem eigentlichen Inhalt der Nachricht. Zusätzlich werden innerhalb des Bodys noch weitere Untergliederungen definiert. Zudem verarbeitet Konfuzio Attachment, auch Anhang, Dateianhang, oder Anlage genannt, dies sind alle Dateien, die als Anlage an den Text einer E-Mail verschickt werden. Technisch gesehen ist diese Datei ein Teil des Bodys, aber sie wird als separat empfunden und so auch im allgemeinen Sprachgebrauch behandelt.

Office Dokumente

Dateiformate zur Speicherung von Bürodokumenten, die den Datenbeziehungsweise Dateiaustausch zwischen verschiedenen Büroanwendungspaketen ermöglichen sollen. Durch die große Verbreitung von Microsoft Office hatten sich die dazugehörigen binären und proprietären Dateiformate von Microsoft Word, Microsoft Excel und Microsoft PowerPoint in vielen Bereichen als ein De-facto-Standard für den Dokumentenaustausch etabliert. OpenOffice und Libre Office werden jedoch auch von Konfuzio unterstützt.

Nutzen Sie weniger übliche Dateiformate? Kontaktieren Sie uns.

Für welche Sprachen eignet sich Konfuzio?

Englisch

für Text und Handschrift

Deutsch

für Text und Handschrift

Spanisch

für Text und Handschrift

Polnisch

für Text

… und viele mehr!

Alle Sprachen finden Sie hier.

Anwendungsfälle für intelligente Automatisierung in datengetriebenen Unternehmen

Unsere Kunden nutzen Konfuzio als Verteilzentrum für unstrukturierte Daten in Dokumenten, Tweets, E-Mails und vielen weiteren Texten. Durch die KI-Plattform werden die richtigen Informationen direkt an die zuständigen Mitarbeiter geliefert, damit diese bessere und schnellere Entscheidungen treffen können. Die zusätzlichen Informationen in den jeweiligen Dokumenten liefern durch ihre Strukturierung und Kategorisierung einen zusätzlichen Mehrwert für die Datenablage und gehen als Grundlage für zukünftige, datengetriebene Entscheidungen nicht verloren.

Wie funktioniert Konfuzio?

Unsere leistungsstarke Lösung für maschinelles Lernen extrahiert schnell und präzise Informationen aus beliebigen Dokumenten, um strukturierte Daten in nachgelagerte Systeme einzuspeisen.

PDF, TIF, PNG, JPG, JPEG, EML, XLS, DOC, PPT sind unterstützte Dateiformate

0. Dokumenteneingang

Sie verarbeiten oder archivieren täglich Dokumente (PDF, E-Mail, etc.)? Sie möchten in Zukunft die Dokumente nicht nur elektronisch empfangen, sondern auch smart automatisch verarbeiten? 

Segmentierung einer Seite eines Dokuments

1. Segmentierung je Seite

Unser auf Deep Computer Vision basierendes Modell wurde auf mehr als 100.000 Dokumenten trainiert und erkennt Elemente wie Tabellen, Absätze und Überschriften projektübergreifend und unabhängig von der Sprache.

neue Annotation für das Training für KI hinzufügen

2. Texterkennung

Abhängig von der Qualität des eingehenden Dokuments wählen wir die relevante Technologie zur Texterkennung aus. Selbst on-premise können mit einem LSTM Deep Net sehr gute Ergebnisse erzielt werden.

OCR Texterkennung von Dokumenten auf Text Ansicht

3. Automatisches Lesen

Unser Natural Language Processing Tool erkennt je Sprache grundlegende Elemente, so genannte Entitäten. Elemente wie Personen, Orte, Unternehmen und Zeitangaben werden mit den Informationen aus dem Computer Vision Modell kombiniert.

Konfuzio SmartView

4. Transferlernen

Die AI - der Kern der Konfuzio KI - erkennt Informationen im Kontext. So wird die Straße dem Zulieferer zugeordnet, die Rechnungsnummer der Rechnung und die Artikelnummer einem Rechnungsposten. Zudem unterscheidet die KI zwischen der Adresse des Zulieferers und des Empfängers.

API Schnittstelle von Konfuzio

5. API Einbindung & Regeln der Fachabteilung

Vor der Übertragung in das Zielsystem können Sie die Daten aus der API oder dem CSV Download anreichern. So besteht die Möglichkeit, dass Sie weitere fachliche Regeln anwenden, sofern diese im Zielsystem nicht bereits verfügbar sind. So kann zum Beispiel überprüft werden, ob die Umsatzsteueridentifikationsnummer gültig ist.

Rechnungseingang durch KI und OCR automatisieren

6. Übertragung in das Zielsystem

Unsere KI ist sofort einsetzbar und lernt doch kontinuierlich weiter. So arbeitet die KI im Hintergrund und die bestehenden Prozesse und Interfaces können bestehen bleiben. Der Aufwand zur Verarbeitung von Dokumenten sinkt auf ein Minimum, Fehler werden vermieden. Um die KI der laufend zu verbessern, benötigen Sie keinen IT Experten, sondern lediglich eine Schulung für den Fachbereich.  In dem Zielsystem vorgenommene Korrekturen können automatisiert and die Konfuzio gemeldet werden, das damit automatisch lernt. 

Arrow-up