KI für die intelligente Automatisierung von Dokumenten

Intelligente OCR dank der Deep Learning KI in Konfuzio, um Dokumente schneller und präziser zu erfassen.

Bieten Sie strukturierte Informationen dort, wo Ihre Kunden und Nutzer diese benötigen, um Prozesse zu automatisieren oder Daten zu analysieren.

KI konfigurieren und Training beginnen

Trainieren Sie Konfuzio ohne unser Zutun.

Mit einem Experten sprechen

Lernen Sie Konfuzio bei einer geführten hands-on Tour kennen.

Für welche Arten von Dokumenten eignet sich Konfuzio?

Rechnungen

Unter Rechnung, Stornorechnung oder Gutschrift wird jedes Dokument verstanden, das die Berechnung über eine Lieferung oder sonstige Leistung zum Inhalt hat, gleichgültig, wie dieses Dokument im Geschäftsverkehr bezeichnet wird. 

Jetzt mehr über OCR mit KI für Rechnungen erfahren.

Zahlungsavise

Ein Zahlungsavis enthält eine detaillierte Aufstellung aller Positionen, die durch die Zahlung beglichen werden. Details je Position sind die Kopfdaten je Rechnung.

Jetzt mehr über OCR mit KI für Zahlungsavise erfahren.

Versicherungspolicen

Bei einer Versicherungspolice handelt es sich um eine Urkunde über einen zwischen Versicherer und Versicherten erfolgreich zustande gekommenen Versicherungsvertrag. Versicherungspolicen enthalten alle wichtigen Daten eines Versicherungsvertrages und werden über Beitragsrechnungen abgerechnet, siehe dazu auch Rechnungen.

Lesen Sie mehr über Anwendungsmöglichkeiten für KI OCR als Versicherer und Pool

Fahrzeugscheine

Der Fahrzeugschein wird von der Kraftfahrzeug-Zulassungsbehörde bei der An- oder Ummeldung von Straßenfahrzeugen ausgestellt und dient der Identifizierung eines zulassungspflichtigen Fahrzeugs.

Nutzen Sie Konfuzio für die OCR von Fahrzeugscheinen.

Bestens vorbereitet

Erhalten Sie alle für Ihre Entscheidung relevanten Informationen in einer E-Mail, ohne dass Ihnen dabei Kosten oder Verpflichtungen entstehen.

    Welche Optionen für den IT-Betrieb von Konfuzio gibt es?

    Server Infrastuktur

    Public Cloud (SaaS)

    Auf unser hochsicheres, europäisches Rechenzentrum mit strengen Anforderungen an den Datenschutz nach DSGVO können Sie sich verlassen. Die Public Cloud basiert auf OpenStack und garantiert Ihnen so maximale Flexibilität und Zukunftssicherheit. Sie können Konfuzio sofort nutzen.

    Private Cloud

    Konfuzio in einer private Cloud wird nicht für die Allgemeinheit, sondern nur für ausgewählte Benutzer über das Internet oder ein privates internes Netzwerk bereitgestellt. Privates Cloud-Computing erweitert die Public Cloud Vorzüge mit weiteren Anpassungsmöglichkeiten.

    On Premises Server

    On-Premises

    Sie betreiben Konfuzio unter eigener Verantwortung im eigenen Rechenzentrum. Es besteht auch die Möglichkeit, dass Sie Konfuzio auf angemieteten Servern eines Fremdrechenzentrums betreiben. Der wohl größte Vorteil von On-Premise-Software liegt im Bereich Datenschutz.

    Welche Integrationen bietet Konfuzio?

    API Schnittstelle von Konfuzio

    REST API für online OCR mit KI

    Man spricht bei REST-API auch von der Maschine-Maschine-Kommunikation, da die verschiedenen Systeme und Geräte zusammengebracht werden und gewissermaßen die „gleiche Sprache“ sprechen. Dank REST-API ist es möglich, Informationen und Aufgaben auf verschiedene Server zu verteilen und mit Hilfe eines HTTP-Requests anzufordern.

    Power Automate flow

    RPA für intelligente Automatisierung von Dokumenten

    Robotic Process Automation (RPA, deutsch: Robotergestützte Prozessautomatisierung) ist ein Ansatz zur Prozessautomatisierung, bei dem repetitive, manuelle, zeitintensive oder fehleranfällige Tätigkeiten durch sogenannte Softwareroboter (Bots) regelbasiert und automatisiert ausgeführt werden. Bots nutzen Konfuzio als Baustein, um im Gesamtprozess die Inhalte in Dokumenten zu erkennen.

    Dokumente werden zur Verarbeitung mit KI hochgeladen

    Web UI für das No-Code Training

    Der Fachbereich verschlankt Prozesse über das browserbasierte Web-Interface. Mit einem Klick werden Daten strukturiert. Abtippen gehört der Vergangenheit an. Austauschformate wie Excel o.ä. weichem einem einheitlichen Workflow. Die UI ist technisch sehr einfach in bestehende Prozesse integrierbar.

    Document AI Python SDK

    Dokumentenextraktion mit dem Python SDK

    Das SDK ermöglicht es Ihnen, visuelle und textuelle Merkmale abzurufen, um Ihre eigenen Dokumentenmodelle zu erstellen. Konfuzio Server dient als Benutzeroberfläche, um die Datenstruktur zu definieren, Trainings-/Testdaten zu verwalten und Ihre Modelle als API bereitzustellen.

    Für welche Sprachen eignet sich Konfuzio?

    Afrikaans, Albanisch, Asturisch, Aserbaidschanisch (Lateinisch), Baskisch, Weißrussisch (Kyrillisch), Weißrussisch (Lateinisch), Bislama, Bosnisch (Lateinisch), Bretonisch, Bulgarisch, Burjatisch (Kyrillisch), Katalanisch, Cebuano, Chamorro, Chinesisch (vereinfacht), Chinesisch (traditionell), Kornisch, Korsisch, Krimtatarisch (lateinisch), Kroatisch, Tschechisch, Dänisch, Niederländisch, Englisch, Erzya (kyrillisch), Estnisch, Färöisch, Fidschianisch, Filipino, Finnisch, Französisch, Friaulisch, Gagauz (Latein), Galizisch, Deutsch, Gilbertese, Grönländisch, Haitianisches Kreolisch, Hani, Hawaiianisch, Hmong Daw (Latein), Ungarisch, Isländisch, Inari Sami, Indonesisch, Interlingua, Inuktitut (Latein), Irisch, Italienisch, Japanisch, Javanisch, K’iche‘, Kabuverdianu, Kachin (Latein), Kara-Kalpak (Latein), Kara-Kalpak (Kyrillisch), Karachay-Balkar, Kaschubisch, Kasachisch (Kyrillisch), Kasachisch (Lateinisch), Khasi, Koreanisch, Koryak, Kosraeisch, Kumyk (Kyrillisch), Kurdisch (Lateinisch), Kirgisisch (Kyrillisch), Lakota, Latein, Litauisch, Niedersorbisch, Lule Sami, Luxemburgisch, Malaiisch (Lateinisch), Maltesisch, Manx, Maori, Mongolisch (kyrillisch), Montenegrinisch (kyrillisch), Montenegrinisch (lateinisch), Neapolitanisch, Niueanisch, Nogay, Nördliches Sami (lateinisch), Norwegisch, Okzitanisch, Ossetisch, Polnisch, Portugiesisch, Ripuarisch, Rumänisch, Rätoromanisch, Russisch, Samoanisch (lateinisch), Schotten, Schottisch-Gälisch, Serbisch (kyrillisch), Serbisch (lateinisch), Skolt Sami, Slowakisch, Slowenisch, Südsamisch, Spanisch, Swahili (lateinisch), Schwedisch, Tadschikisch (kyrillisch), Tatarisch (lateinisch), Tetum, Tonga, Türkisch, Turkmenisch (lateinisch), Tuvan, Obersorbisch, Usbekisch (kyrillisch), Usbekisch (lateinisch), Volapük, Walser, Walisisch, Westfriesisch, Yucatec Maya, Zhuang, Zulu.

    Welche Dateiformate werden unterstützt?

    PDF, TIF, PNG, JPG, JPEG, EML, XLS, DOC, PPT sind unterstützte Dateiformate

    PDF Extraktion zu strukturierten Informationen

    Ein Leser einer PDF-Datei soll das Schriftstück immer in der Form betrachten und ausdrucken können, die der Autor festgelegt hat. In PDF-Dateien werden alle Informationen als nummerierte Objekte abgespeichert. Objekte sind beispielsweise Schriftinformationen, Zeichenbreiten, verwendete Zeichen-Encodings, Seitenbeschreibung, Parameter für Decoder, Crop-Boxes, einzelne Lesezeichen, Farbdefinitionen, Seitenreihenfolgen, Bitmaps, Formulare, Sprungmarken und alles andere, was in PDF-Dateien gespeichert werden kann. Eine hundertseitige PDF-Datei kann ohne Weiteres 10.000 Objekte enthalten. Konfuzio findet die relevanten Informationen automatisch.

    JPEG zu Text und JPEG zu JSON

    Das JPEG-Bildformat wird von allen Betriebssystemen unterstützt. Es ist eines der am meisten verbreiteten Bildformate. Das Verhältnis von Bildqualität zu Dateigrösse ist gut.

    JPG zu Text und JPG zu JSON

    Das JPG-Bildformat wird von allen Betriebssystemen unterstützt. Es ist eines der am meisten verbreiteten Bildformate. Das Verhältnis von Bildqualität zu Dateigrösse ist gut.

    PNG zu Text und PNG zu JSON

    Das PNG-Format unterstützt den Alpha-Kanal bei der Transparenz. Dieser ist neuer und moderner als der des GIF-Formats. Zudem verwirft das Bildformat, im Vergleich zu anderen Bildformate, beim erneuten Speichern keine Informationen.

    TIFF zu Text und TIFF zu JSON

    Keine Qualitätsverluste bietet das TIFF, da dieses nicht komprimiert wird. Qualitativ hochwertig und genau. Zudem wird auch wieder die Kanaltransparenz unterstützt.

    EML Dateien automatisch verarbeiten

    E-Mails sind intern in zwei Teile geteilt: Den Header mit Kopfzeilen und den Body (Textkörper) mit dem eigentlichen Inhalt der Nachricht. Zusätzlich werden innerhalb des Bodys noch weitere Untergliederungen definiert. Zudem verarbeitet Konfuzio Attachment, auch Anhang, Dateianhang, oder Anlage genannt, dies sind alle Dateien, die als Anlage an den Text einer E-Mail verschickt werden. Technisch gesehen ist diese Datei ein Teil des Bodys, aber sie wird als separat empfunden und so auch im allgemeinen Sprachgebrauch behandelt.

    MSG E-Mails mit Anhang automatisch verarbeiten

    E-Mails sind intern in zwei Teile geteilt: Den Header mit Kopfzeilen und den Body (Textkörper) mit dem eigentlichen Inhalt der Nachricht. Zusätzlich werden innerhalb des Bodys noch weitere Untergliederungen definiert. Zudem verarbeitet Konfuzio Attachment, auch Anhang, Dateianhang, oder Anlage genannt, dies sind alle Dateien, die als Anlage an den Text einer E-Mail verschickt werden. Technisch gesehen ist diese Datei ein Teil des Bodys, aber sie wird als separat empfunden und so auch im allgemeinen Sprachgebrauch behandelt.

    DOC und DOCX extrahieren

    Dateiformate zur Speicherung von Bürodokumenten, die den Datenbeziehungsweise Dateiaustausch zwischen verschiedenen Büroanwendungspaketen ermöglichen sollen. Durch die große Verbreitung von Microsoft Office hatten sich die dazugehörigen binären und proprietären Dateiformate von Microsoft Word, Microsoft Excel und Microsoft PowerPoint in vielen Bereichen als ein De-facto-Standard für den Dokumentenaustausch etabliert. OpenOffice und Libre Office werden jedoch auch von Konfuzio unterstützt.

    PPT und PPTX Dokumente extrahieren

    Dateiformate zur Speicherung von Bürodokumenten, die den Datenbeziehungsweise Dateiaustausch zwischen verschiedenen Büroanwendungspaketen ermöglichen sollen. Durch die große Verbreitung von Microsoft Office hatten sich die dazugehörigen binären und proprietären Dateiformate von Microsoft Word, Microsoft Excel und Microsoft PowerPoint in vielen Bereichen als ein De-facto-Standard für den Dokumentenaustausch etabliert. OpenOffice und Libre Office werden jedoch auch von Konfuzio unterstützt.

    XLS und XLSX Dokumente extrahieren

    Dateiformate zur Speicherung von Bürodokumenten, die den Datenbeziehungsweise Dateiaustausch zwischen verschiedenen Büroanwendungspaketen ermöglichen sollen. Durch die große Verbreitung von Microsoft Office hatten sich die dazugehörigen binären und proprietären Dateiformate von Microsoft Word, Microsoft Excel und Microsoft PowerPoint in vielen Bereichen als ein De-facto-Standard für den Dokumentenaustausch etabliert. OpenOffice und Libre Office werden jedoch auch von Konfuzio unterstützt.

    Wie funktioniert Konfuzio?

    Unsere leistungsstarke Lösung für maschinelles Lernen extrahiert schnell und präzise Informationen aus beliebigen Dokumenten, um strukturierte Daten in nachgelagerte Systeme einzuspeisen.

    OCR für KI

    1. Segmentierung je Seite

    Unser auf Deep Computer Vision basierendes Modell wurde auf mehr als 100.000 Dokumenten trainiert und erkennt Elemente wie Tabellen, Absätze und Überschriften projektübergreifend und unabhängig von der Sprache.

    neue Annotation für das Training für KI hinzufügen

    2. Texterkennung durch OCR

    Abhängig von der Qualität des eingehenden Dokuments wählen wir die relevante Technologie zur Texterkennung aus. Selbst on-premise können mit einem LSTM Deep Net sehr gute Ergebnisse erzielt werden.

    OCR Texterkennung von Dokumenten auf Text Ansicht

    3. Automatisches Lesen

    Unser Natural Language Processing Tool erkennt je Sprache grundlegende Elemente, so genannte Entitäten. Elemente wie Personen, Orte, Unternehmen und Zeitangaben werden mit den Informationen aus dem Computer Vision Modell kombiniert.

    Konfuzio SmartView

    4. Transferlernen

    Die AI - der Kern der Konfuzio KI - erkennt Informationen im Kontext. So wird die Straße dem Zulieferer zugeordnet, die Rechnungsnummer der Rechnung und die Artikelnummer einem Rechnungsposten. Zudem unterscheidet die KI zwischen der Adresse des Zulieferers und des Empfängers.

    API Schnittstelle von Konfuzio

    5. API Einbindung & Regeln der Fachabteilung

    Vor der Übertragung in das Zielsystem können Sie die Daten aus der API oder dem CSV Download anreichern. So besteht die Möglichkeit, dass Sie weitere fachliche Regeln anwenden, sofern diese im Zielsystem nicht bereits verfügbar sind. So kann zum Beispiel überprüft werden, ob die Umsatzsteueridentifikationsnummer gültig ist.

    Rechnungseingang durch KI und OCR automatisieren

    6. Übertragung in das Zielsystem

    Unsere KI ist sofort einsetzbar und lernt doch kontinuierlich weiter. So arbeitet die KI im Hintergrund und die bestehenden Prozesse und Interfaces können bestehen bleiben. Der Aufwand zur Verarbeitung von Dokumenten sinkt auf ein Minimum, Fehler werden vermieden. Um die KI der laufend zu verbessern, benötigen Sie keinen IT Experten, sondern lediglich eine Schulung für den Fachbereich.  In dem Zielsystem vorgenommene Korrekturen können automatisiert and die Konfuzio gemeldet werden, das damit automatisch lernt. 

    Referenzen

    Anwendungsfälle für intelligente Automatisierung in datengetriebenen Unternehmen

    Unsere Kunden nutzen Konfuzio als Verteilzentrum für unstrukturierte Daten in Dokumenten, Tweets, E-Mails und vielen weiteren Texten. Durch die KI-Plattform werden die richtigen Informationen direkt an die zuständigen Mitarbeiter geliefert, damit diese bessere und schnellere Entscheidungen treffen können. Die zusätzlichen Informationen in den jeweiligen Dokumenten liefern durch ihre Strukturierung und Kategorisierung einen zusätzlichen Mehrwert für die Datenablage und gehen als Grundlage für zukünftige, datengetriebene Entscheidungen nicht verloren.

    Arrow-up