KI und der Mensch: Eine gewinnbringende Kooperation

Tim Filzinger

Die Fortschritte in der Künstlichen Intelligenz schreiten weiter rapide voran und stellen unsere Gesellschaft vor tiefgreifende, strukturelle Veränderungen. So ist zum Beispiel auch die Implementierung auf kommunaler Ebene inzwischen absehbar. Wie bei jeder technologischen Revolution geschieht das alles nicht ganz ohne Bedenken. Diesen begegnet man am besten mit Wissen über die Hintergründe der Technologie. Und die spiegeln sich wiederum in der Entstehungsgeschichte von Konfuzio wider.

Souveräne KI – nur ein Teil des Ganzen

Lange Zeit vor ChatGPT prägte besonders die Filmgeschichte das öffentliche Verständnis von Künstlicher Intelligenz. In “2001: Odyssee im Weltraum” aus dem Jahr 1968 taucht sie zum Beispiel in Form des Supercomputers HAL 9000 auf. Ausgestattet mit Bild- und Spracherkennung sowie beeindruckenden Kommunikationsfähigkeiten bildet er das Herzstück einer Weltraummission und zugleich das autonome Steuerelement des Raumschiffs. Obwohl HAL als unfehlbar gilt, entwickelt das System bald ein destruktives Eigenleben, das in der Vernichtung mehrerer Crewmitglieder gipfelt.

Rund 55 Jahre später hat KI längst den Sprung von der Kinoleinwand in die Offices dieser Welt geschafft und sich als reale, äußerst nützliche Technologie erwiesen. Deren Wahrnehmung in der Öffentlichkeit scheint heute eine grundlegend andere zu sein. Oder nicht?

“KI-Revolution in Bayern: Deutscher Roboter entwickelt Eigenleben”

DUP Unternehmermagazin, 04.08.2023

“Künstliche Intelligenz: Denn wir wissen nicht, was sie tun wollen”

Gastbeitrag in der Süddeutschen Zeitung, 18.05.2023

“Die KI belügt Menschen: So trickst ChatGPT uns einfach aus”

Chip Online, 29.03.2023.

Zugegeben, das Bild des künstlichen, autonomen Wesens ist ein äußerst spannendes. Die Gleichsetzung von ganzen Systemen mit KI wird zudem von Softwareanbietern oft aus Marketinggründen vorangetrieben. Beides geht aber an der Wahrheit vorbei. Stattdessen entspricht KI in der Regel nur einzelnen Anwendungsteilen, die auf mehr oder minder komplexen statistischen Prognosen beruhen und mit anderen Elementen interagieren. Unter “souveräner KI” versteht man die regelkonforme und mandantenfähige Nutzung bereitgestellter Modelle. Das betrifft auch die KI-Technologien der Helm & Nagel GmbH, die letztlich von anderen Softwareentwicklern in eigene Anwendungen integriert werden können. Erst dadurch wird souveräne KI in angepasster Form für Unternehmen und Konsumenten nutzbar.

Man stelle sich einen Hersteller von Lichtmaschinen vor, der große Automobilfirmen beliefert. KI entspricht in diesem Bild der Lichtmaschine, die Endanwendung dem fertigen Auto.

Der Weg zum hybriden kognitiven System

Streng genommen gab es in den 1960ern bereits KI – wenn auch in wenig brauchbarer Form. Der erste Chat-Bot “ELIZA” nutzte ein vorgefertigtes Wörterbuch, in dem das Programm nach möglichen Synonymen für eingegebene Begriffe suchte. Anschließend gab ELIZA vorgefertigte Phrasen zum Besten. Es handelte sich also mehr oder weniger um einen Rate-Vorgang. Das reichte immerhin aus, um Autoren für Jahrzehnte ins Grübeln zu bringen. Der Mythos um komplett autonome KI war geboren.

stages of AI

KI-Stufe 1: Heuristische Systeme

Die einfachsten KI-Modelle arbeiten wie “ELIZA” mithilfe von Heuristiken, also bestimmten Annahmen, die auf Basis von wenigen Indizien und begrenztem Wissen entstehen. Das trifft zum Beispiel auf evolutionäre Algorithmen, Simulierte Abkühlung oder den A*-Algorithmus zu, die allesamt für Optimierungsprobleme eingesetzt werden. Auch der menschliche Verstand funktioniert heuristisch. Zur Realitätswahrnehmung stehen uns lediglich unsere Erfahrungen zur Verfügung, die wir oftmals überinterpretieren. Das führt zu einem Zerrbild und macht uns von Natur aus zu schlechten Statistikern.

KI-Stufe 2: Wissensbasierte Systeme

Technologie soll im besten Fall die Unzulänglichkeiten des Menschen kompensieren bzw. seine Fähigkeiten erweitern. Daher versucht man zum Beispiel, möglichst viel Wissen auf Computerprogramme zu übertragen. Diese erlernen dadurch ganze Handlungsabfolgen, die auf der eingespeisten Wissensbasis und manuell programmierten Entscheidungen fußen. Eine zwar nützliche Vorgehensweise, die menschlichen Fehlern vorbeugen kann, aber auch denkbar aufwändig.

KI-Stufe 3: Maschinelles Lernen

Der Gamechanger in der KI-Entwicklung: Machine Learning ermöglicht die automatisierte Identifikation von Zusammenhängen in großen Datenmengen. Einmal auf eine vergleichbare, kleinere Basis trainiert, können die Modelle aus bislang ungesehenen Informationen eigenständig Prognosen und Entscheidungen bilden. Dabei bedienen sie sich statistischer Wahrscheinlichkeiten, die aus den Trainingsdaten abgeleitet und laufend aktualisiert werden – auch durch menschliche Korrekturen.

KI-Stufe 4: Hybride kognitive Systeme

Unter hybrider Intelligenz versteht man die Kombination verschiedener Intelligenztypen. Aus technischer Sicht bedeutet das einen gemeinsamen und flexiblen Einsatz diverser KI-Modelle, um damit möglichst komplexe Probleme zu lösen. Das umfasst heute überwiegend Machine Learning, insbesondere den neueren Teilbereich des Deep Learnings, der mit künstlichen neuronalen Netzen arbeitet. Wissensbasierte Systeme dienen dabei oft als Validierungsschicht, die im Sinne eine Business-Logik Fehler vermeiden sollen.

KI-Entwicklung in der Praxis

Als Hersteller von KI-Lösungen hat die Helm & Nagel GmbH in den vergangenen Jahren jede dieser Stufen erklommen. Angefangen hat alles 2016 mit einer aus heutiger Sicht einfachen Aufgabe:

Optical Character Recognition

ocr use case

Aus der Gesellschafterliste einer Notarin sollten folgende Informationen ausgelesen werden:

Vorname, Nachname, Straße, Postleitzahl, Ort.

Das ist ein typischer Anwendungsfall für sogenannte OCR-Technologie (Optical Character Recognition). Diese ermöglicht die Umwandlung von optischem Text hin zu maschinenlesbaren Formaten. Da es sich in diesem Fall bei jedem Exemplar um den gleichen Datentyp mit der gleichen Verortung handelt, ist die Aufgabe relativ einfach, auch mit heuristischen Ansätzen lösbar.

Dabei blieb es allerdings nicht. Seit dem Jahr 2018 verzeichnet Künstliche Intelligenz die größten Fortschritte ihrer gesamten Geschichte. Parallel dazu entwickelte sich auch die Helm & Nagel GmbH weiter und modifizierte neueste Erfindungen in Anpassung an die Prozesse ihrer Kunden. Ein entscheidender Wendepunkt ging dabei von einem bestimmten Anwendungsbereich der Technologie aus.

AI development timeline

Natural Language Processing

Natural Language Processing ist eine KI-Technologie, die auf die Verarbeitung natürlicher Sprache abzielt. 2018 erblickten die bis dahin mit Abstand leistungsfähigsten NLP Models das Licht der Welt: GPT-1 und BERT waren die ersten Vertreter der sogenannten Transformer, die eine spezielle, von Google entwickelte Systemarchitektur nutzen. Diese befähigt moderne Sprachmodelle zur Erzeugung kohärenter Texte sowie zur Verarbeitung komplexer Satzstrukturen. 

Für die Helm & Nagel GmbH bedeutete dieser Fortschritt, dass sich durch OCR erfasster Text nun auch inhaltlich verarbeiten ließ – ein wichtiger Meilenstein und Grundlage für datenbasierten Erkenntnisgewinn.

Computer Vision

Nun beinhalten die meisten Dokumente aber mehr als nur Text und sprachliche Inhalte. Optische Elemente lassen sich durch Computer Vision erfassen – eine Technologie, die auf komplexen neuronalen Netzen basiert. Deren Qualität hat in den vergangenen Jahren stark zugenommen. So wurde hochpräzise Bilderkennung in verschiedensten Anwendungsfällen möglich. Das betrifft auch die Layoutinformationen eines Dokuments.

Mit diesen drei Basistechnologien ausgestattet, konnte die Helm & Nagel GmbH nun alle wesentlichen Dimensionen eines Dokuments KI-basiert verarbeiten. Allerdings kann die Verbindung diverser einzelner Modelle komplex und aufwändig werden. Hinzu kommt das Training und Fine-Tuning für unterschiedliche Formate. Doch auch für diese Probleme hat die Forschung eine Lösung.

Multimodale Sprachmodelle

Die neueste Generation von NLP Models ist in der Lage, neben rein sprachlichen Inhalten auch visuelle Elemente wie Grafiken, Bilder oder Videos zu analysieren. Das ermöglicht die Verarbeitung diversifizierter Inhalte, ohne dass dafür unbedingt eine multiple Modellintegration notwendig ist. Hinzu kommt eine neue Methode namens “instruction tuning”, die multimodale Sprachmodelle auf bislang ungesehene Aufgabentypen vorbereitet. So entfällt in vielen Fällen das bis dahin notwendige Fine-Tuning für spezielle Datenformen.

Damit wäre auch das neueste technische Werkzeug im Repertoir der Helm & Nagel GmbH dargelegt. Auch wenn die Technologie noch nicht ausgereift ist, kann sie bereits partiellen Nutzen verzeichnen. Dabei wird sichtbar, dass hier das Potenzial – besonders für die Dokumentenverarbeitung – noch lange nicht ausgeschöpft ist. Der Einsatz dieser Elemente allein ist jedoch kein Garant für erfolgreiche KI-Anwendung. Ebenso wichtig sind Zuverlässigkeit, Sicherheit, Fairness, Widerstandsfähigkeit, Transparenz, Erklärbarkeit und Datenschutz. Und nicht zu vergessen, der wichtigste Faktor von allen:

Human-in-the-Loop

Auch wenn KI Aktionen ausführen und Entscheidungen treffen kann, die bis dahin Menschen vorbehalten waren, stößt die Technologie nicht selten an fachliche Grenzen. Um Fehlern vorzubeugen, ist es Aufgabe des Menschen, die Prozesse zu überwachen und gegebenenfalls zu korrigieren. Das führt nicht nur zu mehr (Daten-)Sicherheit, sondern verbessert auch die Genauigkeit der Modelle. Jede menschliche Korrektur kann als neuer Datenpunkt begriffen werden, der mit hoher Gewichtung in künftige Prognosen einfließt.

Das Ergebnis all dieser Techniken und Konzepte war aus Sicht der Helm & Nagel GmbH die Produkteinführung von Konfuzio. In der Entstehungsgeschichte, die sich nah am allgemeinen Entwicklungsgeschehen abgespielt hat, liegen tiefes technisches Verständnis sowie eine kontinuierlich optimierte Infrastruktur begründet. Das drückt sich in datenbasierten Erkenntnissen und der Automatisierung stark ausdifferenzierter Prozesse aus.

Prozessbeispiel

Auf dem Konfuzio-Marktplatz finden Sie diverse angepasste KI-Modelle, die direkt verfügbar und einsatzbereit sind – der beste Weg, um die Technologie hautnah zu erleben.

Jetzt registrieren und kostenlos ausprobieren

Fazit

Jede Technologie wird mit dem Ziel entwickelt, einen praktischen Nutzen zu generieren. Dabei passt sie sich mehr oder weniger an menschliche Bedürfnisse an. Diese Perspektive ist bei Künstlicher Intelligenz besonders vielschichtig, da die herbeigerufenen Veränderungen sich unmittelbar im Handlungsspielraum des Menschen abspielen und Teile davon sogar ersetzen. Neben großem Potenzial für Wachstum lässt sich dabei auch ein gewisses Risiko – z. B. bezüglich Datensicherheit – nicht verleugnen. Ein Szenario wie in “Odyssee im Weltraum” ist allerdings ausgeschlossen. Wenn von einem “Eigenleben” der komplexen Systeme gesprochen wird, ist lediglich der Grad der Erklärbarkeit zu gering und muss durch intensive Tests gesteigert werden. Datenbasierte Modelle sind schlichtweg nicht in der Lage, eine eigene Agenda zu entwickeln. Zudem ist der Zugriff auf die reale Welt stark begrenzt.

Beide Faktoren lassen sich vom Menschen zu hundert Prozent kontrollieren: Er definiert die Datenbasis. Er entscheidet sich gegen autonomes Fahren ohne Lenkrad. Er entwickelt hybride kognitive Systeme, die nahezu beliebig anpassbar sind und Ressourcen scheinbar aus dem Nichts entstehen lassen. Dabei kommen verschiedene Techniken wie NLP oder Computer Vision zur Geltung, die zentralen Dimensionen der menschlichen Wahrnehmung nachempfunden sind. Diese Entwicklungen schreiten in unfassbarem Tempo voran – schneller als jeder Wissenstransfer, jede Einstellungsänderung oder Strukturanpassung. Daher ist es auch Aufgabe der medialen Kommunikation, einen möglichst sachgemäßen und gewinnbringenden Umgang mit Künstlicher Intelligenz zu unterstützen.

Über mich

Weitere Artikel

erp vs crm

ERP vs CRM: Klassische Unternehmenssoftware im Wandel

Das Verhältnis von ERP vs CRM hat sich in den vergangenen Jahren erheblich verändert. Die Identifikation allgemeingültiger Funktionsweisen und Aufgabenbereiche...

Zum Artikel
Ausschreibungsverfahren

Automatischer Regex Generator vs. Names Entity Recognition?

Die Verarbeitung und Analyse von großen Mengen an Textdaten ist eine Herausforderung für Unternehmen, bei der der Regex Generator helfen...

Zum Artikel
end to end titel

End to End Optimierung für effiziente Geschäftsprozesse

End to End Prozesse, die die gesamte Wertschöpfungskette umfassen, erweisen sich als Eckpfeiler für den Erfolg in einer zunehmend vernetzten...

Zum Artikel
Arrow-up