L'IA et l'homme : une coopération gagnante

Les progrès de l'intelligence artificielle continuent de progresser rapidement et placent notre société face à de profonds changements structurels. Par exemple, l'implémentation au niveau communal est désormais prévisible. Comme pour toute révolution technologique, tout cela ne se fait pas sans inquiétudes. Le meilleur moyen d'y répondre est de connaître les tenants et les aboutissants de la technologie. Et cela se reflète dans l'histoire de Konfuzio.

L'IA souveraine - seulement une partie d'un tout

Bien avant ChatGPT, c'est surtout l'histoire du cinéma qui a marqué la compréhension publique de l'intelligence artificielle. Dans "2001 : l'Odyssée de l'espace" de 1968, elle apparaît par exemple sous la forme du superordinateur HAL 9000. Doté d'une reconnaissance d'image et de voix ainsi que de capacités de communication impressionnantes, il constitue le cœur d'une mission spatiale et en même temps l'élément de commande autonome du vaisseau spatial. Bien que HAL soit considéré comme infaillible, le système développe rapidement une vie propre destructrice qui culmine avec la destruction de plusieurs membres d'équipage.

Quelque 55 ans plus tard, l'IA est passée depuis longtemps du grand écran aux bureaux du monde entier et s'est révélée être une technologie réelle et extrêmement utile. Sa perception par le public semble aujourd'hui fondamentalement différente. N'est-ce pas ?

"Révolution de l'IA en Bavière : un robot allemand développe sa propre vie"

DUP magazine des entrepreneurs, 04.08.2023

"Intelligence artificielle : car nous ne savons pas ce qu'ils veulent faire"

Article invité dans le Süddeutsche Zeitung, 18.05.2023

"L'IA ment aux humains : voici comment ChatGPT nous trompe tout simplement"

Chip Online, 29.03.2023.

Il faut reconnaître que l'image de l'être artificiel et autonome est extrêmement excitante. L'assimilation de systèmes entiers à l'IA est en outre souvent poussée par les fournisseurs de logiciels pour des raisons de marketing. Mais ces deux notions passent à côté de la vérité. Au lieu de cela, l'IA ne correspond généralement qu'à des parties d'applications individuelles qui reposent sur des prévisions statistiques plus ou moins complexes et qui interagissent avec d'autres éléments. Par "IA souveraine", on entend l'utilisation conforme aux règles et compatible avec les mandants des modèles mis à disposition. Cela concerne également les technologies d'IA de Helm & Nagel GmbH, qui peuvent en fin de compte être intégrées par d'autres développeurs de logiciels dans leurs propres applications. Ce n'est qu'ainsi que l'IA souveraine devient utilisable sous une forme adaptée pour les entreprises et les consommateurs.

Imaginez un fabricant d'alternateurs qui fournit de grandes entreprises automobiles. Dans cette image, l'IA correspond à l'alternateur, l'application finale à la voiture finie.

La voie vers un système cognitif hybride

Au sens strict, l'IA existait déjà dans les années 1960 - même si elle n'était pas très utile. Le premier robot de chat "ELIZA" utilisait un dictionnaire préétabli dans lequel le programme recherchait des synonymes possibles pour les termes saisis. Ensuite, ELIZA donnait des phrases toutes faites. Il s'agissait donc plus ou moins d'un processus de devinettes. Cela suffisait tout de même à faire réfléchir les auteurs pendant des décennies. Le mythe de l'IA complètement autonome était né.

étapes de l'IA

IA de niveau 1 : systèmes heuristiques

Les modèles d'IA les plus simples fonctionnent, comme "ELIZA", à l'aide d'heuristiques, c'est-à-dire de certaines hypothèses formulées sur la base de quelques indices et d'une connaissance limitée. C'est le cas par exemple de algorithmes évolutifs, Refroidissement simulé ou le Algorithme A* qui sont toutes utilisées pour les problèmes d'optimisation. L'esprit humain fonctionne lui aussi de manière heuristique. Pour percevoir la réalité, nous ne disposons que de nos expériences, que nous surinterprétons souvent. Cela conduit à une image déformée et fait de nous, par nature, de mauvais statisticiens.

Niveau 2 de l'IA : Systèmes basés sur la connaissance

Dans le meilleur des cas, la technologie doit compenser les insuffisances de l'homme ou élargir ses capacités. C'est pourquoi on essaie par exemple de transférer le plus de connaissances possible aux programmes informatiques. Ceux-ci apprennent ainsi des séquences d'actions entières, basées sur la base de connaissances injectée et sur des décisions programmées manuellement. Une approche certes utile, qui permet de prévenir les erreurs humaines, mais aussi très coûteuse.

Niveau 3 de l'IA : apprentissage automatique

Le gamechanger dans le développement de l'IA : Apprentissage automatique permet l'identification automatisée de corrélations dans de grandes quantités de données. Une fois entraînés sur une base comparable et plus petite, les modèles sont capables d'établir des prévisions et de prendre des décisions de manière autonome à partir d'informations jusqu'alors invisibles. Pour ce faire, ils se servent de probabilités statistiques dérivées des données d'entraînement et actualisées en permanence, y compris par des corrections humaines.

IA de niveau 4 : systèmes cognitifs hybrides

Par intelligence hybride, on entend la combinaison de différents types d'intelligence. D'un point de vue technique, cela signifie une utilisation commune et flexible de divers modèles d'IA afin de résoudre des problèmes aussi complexes que possible. Cela comprend aujourd'hui principalement l'apprentissage automatique, en particulier le domaine le plus récent de l'intelligence artificielle. Apprentissage en profondeurqui fonctionne avec des réseaux neuronaux artificiels. Les systèmes basés sur la connaissance servent souvent de couche de validation qui doit éviter les erreurs dans le sens d'une logique commerciale.

Le développement de l'IA dans la pratique

En tant que fabricant de solutions d'intelligence artificielle, Helm & Nagel GmbH a gravi chacun de ces échelons au cours des dernières années. Tout a commencé en 2016 avec une tâche simple du point de vue actuel :

Reconnaissance optique des caractères

ocr use case

Les informations suivantes devraient être extraites de la liste des associés d'une notaire :

Prénom, nom, rue, code postal, ville.

C'est un cas d'utilisation typique de ce que l'on appelle des Technologie OCR (Optical Character Recognition). Celle-ci permet de convertir un texte optique en formats lisibles par une machine. Comme il s'agit dans ce cas du même type de données avec la même localisation pour chaque exemplaire, la tâche est relativement simple à résoudre, même avec des approches heuristiques.

Mais cela ne s'est pas arrêté là. Depuis 2018, l'intelligence artificielle enregistre les plus grands progrès de toute son histoire. Parallèlement, Helm & Nagel GmbH a continué à se développer et à modifier les dernières inventions pour les adapter aux processus de ses clients. Un tournant décisif a été pris dans un domaine d'application particulier de la technologie.

Chronologie du développement de l'IA

Traitement du langage naturel

Le Natural Language Processing est une technologie d'IA qui vise à traiter le langage naturel. En 2018, les technologies les plus performantes à ce jour ont vu le jour. Modèles PNL GPT-1 et BERT ont été les premiers représentants de ce que l'on appelle les transformateurs, qui utilisent une architecture système spéciale développée par Google. Celle-ci permet aux modèles linguistiques modernes de générer des textes cohérents et de traiter des structures de phrases complexes. 

Pour Helm & Nagel GmbH, ce progrès signifiait que le texte saisi par OCR pouvait désormais être traité au niveau du contenu - une étape importante et la base d'une acquisition de connaissances basée sur des données.

Vision par ordinateur

Or, la plupart des documents ne se limitent pas au texte et au contenu linguistique. Les éléments visuels peuvent être modifiés par Vision par ordinateur une technologie basée sur des réseaux neuronaux complexes. La qualité de ces derniers s'est considérablement améliorée ces dernières années. Ainsi, la reconnaissance d'images de haute précision est devenue possible dans les cas d'application les plus divers. Cela concerne également les informations de mise en page d'un document.

Grâce à ces trois technologies de base, Helm & Nagel GmbH a pu traiter toutes les dimensions essentielles d'un document à l'aide de l'IA. Toutefois, la connexion de divers modèles individuels peut s'avérer complexe et coûteuse. À cela s'ajoute l'entraînement et le réglage fin pour différents formats. Mais la recherche a également une solution à ces problèmes.

Modèles linguistiques multimodaux

La dernière génération de modèles NLP est capable d'analyser non seulement des contenus purement linguistiques, mais aussi des éléments visuels tels que des graphiques, des images ou des vidéos. Cela permet de traiter des contenus diversifiés sans qu'une intégration multiple des modèles soit nécessairement requise. À cela s'ajoute une nouvelle méthode appelée "instruction tuning" qui modèles linguistiques multimodaux sur jusqu'à présent types de tâches non vues sont préparés. Ainsi, dans de nombreux cas, il n'est pas nécessaire de procéder au réglage fin qui était jusqu'alors nécessaire pour des formes de données spéciales.

Il s'agit là de l'outil technique le plus récent dans le répertoire de Helm & Nagel GmbH. Même si la technologie n'est pas encore au point, elle peut déjà être partiellement utilisée. Il apparaît clairement que le potentiel est loin d'être épuisé, en particulier pour le traitement des documents. L'utilisation de ces éléments ne suffit toutefois pas à garantir le succès d'une application d'IA. La fiabilité, la sécurité, l'équité, la résistance, la transparence, l'explicabilité et la protection des données sont tout aussi importantes. Et n'oublions pas le facteur le plus important de tous :

Humain-dans-la-boucle

Même si l'IA peut exécuter des actions et prendre des décisions qui étaient jusqu'alors réservées aux humains, il n'est pas rare que la technologie se heurte à des limites professionnelles. Afin de prévenir les erreurs, il revient à l'homme de surveiller les processus et de les corriger si nécessaire. Cela permet non seulement de renforcer la sécurité (des données), mais aussi d'améliorer la précision des modèles. Chaque correction humaine peut être considéré comme un nouveau point de données à prendre en compte avec une grande pondération dans les prévisions futures.

Du point de vue de Helm & Nagel GmbH, le résultat de toutes ces techniques et de tous ces concepts a été le lancement du produit Konfuzio. L'histoire de la création, qui s'est déroulée à proximité des événements généraux de développement, repose sur une profonde compréhension technique et une infrastructure optimisée en permanence. Cela se traduit par des connaissances basées sur des données et l'automatisation de processus très différenciés.

Exemple de processus

Sur la place de marché Konfuzio, vous trouverez divers modèles d'IA personnalisés, directement disponibles et prêts à l'emploi - le meilleur moyen de découvrir la technologie de près.

Conclusion

Toute technologie est développée dans le but de générer une utilité pratique. Ce faisant, elle s'adapte plus ou moins aux besoins humains. Cette perspective est particulièrement complexe dans le cas de l'intelligence artificielle, car les changements induits se produisent directement dans le champ d'action de l'homme et en remplacent même certaines parties. Outre un grand potentiel de croissance, on ne peut nier qu'il existe un certain risque, par exemple en ce qui concerne la sécurité des données. Un scénario comme celui de "L'Odyssée de l'espace" est toutefois exclu. Lorsque l'on parle d'une "vie propre" des systèmes complexes, seul le degré d'explicabilité est trop faible et doit être augmenté par des tests intensifs. Les modèles basés sur des données ne sont tout simplement pas en mesure de développer leur propre agenda. De plus, l'accès au monde réel est fortement limité.

Ces deux facteurs peuvent être contrôlés à cent pour cent par l'homme : Il définit la base de données. Il choisit de ne pas conduire de manière autonome sans volant. Il développe des systèmes cognitifs hybrides, adaptables presque à volonté, qui semblent créer des ressources à partir de rien. Il fait appel à différentes techniques comme la PNL ou la vision par ordinateur, qui s'inspirent de dimensions centrales de la perception humaine. Ces développements progressent à une vitesse incroyable - plus vite que n'importe quel transfert de connaissances, changement d'attitude ou adaptation structurelle. C'est pourquoi il incombe également à la communication médiatique de soutenir une utilisation aussi appropriée et profitable que possible de l'intelligence artificielle.

"
"
Avatar de Tim Filzinger

Derniers articles