YOLO NAS : Modèle de détection d'objets


En matière de reconnaissance d'objets, les Modèles AI comme YOLO-NAS et YOLO-NAS-SAT, en raison de leurs performances (précision) et de leur vitesse d'inférence impressionnantes. Ces modèles sont basés sur des architectures modernes et utilisent des bibliothèques Python avancées pour l'apprentissage et l'inférence. Grâce à l'utilisation de Neural Architecture Search et d'autres techniques modernes, ils peuvent traiter une grande variété de jeux de données et offrent une vitesse remarquable ainsi qu'une grande précision dans la reconnaissance des objets.

Des images d'objets quotidiens aux cas d'application scientifiques ou à la reconnaissance de structures dans des documents, tout est réalisable avec YOLO NAS et YOLO-NAS-SAT.

Qu'est-ce qu'un modèle de détection d'objets ?

La reconnaissance d'objets, en anglais Détection d'objetsLe traitement d'images est une branche du traitement d'images et de l'intelligence artificielle qui s'occupe de l'identification et de la localisation d'objets dans des images. L'identification s'effectue généralement à l'aide de classes prédéfinies telles que "voiture", "vélo" et "personne". La localisation s'effectue par ce que l'on appelle des Bounding BoxesLes objets sont entourés de contours qui les délimitent clairement dans une image. Un exemple :

Yolo nas bounding boxes

Aujourd'hui, un modèle de reconnaissance automatique d'objets est généralement basé sur un réseau neuronal artificiel qui est entraîné à l'aide d'exemples. Après un entraînement réussi, le modèle reconnaît des objets similaires dans de nouvelles images.

Yolo nas modèle

RemarqueDans ce qui suit, les termes anglais Détection d'objets et Modèle de détection d'objets car ils sont principalement utilisés dans la littérature allemande et dans le domaine.

Que sont YOLO et YOLO NAS ?

YOLO signifie "You Only Look Once" et décrit une série de modèles de détection d'objets qui ont été développés pour la détection d'objets en temps réel. En raison de leur vitesse élevée lors de l'inférence (inference) et de leur bonne précision (accuracy), les modèles de la série YOLO sont appréciés pour les applications réelles, car c'est justement là que l'on a souvent besoin d'une bonne précision à grande vitesse et d'une bonne efficacité des ressources. Les modèles YOLO atteignent leur vitesse élevée notamment parce qu'ils renoncent à un processus de détection en deux étapes, ce qui est souvent le cas avec d'autres modèles.

La variante YOLO-NAS (Recherche d'architecture neuronale) a été développé par Deci.AI et représente une évolution des célèbres modèles YOLO. La structure du modèle a été conçue à cet effet via une recherche d'architecture automatisée (architecture search) afin d'être efficace pour différentes configurations matérielles tout en offrant une grande précision. Cela fait de YOLO-NAS un modèle flexible et performant.

Une optimisation de YOLO-NAS peut être réalisée via une Quantification du modèle des blocs individuels après l'entraînement peut se faire à la vitesse. Pour ce faire, on modifie le type de données des poids en passant de nombres à virgule flottante à des entiers de 8 bits. Cela a pour effet de réduire l'espace mémoire nécessaire pour les poids et de permettre un calcul plus efficace. Cela a à son tour une influence directe sur la vitesse d'inférence, qui peut ainsi être encore augmentée. Comme la structure du modèle et l'apprentissage (Quantization Aware Training) de YOLO-NAS ont été développés avec ces blocs quantifiables, la quantification n'a que peu d'influence sur la précision, ce qui n'est souvent pas le cas avec d'autres modèles.

YOLO-NAS Recherche d'architecture neuronale
Source : deci.ai

Caractéristiques principales de YOLO-NAS

Caractéristiques principales Yolo Nas Model

Efficacité - Excellente vitesse sur les plates-formes matérielles les plus diverses. Par exemple, YOLO-NAS peut être spécialement conçu pour les appareils mobiles avec Processeurs Snapdragon optimisés être.

Précision - Permet une reconnaissance précise des objets.
Les modèles YOLO NAS sont plus précis que les modèles yolov7 et yolov8.

Flexibilité - Applicable à un grand nombre de tâches et de jeux de données. YOLO NAS peut être entraîné avec des images et des objets scientifiques et techniques, tout comme avec des images et des objets naturels, par exemple des objets de la vie quotidienne.

Modèles pré-entraînés

Deci.AI met à disposition 3 variantes avec des poids pré-entraînés :

  • YOLO-NAS S
  • YOLO-NAS M
  • YOLO-NAS L

Il s'agit d'une petite variante (S), d'une variante moyenne (M) et d'une grande variante (L). Selon l'application, il est possible de choisir la variante qui convient le mieux. Pour les applications exigeant une très grande vitesse avec une précision réduite, le petit modèle est préférable, tandis que pour d'autres applications exigeant une plus grande précision, le moyen ou le grand modèle sont plutôt préférables.

Ci-dessous, les valeurs de précision sous forme de Précision moyenne ([email protected]:0.95) sur la base du Coco 2017 Validation Dataset et le temps de latence est donné comme mesure de la vitesse pour une image de 640×640 pixels sur un GPU Nvidia T4 :

ModèlemAPTemps de latence (ms)
S47.53.21
M51.555.85
L52.227.87
S INT-847.032.36
M INT-851.03.78
L INT-852.14.78
YOLO NAS
Source : Deci.AI / github.com

Exemples d'utilisation de YOLO NAS

Le YOLO-NAS convient parfaitement aux applications productives les plus diverses. Voici quelques exemples d'utilisation :

Ville intelligente

Les systèmes de surveillance et l'analyse des flux de trafic bénéficient de la détection rapide de plusieurs objets en temps réel.

YOLO NAS Smart City

Production

Détection de produits ou de parties de machines dans les installations de production avec l'option de détection de défauts de produits.

Yolo nas production

Robotique

Détection d'environnement et d'objets pour les robots, par exemple pour la détection d'objets qu'un robot doit contourner ou saisir.

Yolo nas robotique

Science

Analyse d'images issues de la recherche et de l'environnement médical, par exemple pour la reconnaissance de différents types de cellules. 

Yolo nas Science

Documents

Reconnaissance des structures visuelles dans les documents, par exemple les tableaux et les figures.

Yolo Nas Document 1
Yolo Nas Document 2

Formation et mise en œuvre

La bibliothèque Python SuperGradients facilite l'entraînement et l'implémentation de YOLO-NAS. La bibliothèque Python propose des modèles prédéfinis dans les variantes S, M et L ainsi que des pipelines d'entraînement et d'optimisation qui permettent une implémentation rapide et simple. Les développeurs peuvent ainsi commencer rapidement avec leur propre jeu de données (dataset) et profiter de modèles performants. La bibliothèque SuperGradients est publiée sous la licence Apache 2.0 et peut donc être utilisée pour des applications commerciales avec très peu de restrictions. 

Conclusion

Les variantes des modèles de détection d'objets YOLO-NAS se distinguent par leur précision et leur vitesse d'inférence exceptionnelles. Grâce à des architectures modernes et à l'utilisation de bibliothèques Python, ils peuvent traiter différents types de datasets et fournir des performances remarquables en matière de détection d'objets. L'utilisation de Neural Architecture Search permet une adaptation flexible à différentes configurations matérielles, ce qui rend les modèles adaptés à différents cas d'application.

Les principales caractéristiques comprennent une efficacité, une précision et une flexibilité élevées. En fonction des besoins, les développeurs peuvent choisir entre des variantes de modèles pré-entraînés afin d'obtenir le meilleur équilibre entre vitesse et précision. Les NAS YOLO offrent des avantages dans des applications telles que les villes intelligentes, la production, la robotique et la science.

Grâce à la bibliothèque Python SuperGradients, le processus de formation et d'implémentation peut être facilité, ce qui permet aux développeurs de s'intégrer rapidement à leur propre jeu de données.

"
"
Avatar de Nico Engelmann

Derniers articles