YOLO NAS: Modelo de detección de objetos


Para el reconocimiento de objetos Modelos de IA YOLO-NAS y YOLO-NAS-SAT se han establecido debido a su impresionante rendimiento (precisión) y velocidad durante la inferencia. Estos modelos se basan en arquitecturas modernas y utilizan bibliotecas avanzadas de Python para el entrenamiento y la inferencia. Al utilizar la búsqueda de arquitecturas neuronales y otras técnicas modernas, pueden manejar una gran variedad de conjuntos de datos y ofrecer una velocidad notable y una gran precisión en el reconocimiento de objetos.

Desde imágenes de objetos cotidianos hasta aplicaciones científicas o el reconocimiento de estructuras en documentos, todo es posible con YOLO NAS y YOLO-NAS-SAT.

¿Qué es un modelo de detección de objetos?

Reconocimiento de objetos, en inglés Detección de objetoses una rama del procesamiento de imágenes y la inteligencia artificial que se ocupa de la identificación y localización de objetos en imágenes. La identificación suele realizarse mediante clases predefinidas como "coche", "bicicleta" y "persona". La localización se realiza mediante las llamadas Cajas delimitadorasque rodean los contornos de los objetos y los delinean claramente en una imagen. Un ejemplo de ello:

Recuadros delimitadores de Yolo nas

Hoy en día, un modelo de reconocimiento automático de objetos suele basarse en una red neuronal artificial que se entrena utilizando ejemplos. Tras un entrenamiento satisfactorio, el modelo reconoce objetos similares en nuevas imágenes.

Modelo Yolo nas

NotaEn lo sucesivo, los términos ingleses Detección de objetos y Modelo de detección de objetos ya que también se utilizan predominantemente en la literatura alemana y en el ámbito especializado.

¿Qué son YOLO y YOLO NAS?

YOLO significa "You Only Look Once" (Sólo se mira una vez) y describe una serie de modelos de detección de objetos que se han desarrollado para el reconocimiento de objetos en tiempo real. Gracias a la alta velocidad de inferencia y a la buena precisión simultánea, los modelos de la serie YOLO son populares en aplicaciones del mundo real, ya que una buena precisión a alta velocidad y la eficiencia de recursos suelen ser especialmente importantes en este caso. Los modelos YOLO consiguen su alta velocidad, entre otras cosas, prescindiendo de un proceso de detección en dos etapas, como suele ocurrir con otros modelos.

La variante YOLO-NAS (Búsqueda de arquitectura neuronal) ha sido desarrollado por Deci.AI y es una evolución de los conocidos modelos YOLO. La estructura del modelo se ha diseñado utilizando una búsqueda de arquitectura automatizada con el fin de ser eficiente para diferentes configuraciones de hardware y, al mismo tiempo, alcanzar un alto nivel de precisión. Esto convierte a YOLO-NAS en un modelo flexible y potente.

YOLO-NAS puede optimizarse mediante un Cuantificación de modelos de los bloques individuales a la velocidad después del entrenamiento. Esto implica cambiar el tipo de datos de los pesos de números de coma flotante a enteros de 8 bits. El resultado es que se necesita menos memoria para los pesos y se puede realizar un cálculo más eficiente. Esto, a su vez, influye directamente en la velocidad de inferencia, que puede incrementarse aún más. Como la estructura del modelo y el entrenamiento (Quantisation Aware Training) de YOLO-NAS se desarrollaron con estos bloques cuantificables, la cuantificación influye poco en la precisión, lo que no suele ocurrir con otros modelos.

YOLO-NAS Arquitectura neuronal Búsqueda
Fuente: deci.ai

Principales características de YOLO-NAS

Características principales Modelo Yolo Nas

Eficacia - Excelente velocidad en una amplia gama de plataformas de hardware. Por ejemplo, YOLO-NAS puede utilizarse específicamente para dispositivos móviles con Procesadores Snapdragon optimizados convertirse.

Precisión - Permite la detección precisa de objetos.
Los modelos YOLO NAS son más precisos que yolov7 y yolov8.

Flexibilidad - Aplicable a una gran variedad de tareas y conjuntos de datos. YOLO NAS puede entrenarse con imágenes y objetos procedentes de la ciencia y la tecnología del mismo modo que con imágenes y objetos naturales, por ejemplo, objetos cotidianos.

Modelos preentrenados

Deci.AI proporciona 3 variantes con pesos preentrenados:

  • YOLO-NAS S
  • YOLO-NAS M
  • YOLO-NAS L

Se trata de una versión pequeña (S), una versión mediana (M) y una versión grande (L). Se puede elegir la variante que mejor se adapte a la aplicación. El modelo pequeño es preferible para aplicaciones con requisitos de velocidad muy elevados y precisión reducida, mientras que el modelo mediano o grande es preferible para otras aplicaciones con requisitos de precisión más elevados.

A continuación se muestran los valores de precisión en forma de Media Media Precisión ([email protected]:0.95) basado en el conjunto de datos de validación Coco 2017 y la latencia como medida de la velocidad para una imagen con 640×640 píxeles en una GPU Nvidia T4:

ModelomAPTiempo de latencia (ms)
S47.53.21
M51.555.85
L52.227.87
S INT-847.032.36
M INT-851.03.78
L INT-852.14.78
YOLO NAS
Fuente: Deci.AI / github.com

Ejemplos de aplicación de YOLO NAS

YOLO-NAS es ideal para una amplia gama de aplicaciones productivas. He aquí algunos ejemplos de uso:

Ciudad inteligente

Los sistemas de vigilancia y el análisis del flujo de tráfico se benefician de la rápida detección de múltiples objetos en tiempo real.

YOLO NAS Ciudad Inteligente

Producción

Detección de productos o piezas de máquinas en plantas de producción con la posibilidad de detectar fallos en los productos.

Producción de Yolo nas

Robótica

Reconocimiento de entornos y objetos para robots, por ejemplo, para reconocer objetos que un robot debe rodear o agarrar.

Yolo nas robótica

Ciencia

Análisis de imágenes procedentes de la investigación y en el entorno médico, por ejemplo, para reconocer distintos tipos de células. 

Yolo nas science

Documentos

Reconocimiento de estructuras visuales en documentos, por ejemplo, tablas y figuras.

Yolo Nas Documento 1
Yolo Nas Documento 2

Formación y aplicación

La biblioteca Python SuperGradients facilita el entrenamiento y la implementación de YOLO-NAS. La biblioteca de Python ofrece modelos predefinidos en las variantes S, M y L, así como pipelines de entrenamiento y optimización que permiten una implementación rápida y sin complicaciones. Esto significa que los desarrolladores pueden empezar rápidamente con su propio conjunto de datos y beneficiarse de los potentes modelos. La biblioteca SuperGradients se publica bajo licencia Apache 2.0, por lo que puede utilizarse para aplicaciones comerciales con muy pocas restricciones. 

Conclusión

Las variantes de los modelos de detección de objetos YOLO-NAS se caracterizan por su extraordinaria precisión y velocidad de inferencia. Gracias a sus modernas arquitecturas y al uso de bibliotecas de Python, pueden manejar distintos tipos de conjuntos de datos y ofrecer un rendimiento notable en la detección de objetos. El uso de la búsqueda de arquitectura neuronal permite una adaptación flexible a distintas configuraciones de hardware, lo que hace que los modelos sean adecuados para diferentes casos de uso.

Entre sus principales características destacan su gran eficacia, precisión y flexibilidad. En función de los requisitos, los desarrolladores pueden elegir entre variantes de modelos preentrenados para lograr el mejor equilibrio entre velocidad y precisión. YOLO-NAS ofrece ventajas en aplicaciones como ciudades inteligentes, producción, robótica y ciencia.

Con la ayuda de la biblioteca de Python SuperGradients, se puede facilitar el proceso de formación e implementación, lo que permite a los desarrolladores integrarlo rápidamente con su propio conjunto de datos.

"
"
Avatar de Nico Engelmann

Últimos artículos