Generación de datos sintéticos (SDG)

Acelere el desarrollo de flujos de trabajo de IA física y de agentes.

Cargas de trabajo

Simulación/modelado/diseño
Robótica
IA generativa

Sectores

Todos los sectores

Objetivo del negocio

Innovación

Productos

NVIDIA Omniverse Enterprise
NVIDIA AI
NVIDIA Isaac

Descripción

¿Por qué usar datos sintéticos?

E entrenamiento de cualquier modelo de IA precisa conjuntos de datos etiquetados minuciosamente, de alta calidad y diversos para obtener la precisión y el rendimiento esperados. En muchos casos, hay pocos o ningún dato, o estos están restringidos. La recopilación y el etiquetado de estos datos del mundo real llevan mucho tiempo y pueden resultar prohibitivamente caros, lo que ralentiza el desarrollo de varios tipos de modelos, como los de lenguaje de visión y los modelos lingüísticos de gran tamaño (LLM).

Los datos sintéticos, generados a partir de una simulación por ordenador, modelos de IA generativa o una combinación de ambos, pueden ayudar a abordar este desafío. Los datos sintéticos pueden constar de texto, vídeos e imágenes 2D o 3D en todos los espectros visuales y no visuales, que se pueden utilizar junto con datos del mundo real para entrenar modelos de IA física multimodal. Esto puede ahorrar una cantidad significativa de tiempo de entrenamiento y reducir considerablemente los costes.

Los datos sintéticos, generados a través de simulaciones o de IA, abordan el desafío de la escasez de datos al ofrecer texto, vídeos e imágenes 2D/3D que se pueden utilizar junto con datos reales para entrenar modelos de IA física multimodal, lo que ahorra tiempo y reduce costes.

Velocidad de entrenamiento de modelos de IA

Supere la brecha de datos y acelere el desarrollo de modelos de IA al tiempo que reduce el coste general de adquisición y etiquetado de datos necesarios para el entrenamiento de modelos.

Privacidad y seguridad

Aborda los problemas de privacidad y reduce el sesgo que generan diversos conjuntos de datos sintéticos para representar el mundo real.

Precisión

Crea modelos de IA generalizados y altamente precisos entrenando con datos diversos que incluyen casos inusuales, pero cruciales, que de otra manera son imposibles de recopilar.

Escalable

Genere datos automáticamente usando daros de canalizaciones automatizadas que se adaptan a su caso de uso en fabricación, automoción, robótica y más.

Datos sintéticos para el desarrollo de IA física

Los modelos de IA física permiten a los sistemas autónomos percibir, comprender, interactuar con el mundo físico y navegar por él. Los datos sintéticos son fundamentales para entrenar y probar modelos de IA física.

Entrenamiento de modelos de base

Los modelos básicos de mundo (WFM) utilizan diversos datos de entrada, entre ellos texto, imágenes, vídeos e información de movimiento, para generar y simular mundos virtuales con una precisión notable.   

Los WFM se caracterizan por sus capacidades de generalización excepcionales, que requieren un ajuste fino mínimo para varias aplicaciones. Sirven como motores cognitivos para robots y vehículos autónomos, aprovechando su comprensión integral de la dinámica del mundo real. Para lograr este nivel de sofisticación, los WFM se basan en una gran cantidad de datos de entrenamiento. 


El desarrollo de WFM se beneficia significativamente de la generación de datos sintéticos infinitos a través de simulaciones físicamente precisas. Este enfoque no solo acelera el proceso de entrenamiento de modelos, sino que también mejora la capacidad de los modelos de generalizar en diversos escenarios. Las técnicas de aleatorización de dominio aumentan aún más este proceso al permitir la manipulación de numerosos parámetros, como la iluminación, el fondo, el color, la ubicación y el entorno, variaciones que serían casi imposibles de capturar de forma integral solo a partir de datos del mundo real. 

Entrenamiento de políticas de robots

El aprendizaje de robots es una colección de algoritmos y metodologías que ayudan a un robot a aprender nuevas habilidades, como manipulación, locomoción y clasificación, en un entorno simulado o del mundo real. El aprendizaje por refuerzo, el aprendizaje de imitación y la política de difusión son las metodologías clave aplicadas para entrenar robots.

Una habilidad importante para los robots es la manipulación: recoger cosas, clasificarlas y montarlas, como se ve en las fábricas. Las demostraciones humanas del mundo real se utilizan normalmente como entrada para el entrenamiento. Sin embargo, la recopilación de un conjunto de datos grande y diverso es bastante costosa.

Para superar este desafío, los desarrolladores pueden utilizar los blueprints de NVIDIA Isaac GR00T-Mimic y GR00T-Dreams, basados en NVIDIA Cosmos™, para producir conjuntos de datos de movimiento sintético de gran tamaño y diversidad para el entrenamiento.

El blueprint de NVIDIA Isaac GR00T-Dreams genera grandes cantidades de datos de trayectoria sintéticos utilizando Cosmos a partir de una única imagen e instrucciones en lenguaje natural. Esto permite a los robots aprender nuevas tareas en entornos desconocidos sin necesidad de datos específicos de teleoperación.

Estos conjuntos de datos se pueden utilizar para entrenar los modelos de base abiertos de Isaac GR00T N dentro de Isaac Lab, lo que permite el razonamiento humanoide generalizado y la adquisición de habilidades robustas.

Pruebas y validación

El software-in-loop (SIL) es una etapa de prueba crucial para robots y vehículos autónomos con tecnología de IA, en la que el software de control se prueba en un entorno simulado en lugar de en hardware real.

Los datos sintéticos generados a partir de simulación garantizan un modelado preciso de la física del mundo real, incluidas las entradas de sensores, la dinámica de actuadores y las interacciones medioambientales. Esto también proporciona una forma de capturar escenarios raros que son peligrosos de recopilar en el mundo real. Esto garantiza que la pila de software del robot en la simulación se comporte como si fuera el robot físico, lo que permite pruebas y validación exhaustivas sin necesidad de hardware físico.  

Mega es un blueprint de Omniverse para desarrollar, probar y optimizar flotas de robots e IA física a escala en un gemelo digital antes de la implementación en instalaciones del mundo real.

Estos robots simulados pueden llevar a cabo tareas percibiendo y razonando en entornos. Son capaces de planificar los movimientos siguientes y luego realizar acciones que se simulan en el gemelo digital. Los datos sintéticos de estas simulaciones se vuelven a introducir en el cerebro de los robots. Los cerebros de los robots perciben los resultados decidiendo la próxima acción y este ciclo continúa con el seguimiento preciso que hace Mega del estado y la posición de todos los activos en el gemelo digital.

Datos sintéticos para el desarrollo de LLM e IA de agentes

Se pueden usar modelos generativos para impulsar y desarrollar los procesos de generación de datos sintéticos. Con los modelos de texto a 3D se pueden crear activos 3D para rellenar escenas de simulación 3D. También se pueden usar modelos de IA generativa de texto a imagen para modificar y enriquecer imágenes existentes mediante procesos de eliminación o ampliación procedural de imágenes, tanto las generadas con simulaciones como las recopiladas del mundo real.

Los modelos de IA generativa de texto a texto, como Evian 2 405B y Nemotron-4 340B, se pueden utilizar para generar datos sintéticos para crear potentes LLM para la atención sanitaria, las finanzas, la ciberseguridad, el comercio minorista y las telecomunicaciones. 

Evian 2 405B y Nemotron-4 340B ofrecen una licencia abierta que otorga a los desarrolladores el derecho a poseer y utilizar los datos que generan sus aplicaciones académicas y comerciales.

Cómo crear una canalización de SDG habilitada por IA generativa

La IA generativa puede acelerar considerablemente el proceso de generación de datos sintéticos físicamente precisos a escala. Los desarrolladores pueden empezar a utilizar la IA generativa para los SDG con un flujo de trabajo de referencia paso a paso.


Implementación técnica

Generación de datos sintéticos

Para IA física

  • Creación de escenas: una escena 3D integral sirve de base e incorpora activos esenciales como estantes, cajas y palés para almacenes o árboles, carreteras y edificios para entornos al aire libre. Los entornos se pueden mejorar dinámicamente utilizando los microservicios NVIDIA NIM™ para la descripción universal de escenas (OpenUSD), lo que permite la adición perfecta de diversos objetos y la integración de fondos HDRI de 360°.
  • Aleatorización de dominio: los desarrolladores pueden aprovechar USD Code NIM, un LLM de vanguardia especializado en OpenUSD, para realizar la aleatorización de dominios. Esta potente herramienta no solo responde a consultas relacionadas con OpenUSD, sino que también genera código USD Python para realizar cambios en la escena, agilizando el proceso de alteración de varios parámetros de escena dentro de NVIDIA Omniverse.
  • Generación de datos: el tercer paso implica exportar el conjunto inicial de imágenes anotadas. Omniverse ofrece una amplia gama de anotadores integrados, entre ellos cuadros de delimitación 2D, segmentación semántica, mapas de profundidad, normales de superficie y muchos otros. La elección del formato de salida, como los cuadros de delimitación o las animaciones, depende de los requisitos del modelo o del caso de uso específicos.
  • Aumento de datos: en la etapa final, los desarrolladores pueden aprovechar los WFM de NVIDIA Cosmos para aumentar aún más la imagen de 3D a real. Esto aporta el fotorrealismo necesario a las imágenes generadas a través de simples indicaciones de usuario.

Para LLM e IA de agentes

  • Modelos de acceso: descargue la familia de modelos de código abierto Nemotron-4 340B del catálogo de NVIDIA NGC™ o de Hugging Face. También puede acceder a él a través de build.nvidia.com como un microservicio NVIDIA NIM.
  • Generación de datos específicos de dominio: indique al modelo de código abierto Nemotron-4-340B-Instruct que genere su conjunto de datos sintéticos personalizado basado en texto, diverso de dominios y diverso de texto, que imita las características del mundo real.
  • Evaluar y filtrar: aplique el modelo Nemotron-4 340B-Reward para clasificar las respuestas generadas en función de la utilidad, la corrección, la coherencia, la complejidad y la verbosidad.
  • Aproveche conjuntos de datos sintéticos relevantes y de alta calidad: refine los datos sintéticos mejorándolos de forma iterativa en función de los comentarios del modelo de recompensa, lo que garantiza la precisión y la relevancia. 

Ecosistema de colaboración

Ecosistema de socios de datos sintéticos

Vea cómo nuestro ecosistema desarrolla sus propias aplicaciones y servicios de datos sintéticos basados en las tecnologías de NVIDIA.

Empresas de datos sintéticos

Socios de prestación de servicios

Empezar

Cree su propia canalización de SDG para simulaciones robóticas, inspección industrial y otros casos de uso de IA física con NVIDIA Isaac Sim.

Casos de uso relacionados