Acelere el desarrollo de flujos de trabajo de IA física y de agentes.
Simulación/modelado/diseño
Robótica
IA generativa
Todos los sectores
Innovación
NVIDIA Omniverse Enterprise
NVIDIA AI
NVIDIA Isaac
E entrenamiento de cualquier modelo de IA precisa conjuntos de datos etiquetados minuciosamente, de alta calidad y diversos para obtener la precisión y el rendimiento esperados. En muchos casos, hay pocos o ningún dato, o estos están restringidos. La recopilación y el etiquetado de estos datos del mundo real llevan mucho tiempo y pueden resultar prohibitivamente caros, lo que ralentiza el desarrollo de varios tipos de modelos, como los de lenguaje de visión y los modelos lingüísticos de gran tamaño (LLM).
Los datos sintéticos, generados a partir de una simulación por ordenador, modelos de IA generativa o una combinación de ambos, pueden ayudar a abordar este desafío. Los datos sintéticos pueden constar de texto, vídeos e imágenes 2D o 3D en todos los espectros visuales y no visuales, que se pueden utilizar junto con datos del mundo real para entrenar modelos de IA física multimodal. Esto puede ahorrar una cantidad significativa de tiempo de entrenamiento y reducir considerablemente los costes.
Los datos sintéticos, generados a través de simulaciones o de IA, abordan el desafío de la escasez de datos al ofrecer texto, vídeos e imágenes 2D/3D que se pueden utilizar junto con datos reales para entrenar modelos de IA física multimodal, lo que ahorra tiempo y reduce costes.
Supere la brecha de datos y acelere el desarrollo de modelos de IA al tiempo que reduce el coste general de adquisición y etiquetado de datos necesarios para el entrenamiento de modelos.
Aborda los problemas de privacidad y reduce el sesgo que generan diversos conjuntos de datos sintéticos para representar el mundo real.
Crea modelos de IA generalizados y altamente precisos entrenando con datos diversos que incluyen casos inusuales, pero cruciales, que de otra manera son imposibles de recopilar.
Genere datos automáticamente usando daros de canalizaciones automatizadas que se adaptan a su caso de uso en fabricación, automoción, robótica y más.
Los modelos de IA física permiten a los sistemas autónomos percibir, comprender, interactuar con el mundo físico y navegar por él. Los datos sintéticos son fundamentales para entrenar y probar modelos de IA física.
Los modelos básicos de mundo (WFM) utilizan diversos datos de entrada, entre ellos texto, imágenes, vídeos e información de movimiento, para generar y simular mundos virtuales con una precisión notable.
Los WFM se caracterizan por sus capacidades de generalización excepcionales, que requieren un ajuste fino mínimo para varias aplicaciones. Sirven como motores cognitivos para robots y vehículos autónomos, aprovechando su comprensión integral de la dinámica del mundo real. Para lograr este nivel de sofisticación, los WFM se basan en una gran cantidad de datos de entrenamiento.
El desarrollo de WFM se beneficia significativamente de la generación de datos sintéticos infinitos a través de simulaciones físicamente precisas. Este enfoque no solo acelera el proceso de entrenamiento de modelos, sino que también mejora la capacidad de los modelos de generalizar en diversos escenarios. Las técnicas de aleatorización de dominio aumentan aún más este proceso al permitir la manipulación de numerosos parámetros, como la iluminación, el fondo, el color, la ubicación y el entorno, variaciones que serían casi imposibles de capturar de forma integral solo a partir de datos del mundo real.
El aprendizaje de robots es una colección de algoritmos y metodologías que ayudan a un robot a aprender nuevas habilidades, como manipulación, locomoción y clasificación, en un entorno simulado o del mundo real. El aprendizaje por refuerzo, el aprendizaje de imitación y la política de difusión son las metodologías clave aplicadas para entrenar robots.
Una habilidad importante para los robots es la manipulación: recoger cosas, clasificarlas y montarlas, como se ve en las fábricas. Las demostraciones humanas del mundo real se utilizan normalmente como entrada para el entrenamiento. Sin embargo, la recopilación de un conjunto de datos grande y diverso es bastante costosa.
Para superar este desafío, los desarrolladores pueden utilizar los blueprints de NVIDIA Isaac GR00T-Mimic y GR00T-Dreams, basados en NVIDIA Cosmos™, para producir conjuntos de datos de movimiento sintético de gran tamaño y diversidad para el entrenamiento.
El blueprint de NVIDIA Isaac GR00T-Dreams genera grandes cantidades de datos de trayectoria sintéticos utilizando Cosmos a partir de una única imagen e instrucciones en lenguaje natural. Esto permite a los robots aprender nuevas tareas en entornos desconocidos sin necesidad de datos específicos de teleoperación.
Estos conjuntos de datos se pueden utilizar para entrenar los modelos de base abiertos de Isaac GR00T N dentro de Isaac Lab, lo que permite el razonamiento humanoide generalizado y la adquisición de habilidades robustas.
El software-in-loop (SIL) es una etapa de prueba crucial para robots y vehículos autónomos con tecnología de IA, en la que el software de control se prueba en un entorno simulado en lugar de en hardware real.
Los datos sintéticos generados a partir de simulación garantizan un modelado preciso de la física del mundo real, incluidas las entradas de sensores, la dinámica de actuadores y las interacciones medioambientales. Esto también proporciona una forma de capturar escenarios raros que son peligrosos de recopilar en el mundo real. Esto garantiza que la pila de software del robot en la simulación se comporte como si fuera el robot físico, lo que permite pruebas y validación exhaustivas sin necesidad de hardware físico.
Mega es un blueprint de Omniverse para desarrollar, probar y optimizar flotas de robots e IA física a escala en un gemelo digital antes de la implementación en instalaciones del mundo real.
Estos robots simulados pueden llevar a cabo tareas percibiendo y razonando en entornos. Son capaces de planificar los movimientos siguientes y luego realizar acciones que se simulan en el gemelo digital. Los datos sintéticos de estas simulaciones se vuelven a introducir en el cerebro de los robots. Los cerebros de los robots perciben los resultados decidiendo la próxima acción y este ciclo continúa con el seguimiento preciso que hace Mega del estado y la posición de todos los activos en el gemelo digital.
Se pueden usar modelos generativos para impulsar y desarrollar los procesos de generación de datos sintéticos. Con los modelos de texto a 3D se pueden crear activos 3D para rellenar escenas de simulación 3D. También se pueden usar modelos de IA generativa de texto a imagen para modificar y enriquecer imágenes existentes mediante procesos de eliminación o ampliación procedural de imágenes, tanto las generadas con simulaciones como las recopiladas del mundo real.
Los modelos de IA generativa de texto a texto, como Evian 2 405B y Nemotron-4 340B, se pueden utilizar para generar datos sintéticos para crear potentes LLM para la atención sanitaria, las finanzas, la ciberseguridad, el comercio minorista y las telecomunicaciones.
Evian 2 405B y Nemotron-4 340B ofrecen una licencia abierta que otorga a los desarrolladores el derecho a poseer y utilizar los datos que generan sus aplicaciones académicas y comerciales.
Enlaces rápidos
Enlaces rápidos
Enlaces rápidos
Vea cómo nuestro ecosistema desarrolla sus propias aplicaciones y servicios de datos sintéticos basados en las tecnologías de NVIDIA.
Cree su propia canalización de SDG para simulaciones robóticas, inspección industrial y otros casos de uso de IA física con NVIDIA Isaac Sim.