
En GTC Taipei (1 de junio de 2026) NVIDIA reveló Cosmos 3, un 'world model' multimodal para generar datos sintéticos y predecir estados del mundo; presentó Alpamayo 2 Super, un modelo 'teacher' para robotaxis de Nivel 4;
NVIDIA anunció en GTC Taipei (1 de junio de 2026) una nueva familia de modelos orientados a sistemas físicos: Cosmos 3, un 'world model' multimodal; Alpamayo 2 Super, un modelo docente para robotaxis de Nivel 4; y una plataforma de referencia abierta para humanoides. El paquete apunta a integrar visión, audio y datos de acción para entrenar y controlar agentes en entornos reales, acelerando pruebas y despliegue en robótica y conducción autónoma.
Cosmos 3 unifica texto, imágenes, video, audio ambiental y señales de acción en un solo sistema, y se presenta para tres usos principales: operar como modelo visión‑lenguaje (por ejemplo, uso con Linker Vision para detectar anomalías en el tráfico), generar secuencias fotorrealistas de eventos raros para entrenamiento, y suministrar trayectorias y ángulos articulares para robots, demostrados con Agile Robots. Su arquitectura combina transformers de razonamiento y de generación y, según NVIDIA, se entrenó con miles de millones de ejemplos.
La compañía lanzó tres variantes de Cosmos 3 — Super, Nano y un modelo Edge previsto— y publicó los pesos bajo la licencia OpenMDW‑1.1 en Hugging Face y GitHub. En paralelo, Alpamayo 2 Super se presentó como el 'teacher' avanzado para robotaxis de Nivel 4; la familia Alpamayo procesa imágenes de cámara, deriva decisiones de conducción y genera trayectorias. Las versiones anteriores, Alpamayo 1 Nano y 1.5 Nano, tenían 10.000 millones de parámetros cada una.
La iniciativa se articula además mediante la 'Cosmos Coalition', que agrupa a Black Forest Labs, Runway, LTX, Generalist, Agile Robots y Skild IA, y se apoya en la infraestructura DGX Cloud de NVIDIA. La combinación de modelos accesibles, datos sintéticos, licencia abierta y variantes Edge/Nano busca facilitar la implementación desde la nube hasta sistemas embebidos, lo que podría acelerar el entrenamiento, las pruebas y el despliegue de robots, robotaxis y sistemas de vigilancia.
Fuentes
Respuestas (0)
Aún no hay respuestas en este tema.