Aivizor
Aivizor
EstilosCreacionesComunidad
Atrás
  1. Comunidad
  2. /
  3. NVIDIA

Presentan RTX Spark y amplias mejoras para ejecutar agentes locales en PCs RTX y estaciones DGX

News
D
Darya Lebedeva

6/1/2026, 7:13:54 AM

Presentan RTX Spark y amplias mejoras para ejecutar agentes locales en PCs RTX y estaciones DGX

Durante GTC Taipei, celebrado en el marco de COMPUTEX, se presentó RTX Spark, una nueva categoría de equipos Windows pensada para ejecutar agentes personales directamente en dispositivos del usuario. El anuncio combinó especificaciones de hardware, herramientas de runtime y acuerdos con desarrolladores de aplicaciones; el objetivo declarado es facilitar el despliegue de agentes on‑device manteniendo compatibilidad, gestión y experiencia nativa en Windows.

RTX Spark está diseñado para ofrecer hasta 1 petaflop de rendimiento de IA y hasta 128 GB de memoria unificada para sostener cargas de trabajo de agentes en el dispositivo. La plataforma se orienta tanto a portátiles delgados con autonomía de batería para todo el día como a equipos de escritorio ultraeficientes, con la intención de integrar aceleración de inferencia junto a las funciones de administración y seguridad de Windows en equipos convencionales de consumo y profesionales.

Como complemento de la familia Spark, se presentó DGX Station for Windows: una estación de sobremesa que incorpora procesador y acelerador de clase centro de datos para ejecutar inferencia local en entornos de escritorio. Está concebida para profesionales que necesitan capacidades de inferencia robustas sin depender exclusivamente de la nube, y busca ofrecer las herramientas de gestión, control y seguridad que administran entornos Windows empresariales.

La seguridad y la privacidad fueron ejes centrales del anuncio: la adopción masiva de agentes locales se ha visto limitada por la dificultad de ejecutar esos agentes de forma segura en el PC principal del usuario. Para atacar ese problema se anunciaron nuevas primitivas de seguridad en Windows — identidad, contención, políticas y seguridad de extremo a extremo — combinadas con un runtime llamado OpenShell. Estas piezas aspiran a ofrecer controles de ejecución, aislamiento y trazabilidad para que los agentes manejen datos sensibles sin exponer la integridad del equipo o la privacidad del usuario.

OpenShell ampliará las capacidades de control sobre las acciones que puede realizar un agente y permitirá enrutar consultas entre modelos locales y remotos según las preferencias de privacidad del usuario. Además, incluirá funciones para ofuscar o disfrazar información personal cuando una petición deba resolverse con un modelo en la nube, reduciendo el riesgo de filtrado de datos. En paralelo, desarrolladores de agentes y proveedores de aplicaciones anunciaron planes para integrar OpenShell y las nuevas primitivas de Windows en sus lanzamientos para el ecosistema Windows.

En el terreno de modelos abiertos y optimizaciones de ejecución, se colaboró con la comunidad de llama.cpp para introducir técnicas como multi‑token prediction (MTP) y optimizaciones de lanzamiento dependiente programático. Según las pruebas presentadas, esas mejoras están disponibles en la webUI de llama.cpp y en LM Studio y pueden ofrecer aumentos de rendimiento de hasta 2x en Qwen 3.6/3.5 27B y hasta 1.6x en Qwen 3.6/3.5 35B en hardware GeForce RTX específico.

Las optimizaciones multi‑GPU también recibieron impulso. Llama.cpp añadió paralelismo tensorial que, en configuraciones de dos GPUs equivalentes, duplica la memoria utilizable y mejora hasta 1.8x el rendimiento de cómputo en pruebas internas. De forma similar, ComfyUI incorpora un método de guidance sin clasificador que puede ofrecer hasta 2x de rendimiento en dos GPUs, y añade la opción de repartir cadenas de modelos entre tarjetas para aprovechar memoria y cómputo combinados en tareas gráficas y de inferencia.

Varios socios del ecosistema anunciaron integraciones y adaptaciones para sacar partido a las nuevas capacidades: una compañía identificada como H Company presentó herramientas de escritorio, nuevos modelos y un harness de agente optimizados para RTX y DGX; proveedores de software creativo informaron cambios planificados en sus flujos de trabajo para aprovechar la aceleración local. En concreto, se anunció que Photoshop y Premiere serán re‑arquitectados para incorporar estas mejoras, Blender añadirá DLSS 4.5 Ray Reconstruction y la función RTX Video Frame Generation se integrará en ComfyUI.

Además de las novedades de inferencia y ejecución, la actualización de utilidades y periféricos incluye NVIDIA Broadcast 2.2, que incorpora optimizaciones en Studio Voice y soporte para Elgato Stream Deck; Project G — Assist sumará integración con Stream Deck. Estas mejoras buscan integrar el control físico y la experiencia de creación en entornos Windows con agentes locales y flujos automatizados. En conjunto, los anuncios proyectan un ecosistema orientado a que agentes locales puedan ejecutar flujos multipaso, generación de imágenes y vídeo, y otras tareas creativas o productivas directamente en el equipo del usuario, manteniendo controles de privacidad y opciones para delegar a la nube solo cuando el usuario lo prefiera. Se indicó que estas actualizaciones y la llegada de equipos RTX Spark empezarán a desplegarse este otoño.

Fuentes

  1. NVIDIA Newsroom RSS · 6/1/2026
0
0
0

Respuestas (0)

Aún no hay respuestas en este tema.

9:41