
En GTC Taipei se presentó Vera, una nueva CPU concebida para ejecutar agentes de inteligencia artificial a gran escala y puesta ya en producción por su fabricante. El procesador se define como específico para flujos de trabajo donde los agentes actúan, orquestan herramientas, ejecutan código y procesan grandes volúmenes de datos, y la compañía anunció que varios líderes tecnológicos planean adoptarlo para esos fines.
Vera se describe como continuación de la línea de CPUs Grace y ha sido diseñada para priorizar eficiencia energética y rendimiento en cargas intensivas de IA. Según la información difundida, el chip completa tareas representativas 1,8 veces más rápido que CPUs x86 en pruebas seleccionadas y alimentará servidores independientes denominados Vera, sistemas llamados Vera Rubin y plataformas de almacenamiento Vera BlueField-4 STX.
Los datos de rendimiento citados en el anuncio incluyen resultados de Phoronix, que en sus pruebas observó que Vera mostró el mejor rendimiento general en cargas típicas de agentes: compilación de código, ejecuciones de Python y Java y procesamiento de bases de datos. Esos tipos de tareas se identifican como críticas en la ruta de ejecución de agentes cuando éstos invocan herramientas externas o ejecutan código en entornos aislados.
El lanzamiento se enmarca como continuidad de la familia Grace, que acumula cerca de 2,5 millones de envíos hasta la fecha, según el comunicado. La compañía vincula el diseño de Vera con una transición en los centros de datos: de métricas tradicionales de "cores por dólar" hacia economías orientadas a "tokens por dólar" para fábricas de IA que necesitan optimizar el coste por unidad de trabajo de modelos y agentes.
En la nota oficial se enumeran clientes y laboratorios que exploran o planean integrar Vera en sus infraestructuras: NYSE, Anthropic, OpenAI, SpaceXAI, ByteDance, CoreWeave, Lambda, Nebius, Nscale y Oracle Cloud Infrastructure (OCI). Además, anunciaron que fabricantes de servidores y ensambladores trabajarán a gran escala con el procesador, entre ellos Dell Technologies, HPE, Lenovo y Supermicro, así como socios taiwaneses como ASUS, Compal, Foxconn, GIGABYTE, Pegatron, QCT, Wistron y Wiwynn.
El comunicado ofrece ejemplos concretos de uso: la Bolsa de Valores de Nueva York (NYSE) planea trabajar con Redpanda y HPE usando Vera para ampliar capacidad y optimizar latencias en una infraestructura que, según esa entidad, procesa más de 1,1 billones de mensajes por día. Anthropic indicó que evalúa añadir Vera para escalar cargas CPU-intensivas de agentes, y Oracle afirmó su intención de desplegar el procesador en su OCI Supercluster para soportar razonamiento de alto rendimiento y procesamiento de datos.
Según la compañía, la relevancia de una CPU orientada a agentes radica en que los sistemas de IA evolucionan de responder preguntas a tomar acciones autónomas y ejecutar código: eso desplaza parte de la carga crítica hacia la CPU, que debe orquestar, validar y transformar datos con latencias menores. La entrada en producción de Vera y su incorporación por proveedores de nube y fabricantes de servidores se presenta como un paso para reducir esos tiempos en centros de datos modernos.
La presentación incluye también la integración del procesador en diferentes tipos de equipos para desplegar agentes a escala: servidores autónomos Vera, sistemas Vera Rubin y soluciones de almacenamiento Vera BlueField-4 STX, con socios de hardware y nube que facilitarán su disponibilidad comercial. El anuncio subraya que la adopción pretende atender tanto cargas de inferencia mixtas como tareas de orquestación y procesamiento intensivo en CPU que acompañan a los agentes de IA.
Fuentes
Respuestas (0)
Aún no hay respuestas en este tema.