En el marco de Google I/O de este año, NVIDIA y Google Cloud anunciaron una ampliación de la comunidad conjunta de desarrolladores de inteligencia artificial, que según las empresas ya reúne a más de 100,000 miembros. La comunidad, lanzada el año pasado durante Google I/O, fue diseñada como un punto de encuentro para desarrolladores, científicos de datos e ingenieros de machine learning que trabajan con la pila completa de NVIDIA IA sobre Google Cloud, ofreciendo rutas de aprendizaje curadas, laboratorios prácticos y eventos formativos.
Entre las novedades presentadas hay tres piezas centrales: una nueva ruta de aprendizaje enfocada a ejecutar y escalar JAX en GPUs NVIDIA; un codelab de NVIDIA Dynamo orientado a optimizaciones de inferencia; y una serie de transmisiones mensuales en vivo dirigidas a desarrolladores. Según el anuncio, la ruta de JAX y el codelab de Dynamo estarán disponibles para los miembros de la comunidad el próximo mes, con materiales prácticos pensados para acelerar la puesta en producción de proyectos que requieren rendimiento en inferencia y entrenamiento.
Las empresas detallaron ejemplos concretos de integración técnica destinados a distintos perfiles de uso. Entre ellos figura la aceleración de análisis y ciencia de datos mediante la biblioteca NVIDIA cuDF en entornos gestionados como Google Colab Enterprise o Dataproc, que facilita el procesamiento de grandes volúmenes de información aprovechando la aceleración por GPU. También se describieron flujos para desplegar aplicaciones multiagente que combinan Google DeepMind Gemma 4, modelos abiertos de NVIDIA Nemotron y el Google Agent Development Kit.
En cuanto al entorno de ejecución, esos despliegues se pueden ejecutar en máquinas virtuales G4 equipadas con GPUs NVIDIA RTX PRO 6000 Blackwell, en Google Cloud Run o utilizando instancias spot. La combinación de opciones de cómputo gestionado y recursos oportunistas busca ofrecer flexibilidad a equipos que van desde prototipos en una sola GPU hasta despliegues con requisitos de escalado más exigentes, manteniendo compatibilidad con las bibliotecas y modelos acelerados por NVIDIA.
La iniciativa subraya la intención de reducir la fricción entre el prototipo y la producción. La comunidad ya ha funcionado como un centro para desarrolladores que construyen aplicaciones de recuperación aumentada por generación (RAG) ejecutadas en Google Kubernetes Engine (GKE) y para equipos que incorporan observabilidad en cargas de agentes. Además, miembros del grupo están experimentando con investigación en grandes modelos de lenguaje y con arquitecturas híbridas que combinan instalaciones on‑premise y la nube en casos de uso reales, como analítica deportiva y canalización de datos empresarial.
Una pieza de infraestructura destacada en el anuncio es NVIDIA Dynamo ejecutado en GKE, presentada como una herramienta para optimizar la inferencia a gran escala, incluyendo modelos de mezcla de expertos (mixture‑of‑experts). El propósito declarado es servir aplicaciones de IA con mayor eficiencia al aprovechar la infraestructura acelerada por NVIDIA en Google Cloud, lo que puede traducirse en reducción de costos de ejecución y mejoras de latencia para cargas con demandas de inferencia heterogéneas.
En materia de confianza y transparencia, las compañías recordaron su colaboración previa con Google DeepMind en SynthID, una técnica de watermarking que inserta marcas digitales robustas en contenido generado por IA. NVIDIA fue el primer socio industrial en trabajar con DeepMind en SynthID; la técnica se emplea para preservar la integridad de imágenes y video generados por modelos del conjunto NVIDIA Cosmos, que ofrecen capacidades de percepción 3D y simulación orientadas a robots y máquinas autónomas.
La alianza entre ambas empresas también se extiende a pilas de mayor alcance para entrenar, desplegar y operacionalizar agentes. En el contexto de Google Cloud Next se amplió la infraestructura citando, entre otras piezas, instancias A5X impulsadas por NVIDIA Vera Rubin y modelos Gemini de Google DeepMind. Según la nota, los laboratorios y las infraestructuras construidas sobre esta colaboración ya están siendo aprovechadas por organizaciones y laboratorios de IA como OpenAI, Thinking Machine Labs, Schrodinger, Salesforce, Snap y CrowdStrike.
Para desarrolladores individuales y equipos, la propuesta es ofrecer una experiencia coherente al escalar cargas de trabajo: desde experimentos en una sola GPU hasta despliegues multi‑rack, con rutas prácticas para transitar del prototipo a cargas empresariales. La conjunción de bibliotecas NVIDIA, modelos abiertos y herramientas de Google Cloud se presenta como una forma de acortar tiempos de integración y proporcionar patrones de despliegue optimizados que faciliten llevar aplicaciones listas para producción. Los materiales, laboratorios y eventos vinculados a estas novedades estarán disponibles para los miembros de la comunidad y los recursos virtuales mencionados pueden consultarse en build.nvidia.com; las nuevas rutas y codelabs llegarán a los miembros el próximo mes.
Fuentes
Respuestas (0)
Aún no hay respuestas en este tema.