En Cloud Next ’26 (12 de mayo de 2026) se presentó Cloud Storage Rapid, una familia de capacidades de almacenamiento de objetos orientada a cargas de trabajo intensivas en datos como IA y análisis. El anuncio subraya la intención de ofrecer rendimiento zonal de alta velocidad sin sacrificar la facilidad y escala del almacenamiento de objetos, lo que puede mitigar cuellos de botella de I/O en entrenamiento e inferencia de modelos a gran escala.
La oferta inicial incluye Rapid Bucket (antes Rapid Storage), que llega a disponibilidad general (GA) como un bucket zonal dedicado de alto rendimiento. Rapid Bucket se apoya en Colossus — el sistema de almacenamiento distribuido que alimenta servicios como Gemini y YouTube — para ofrecer latencias submilisegundo y alto rendimiento en lecturas y escrituras, combinando la latencia de almacenamiento en bloque, el throughput de un sistema de archivos paralelo y la escalabilidad típica del almacenamiento de objetos.
En métricas públicas, Rapid Bucket alcanza hasta 20 millones de consultas por segundo con latencia submilisegundo y más de 15 TB/s de rendimiento agregado de lectura desde un único bucket zonal Rapid. Junto a esos números, introduce nuevas semánticas orientadas al rendimiento: appends nativos, lectores ilimitados mientras se escribe y lecturas vectorizadas — funcionalidades que influyen directamente en los patrones de I/O empleados en flujos de datos para entrenamiento y análisis.
La segunda pieza es Rapid Cache, renombrado desde Anywhere Cache y anunciado originalmente en Cloud Next ’25. Rapid Cache acelera el ancho de banda para cargas de trabajo de IA/ML que realizan muchas lecturas — como preparación de datos y entrenamiento— y permite colocalizar cómputo y datos en buckets existentes al servir lecturas bajo demanda, reduciendo latencias sin requerir migraciones masivas de datos.
El contexto técnico y de mercado es claro: a medida que se entrenan modelos con billones de parámetros y se despliega inferencia a escala global, las GPU y TPU dependen críticamente del rendimiento del almacenamiento. Históricamente los equipos han debido elegir entre sistemas zonales especializados y almacenes de objetos globales; la familia Rapid propone una vía para colocalizar cargas de cómputo con almacenamiento zonal de alto rendimiento y así aminorar los cuellos de botella de I/O.
En cuanto a resultados prácticos, la compañía reporta mejoras medibles en cargas de IA y análisis con Rapid Bucket: reducción del 50% en tiempo de GPU parada, hasta 2.5x en velocidad de carga de datos para entrenamientos multimodales, restauraciones de checkpoint hasta 5x más rápidas y escrituras 3.2x más rápidas frente al almacenamiento de objetos tradicional. la compañía remite a su documentación para comenzar.
Fuentes
Respuestas (0)
Aún no hay respuestas en este tema.