
Google anunció en la conferencia I/O del 19 de mayo de 2026 una actualización amplia de su familia Gemini orientada a acelerar modelos, ampliar la multimodalidad y ofrecer agentes autónomos persistentes en la nube. Estos cambios pretenden reducir costes y habilitar cargas de trabajo agentic sostenidas, con impacto directo en desarrolladores y empresas que desplieguen agentes en producción.
Los productos presentados incluyen Gemini 3.5 Flash, diseñado para ser más rápido y económico; Gemini Omni, un modelo multimodal que iniciará con generación de vídeo y después trabajará con imagen y texto; y Gemini Spark, un agente personal programado para operar 24/7 en la nube. Google también mostró un rediseño visual de la aplicación Gemini y actualizaciones para desarrolladores enfocadas en flujos de trabajo multimodales.
En la parte de rendimiento, Sundar Pichai afirmó que Gemini 3.5 Flash supera a Gemini 3.1 Pro en casi todos los benchmarks y citó un análisis — según Google — que coloca a Flash en el cuadrante superior‑derecho de inteligencia frente a velocidad, y lo describe como cuatro veces más rápido que otros modelos de frontera. La compañía añadió que una versión optimizada en Antigravity puede ser hasta doce veces más veloz y costar entre un tercio y la mitad de modelos comparables; además, Gemini 3.5 Pro se espera para el mes próximo.
Antigravity recibió mejoras para gestionar múltiples agentes autónomos simultáneamente, facilitando pipelines complejos y sesiones prolongadas. Google amplió también funciones de búsqueda potenciadas por IA y resaltó SynthID, su herramienta de marca de agua para contenidos generados por IA, como parte del paquete de confianza y seguridad para creadores y empresas.
Koray Kavukcuoglu mencionó pruebas internas que ilustran las ambiciones de la nueva serie 3.5, incluidas tareas de escala como la construcción de un sistema operativo desde cero. En conjunto, las novedades buscan habilitar flujos iterativos de edición multimodal y ofrecer capacidades agentic capaces de mantener sesiones autónomas durante horas y ejecutar pipelines de codificación complejos.
Fuentes
Respuestas (0)
Aún no hay respuestas en este tema.