
DeepMind lanzó un prototipo que integra Genie 3 con imágenes de Street View para generar mundos virtuales caminables anclados a ubicaciones reales; la función se ofrece en fase de prueba a suscriptores de Google IA Ultra y, según las demos públicas, la calidad gráfica aún muestra bordes y artefactos visibles. Este avance importa porque permite situar simulaciones en lugares concretos, lo que podría acelerar entrenamientos más realistas para agentes, robots y vehículos autónomos.
El flujo de trabajo comienza con que el usuario marca un punto en el mapa, elige un estilo opcional — por ejemplo “Ocean World”, “Desert Sands”, “Stone Age” o “B&W film”— y describe un personaje; a partir de esa entrada Genie 3 genera la escena anclada a la imagen real. Google describe la técnica como respaldada por Maps Imagery Grounding, y las demostraciones incluyen un Golden Gate Bridge inundado y recreaciones de los Fort Worth Stockyards ambientadas en los años 1920.
La relación con la vasta cobertura de Street View da peso estratégico a la propuesta: años de imágenes de carreteras, interiores, vías navegables y zonas remotas ofrecen material de entrenamiento y puntos de anclaje geográficos para mundos generativos. DeepMind presenta a Genie más como un terreno de entrenamiento que como un producto de consumo final, y ya hay usos internos: el agente SIMA 2 lo emplea y Waymo lo utiliza para simular escenarios urbanos realistas.
Limitaciones prácticas actuales: es un prototipo con calidad gráfica imperfecta y cobertura reducida mayormente a Estados Unidos, por lo que su utilidad dependerá de mejoras en el modelo, en el acceso a más datos geográficos y en la ampliación regional. En su estado actual sirve sobre todo para experimentación y entrenamiento situacional, no todavía para despliegues a gran escala.
Fuentes
Respuestas (0)
Aún no hay respuestas en este tema.