AllenAI presenta OlmoEarth v1.1: hasta 3× menos coste de cómputo sin perder precisión en teledetección

News

5/19/2026, 8:37:18 PM

AllenAI presenta OlmoEarth v1.1: hasta 3× menos coste de cómputo sin perder precisión en teledetección

AllenAI publicó OlmoEarth v1.1 el 19 de mayo de 2026 (autor: Kyle Wiggers). La versión reduce hasta 3× el coste de cómputo respecto a v1 manteniendo rendimiento en una mezcla de benchmarks de investigación y tareas con socios;

AllenAI lanzó OlmoEarth v1.1 el 19 de mayo de 2026, una familia de modelos diseñada para aplicaciones de teledetección a gran escala que reduce el coste de cómputo hasta 3× frente a la versión v1 sin degradar la precisión en los conjuntos evaluados. Este recorte de costes puede ampliar el despliegue en organizaciones con infraestructura limitada y acelerar análisis satelitales operativos.

La entrada técnica indica que la reducción de coste se comprobó tanto en una mezcla de benchmarks de investigación como en tareas co‑desarrolladas con socios. Los autores mantienen que OlmoEarth v1.1 conserva el rendimiento de v1 mientras requiere menos recursos por pasada, lo que implica ahorro en inferencia y en el pipeline completo de exportación de datos, preprocesado e inferencia y postprocesado.

La principal palanca de eficiencia fue optimizar la longitud de la secuencia de tokens en arquitecturas basadas en transformer, ya que el coste de cómputo escala de forma cuadrática con esa longitud. Para cuantificar la carga computacional, AllenAI emplea MACs (multiply — accumulate operations); reducir MACs se traduce en menos tiempo de cómputo y menor coste operacional durante todo el ciclo de vida del modelo.

En el caso de datos Sentinel‑2, OlmoEarth convierte la entrada en tokens considerando la estructura [H, W, T, D=12]. Los datos se dividen en parches de tamaño p×p y se genera un token por timestep y por resolución (10 m, 20 m y 60 m). Por ejemplo, con 2 timesteps se crean 6 tokens por parche; en general el número total de tokens es H/p × W/p × T × 3, lo que permite estimar y optimizar el coste computacional en función del diseño de entrada.

La publicación compara diseños de tokenización: Galileo y SatMAE usan un token por resolución (y SatMAE reporta mejoras con ese enfoque), mientras que CROMA agrupa todas las bandas en un único token, reduciendo el conteo de tokens en 3×. AllenAI advierte que combinar tokens sin adaptar el preentrenamiento puede causar pérdidas notables: cita una caída de 10 puntos porcentuales en la métrica m-eurosat kNN como ejemplo, y sugiere que separar resoluciones facilita modelar relaciones entre bandas.

Por qué importa: la versión original OlmoEarth v1, lanzada en noviembre de 2025, ya se ha aplicado con socios para seguimiento de manglares, clasificación de causas de pérdida forestal y generación de mapas de tipo de cultivo a escala nacional en cuestión de días. OlmoEarth v1.1 pretende reducir las barreras de coste para ampliar esos despliegues y permitir que más organizaciones ejecuten modelos de teledetección a escala nacional, continental y global. La publicación incluye enlaces a la colección de modelos, al tech report y al código de preentrenamiento.

Fuentes

Hugging Face Blog · 5/19/2026

Respuestas (0)

Aún no hay respuestas en este tema.

Atrás