
19 мая 2026 команда AllenAI выпустила OlmoEarth v1.1 — новую версию семейства моделей для дистанционного зондирования, ориентированную на практическое снижение вычислительных затрат при массовых развертываниях. Релиз сопровождается коллекцией моделей, исходным кодом и техническим отчётом; по словам авторов, сокращение расходов на вычисления делает возможным более оперативную обработку больших территорий.
OlmoEarth использует архитектуру трансформера, которая сначала переводит спутниковые данные в последовательности токенов. Для Sentinel‑2 вход имеет форму [H, W, T, D=12]; изображение разбивается на патчи размера p×p, и модель обычно генерирует по одному токену на временной шаг для каждой из трёх разрешаций (10 м, 20 м, 60 м). В итоге общее число токенов равно H/p × W/p × T × 3, а вычислительные затраты (MACs) растут примерно квадратично от длины последовательности, поэтому сокращение числа токенов даёт заметную экономию ресурсов.
В релизе подчёркивается, что OlmoEarth v1.1 уменьшает вычислительные затраты до 3× по сравнению с OlmoEarth v1 (выпущенной в ноябре 2025) при сохранении производительности на ряде исследовательских бенчмарков и задач, подготовленных партнёрами. Ранее OlmoEarth применяли для отслеживания изменений мангровых зарослей, классификации причин утрат лесов и картирования посевов на уровне страны; более дешёвая версия расширяет оперативные возможности таких проектов.
Авторы сопоставляют подходы к токенизации в других моделях: Galileo и SatMAE используют отдельный токен для каждой группы разрешений, что помогает моделировать межканальные связи и, по данным SatMAE, повышает качество. Метод CROMA применяет один токен для всех каналов, давая примерно в 3 раза меньше токенов и экономию на предобучении, дообучении и инференсе, но при этом рискуя потерей точности без дополнительных изменений. Команда отмечает, что простое свёртывание разрешений в один токен приводит к значительному падению качества — в том числе примерно на 10 процентных пунктов по m‑eurosat kNN.
Чтобы успешно объединять токены без резкого ухудшения качества, разработчики модифицировали режим предобучения — детали и эксперименты приведены в техническом отчёте. Для инженеров и исследователей релиз включает модели, конфигурации предобучения и репозиторий с кодом, необходимые для массовых или распределённых развёртываний: экономия MACs напрямую снижает стоимость этапов экспорта, предобработки, инференса и пост‑обработки спутниковых данных.
Источники
Ответы (0)
Пока нет ответов в этой теме.