
Cohere 21 мая 2026 года опубликовала исходники модели Command A+ и выложила её веса на платформе Hugging Face под лицензией Apache 2.0; релиз включает варианты в нескольких квантованиях. Публичный доступ к весам и коду упрощает интеграцию и доработку модели для компаний и разработчиков, заинтересованных в корпоративных рабочих процессах. Command A+ предназначена для работы с текстом и изображениями и построена по принципу mixture‑of‑experts. Общий объём параметров модели составляет 218 млрд, из которых в активности задействованы 25 млрд, что позволяет сочетать большую модельную ёмкость с экономией вычислений на запросы.
По данным компании, модель поддерживает 48 языков и может оперировать контекстом до 128000 токенов, что расширяет её применение в сценариях, требующих долгого контекстного окна и многоязычной обработки. В релизе также отмечено, что модель рассчитана на корпоративные рабочие процессы и интеграцию в существующие пайплайны. Для развертывания Cohere указывает требования к аппаратной части: модель может работать на двух GPU NVIDIA H100 или на одном GPU Blackwell. Наличие нескольких квантованных версий весов даёт возможность выбирать компромисс между точностью и затратами на вычисления.
По сравнению с предшественником Command A Reasoning компания приводит заметный рост показателей на ряде тестов: τ² — Bench Telecom улучшился с 37% до 85%, а в категории Terminal — Bench Hard результат вырос с 3% до 25%. Эти изменения демонстрируют существенный прирост качества в задачах, которые отражают телекоммуникационные и тяжёлые тестовые сценарии.
Источники
Ответы (0)
Пока нет ответов в этой теме.