
IBM‑команда Granite 14 мая 2026 представила R2‑релиз Granite Embedding Multilingual R2: два открытых эмбеддинга под лицензией Apache 2.0 — компактный 97M и полный 311M-построенные на архитектуре ModernBERT. Модели выпускаются как granite — embedding-97m-multilingual-r2 (97 млн параметров, 384‑мерные эмбеддинги) и granite — embedding-311m-multilingual-r2 (311 млн параметров, 768‑мерные эмбеддинги с поддержкой Matryoshka‑измерений) и обрабатывают до 32 768 токенов контекста (32K); добавлена поддержка поиска по коду, а для CPU‑оптимизированного вывода доступны веса в форматах ONNX и OpenVINO.
По бенчмарку MTEB Multilingual Retrieval компактная 97M‑модель достигает 60.3 и, по утверждению команды Granite, превосходит все открытые мультиязычные эмбеддеры с числом параметров ниже 100M. Полная 311M‑модель показывает 65.2 и занимает второе место среди открытых моделей с параметрами до 500M. Релиз R2 также расширяет длину контекста в 64 раза по сравнению с R1. Интеграция ориентирована на разработчиков: модели работают «из коробки» со стеками sentence — transformers и transformers, не требуют дополнительной инструкции под задачу и совместимы как замена в LangChain, LlamaIndex, Haystack и Milvus — достаточно указать имя модели. Для фреймворков с английским по‑умолчанию это даёт поддержку более 200 языков без изменения API или добавления зависимостей.
По части обучения энкодер предобучен на текстах более чем на 200 языках; для улучшения качества поиска модели дообучали на парах и кросс‑лингвальных примерах для 52 языков, включая русский, китайский, арабский, испанский и хинди. Дополнительно модели дообучены на коде для кросс‑лингвального поиска по девяти языкам: Python, Go, Java, JavaScript, PHP, Ruby, SQL, C и C++. Данные для тренировки включают IBM‑курированные наборы, публичные датасеты и внутренние/синтетические данные.
Практическое значение релиза простое: 97M‑вариант предлагает лучшее соотношение размера и качества для приложений с ограничениями по памяти и задержке, тогда как 311M‑вариант обеспечивает более высокую точность поиска и гибкость измерений через Matryoshka для проектов, где важна полнота и детализация. Наличие CPU‑весов и возможности подмены моделей одной строкой упрощают быстрый переход на R2 и расширение мультиязычной и кодовой поддержки в существующих продуктах.
Источники
Ответы (0)
Пока нет ответов в этой теме.