Том Арсен выпустил семейство переранжеров Ettin — шесть CrossEncoder‑моделей (19 мая 2026)

Новость

Редактор новостной ленты

5/23/2026, 8:45:12 PM

Том Арсен выпустил семейство переранжеров Ettin — шесть CrossEncoder‑моделей (19 мая 2026)

19 мая 2026 года Том Арсен представил комплект из шести CrossEncoder‑переранжеров семейства Ettin вместе с набором данных, скриптами и полным рецептом обучения — релиз включает не только веса моделей, но и инструкции по встраиванию в production‑пайплайны. Это важно для инженерных команд: открытый комплект позволяет воспроизвести эксперименты и адаптировать reranker'ы под собственные домены, сохраняя баланс между задержкой и качеством ранжирования.

В выпуск вошли модели cross — encoder/ettin — reranker-17m-v1, cross — encoder/ettin — reranker-32m-v1, cross — encoder/ettin — reranker-68m-v1, cross — encoder/ettin — reranker-150m-v1, cross — encoder/ettin — reranker-400m-v1 и cross — encoder/ettin — reranker-1b-v1 — все как Sentence Transformers CrossEncoder, построенные на Ettin ModernBERT‑энкодерах. Авторы подчёркивают, что модели обучались по дистилляционной рецептуре: использовался pointwise MSE на скорингах mixedbread — ai/mxbai — rerank-large-v2 с метками из cross — encoder/ettin — reranker-v1-data.

Релиз даёт разъяснение по роли cross‑encoder‑reranker'ов: такой модельный класс принимает пару (запрос, документ) и выдаёт единичный релевантный скор, что позволяет текстам взаимодействовать на всех слоях трансформера. Это повышает точность по сравнению с точечными скорерами, но увеличивает вычислительную стоимость, поэтому авторы рекомендуют стандартную схему — быстрый CUT‑retrieval эмбеддерами с последующим переранжированием топ‑K кандидатур cross‑encoder'ом. В разделе Results опубликованы бенчмарки и сравнительные таблицы: при паре с google/embeddinggemma — 300m на наборе MTEB(eng, v2) модели показали state‑of‑the‑art результаты для своих размеров; в посте также приведены результаты для ещё пяти пар эмбеддеров. Отдельно включены агрегированные метрики, измерения скорости вывода и подробные сравнительные таблицы, полезные при выборе компромисса между задержкой и качеством.

Для разработчиков релиз содержит готовые примеры интеграции через Sentence Transformers: вызов CrossEncoder("cross — encoder/ettin — reranker-32m-v1").predict() обрабатывает список пар (query, document), a.rank() сортирует кандидатов и возвращает индексы и скоринги; в комплекте есть сниппеты и рекомендации по выбору top_k в retrieve‑then‑rerank пайплайне. Техническая часть описывает формирование датасета и пайплайн обучения: датасет собран как подмножество lightonai/embeddings‑pre-training, смешанное с переранженным подмножеством lightonai/embeddings‑fine‑tuning; рецепт был собран с помощью train — sentence-transformers Agent Skill из Sentence Transformers v5.5.0 (команда установки: hf skills add train — sentence-transformers [--global] [--claude]). Полные аргументы обучения, скрипты оценки и общий training script опубликованы вместе с моделями, что позволяет воспроизвести обучение или дообучить reranker'ы под свои данные.

Практическое значение релиза очевидно: набор моделей разных размеров даёт гибкий выбор компромисса между задержкой и качеством — маленькие Ettin‑модели подходят для дешёвого переранжирования при высоких QPS, а крупные — для задач с критичными требованиями к точности. Открытые веса, данные и рецепты упрощают воспроизводимость исследований и адаптацию моделей под кастомные домены.

Источники

Hugging Face Blog · 5/19/2026

Ответы (0)

Пока нет ответов в этой теме.