11 декабря 2025 года представлена Rerank v4.0 — база для задач ранжирования с двумя вариантами ("rerank — v4.0 — pro" и "rerank — v4.0 — fast"), многоязычной поддержкой, возможностью работать с JSON и увеличенным контекстным окном до 32 000 токенов.
11 декабря 2025 года в релиз‑заметках объявлено о выходе Rerank v4.0 — новой фундаментальной модели для задач ранжирования документов. Модель ориентирована на использование в системах поиска и рекомендательных пайплайнах: ключевые изменения расширяют объём контекста и дают инженерам явный выбор между качеством ранжирования и эксплуатационными требованиями. Rerank v4.0 доступна в двух вариантах: "rerank — v4.0 — pro", оптимизированном для максимального качества при сложных сигналах сортировки, и "rerank — v4.0 — fast", ориентированном на низкую задержку и высокую пропускную способность. В релиз‑заметках прямо указана цель каждого варианта: один отдаёт приоритет точности, другой — скорости отклика, что упрощает подбор модели под конкретные рабочие нагрузки.
Технические улучшения включают многоязычную поддержку, возможность ранжирования как англоязычных, так и неанглоязычных документов, а также поддержку полуструктурированных данных: модель умеет работать с JSON‑документами. Существенным изменением стало расширение контекстного окна до 32 000 токенов — это важно для сценариев с длинными документами, сложными объединёнными источниками текста и смешанными форматами данных, где критична способность учитывать большой контекст при ранжировании.
Релиз‑заметки приводят пример интеграции на Python: создание клиента через cohere.ClientV2(), формирование запроса и списка документов, затем вызов co.rerank(model="rerank — v4.0 — pro", query=query, documents=docs, top_n=5). Пример подчёркивает явное указание параметра model и использование top_n для выбора верхних результатов. Опубликованные детали дают разработчикам оперативные ориентиры при выборе между вариантом для качества и вариантом для скорости, а также показывают, что модель можно встроить в существующие пайплайны, где данные хранятся или передаются в полуструктурированном виде.
Документация и релиз‑заметки служат руководством по интеграции и помогают принимать архитектурные решения при внедрении нового ранжера: от выбора варианта модели до учёта увеличенного контекстного окна и работы с JSON‑структурами в индексах и потоках данных. Эти изменения могут затронуть команды поиска, инженеров ML и продуктовые команды, которым важно управлять компромиссом между точностью ранжирования и требованиями производительности.
Источники
Ответы (0)
Пока нет ответов в этой теме.