
Baidu анонсировала Ernie 5.1 — извлечённую из одного прохода субмодель с примерно третью параметров от Ernie 5.
Baidu представила Ernie 5.1 — компактную конфигурацию своей крупной модели Ernie 5.0, извлечённую в рамках единого тренировочного прохода; по данным компании, предтренировка Ernie 5.1 потребовала лишь 6% от типичных затрат, что эквивалентно сокращению примерно на 94% по сравнению с отдельной предтренировкой сопоставимых моделей. Модель имеет порядка трети параметров предшественника и примерно половину активных параметров на запрос в выбранной конфигурации, что, по замыслу разработчиков, делает её более дешёвой и быстрой в развёртывании для продуктивных задач.
Обучение Ernie 5.1 велось с использованием Once‑For‑All elastic training framework, который одновременно варьирует глубину сети, число экспертных блоков и количество активных экспертов под конкретный запрос. После этого площадка провела четырёхэтапную тонкую настройку с экспертами по коду, логике и агентным задачам, чтобы уменьшить взаимное вмешательство навыков при специализированных сценариях применения.
В сравнительных тестах Baidu приводит конкретные показатели: на Search Arena Ernie 5.1 набрала 1 223 очка и заняла 4‑е место в мире по состоянию на 9 мая, уступая двум вариациям Claude Opus и GPT‑5.5 Search, но оставаясь лидером среди китайских моделей. На Text Arena предварительная версия показала 1 476 очков и 13‑е место. Компания также заявляет о победах над DeepSeek V4‑Pro в агентных задачах (tau3‑bench, SpreadsheetBench — Verified) и о результатах, близких к Gemini 3.1 Pro по GPQA и MMLU‑Pro.
Baidu подчёркивает практическое значение единого тренировочного прохода: поскольку семейство моделей обучалось совместно, извлечение уменьшенной конфигурации исключает необходимость дорогостоящей отдельной предтренировки. Для разработчиков это потенциально означает более дешёвую и быструю интеграцию продуктивных вариантов модели, однако независимая проверка заявленных показателей затруднена из‑за того, что модельные веса не опубликованы. Помимо методики обучения, компания пересмотрела инфраструктуру обучения с подкреплением: компоненты обновления модели, генерации ответов и оценки вынесены в независимые подсистемы и управляются центральным контроллером, что позволяет масштабировать их по отдельности и подбирать оптимальное аппаратное обеспечение. Чтобы смягчить дрейф между тренировкой и генерацией, Baidu ввела стандартизованную библиотеку арифметики низкой точности и коррекционный механизм для mixture‑of‑experts; по словам компании, это сокращает дрейф вдвое без заметного замедления.
Ernie 5.1 уже интегрирована в продукты и творческие приложения Baidu и доступна через платформенные интерфейсы компании, но модельные веса остаются закрытыми, что ограничивает внешний аудит. Внутренние оценки компании по AIME26 (с доступом к инструментам), SpreadsheetBench и tau3‑bench показывают, что модель близка к ведущим западным коммерческим системам в творческих и агентных сценариях, хотя в ряде категорий она всё ещё уступает лидерам.
Источники
Ответы (0)
Пока нет ответов в этой теме.