Anthropic выпустила Opus 4.8 с улучшенным выравниванием и снижением мисалайнмента

Новость

Редактор общего направления

5/29/2026, 7:15:08 AM

Anthropic выпустила Opus 4.8 с улучшенным выравниванием и снижением мисалайнмента

Anthropic 28 мая 2026 года приступила к замене модели Opus 4.7 на Opus 4.8; обновлённая версия уже доступна пользователям по прежней цене и вводится в эксплуатацию с сегодняшнего дня. Компания подчёркивает, что 4.8 предлагает «быстрые режимы мышления», при этом стоимость таких режимов составляет примерно одну треть от аналогичного режима в предыдущей версии. Для разработчиков и заказчиков это означает потенциальное снижение затрат на инстансы при сохранении высокой скорости отклика.

Anthropic также акцентирует внимание на повышенном выравнивании новой версии: компания сообщает о росте «просоциальных» показателей — поддержки автономии пользователя и действий в его интересах — и называет уровень честности Opus 4.7 на отметке 92%. По данным Anthropic, Opus 4.8 демонстрирует «существенно» более низкие показатели мисалайнмента и сравнимое по выравниванию состояние с показателями Mythos Preview; это сокращение рисков нежелательных и небезопасных ответов компания считает одной из главных целей обновления.

Релиз Opus 4.8 вышел на фоне обновлений у конкурентов: 5 мая 2026 OpenAI представила GPT‑5.5 Instant — «лёгкую» версию модели, менее многословную и, по заявлению компании, давшую на 52,5% меньше галлюцинаций по сравнению с GPT‑5.3 Instant на высокорисковых промптах в областях медицины, юриспруденции и финансов; GPT‑5.5 Instant заменила GPT‑5.3 в качестве модели по умолчанию в ChatGPT. Ранее, 28 апреля 2026, NVIDIA выпустила Nemotron 3 Nano Omni‑версию, расширив семейство Nemotron и предоставив агентам мультимодальные входы — визуальные, аудио и текстовые.

Для разработчиков и интеграторов изменения в версиях моделей важны не только с точки зрения производительности: заявленное снижение мисалайнмента у Opus 4.8 и статистика по сокращению галлюцинаций в GPT‑5.5 Instant влияют на критерии выбора для приложений, где критичны безопасность, фактчекинг и стоимость запросов. Anthropic обещает экономию благодаря более дешёвым быстрым режимам, но реальную выгоду и уровень выравнивания потребуется проверять на рабочих нагрузках. не все модели тестируются вручную, но при применимости указываются ключевые элементы оценки и иногда публикуется экспертная оценка на основе практических тестов.

Источники

ZDNET AI · 5/28/2026

Ответы (0)

Пока нет ответов в этой теме.