Anthropic представила Claude Opus 4.8 (релиз 29 мая 2026). Обновление сохраняет цены Opus 4.7 ($5/1M входных токенов, $25/1M выходных), добавляет «honesty upgrade» для маркировки неопределённости и снижает цену Fast Mode при 2.
Anthropic выпустила Claude Opus 4.8 29 мая 2026 года — обновление, которое компания позиционирует как шаг от чисто «сырых» производительных показателей к повышенной надёжности и предсказуемости в продакшне. Релиз заявлен как эволюция Opus 4.7 по задачам кодирования, рассуждения и agentic‑взаимодействий; это важно для команд, которые хотят масштабировать автономные рабочие процессы без резкого роста расходов и риска ошибок.

Функционально релиз концентрируется на двух направлениях. Первое — «honesty upgrade»: модель специально обучена отмечать область неопределённости и избегать уверенных галлюцинаций. Это изменение нацелено на снижение риска дорогостоящих ошибок при использовании модели в продакшн‑задачах, где ложная уверенность может привести к неправильным решением или расходам. Второе направление — инструменты для агентных рабочих процессов. В Opus 4.8 представлено Dynamic Workflows for Claude Code, которое позволяет автономно планировать и координировать сотни параллельных суб‑агентов в одной сессии. В релизе приводят пример автоматизированных миграций кода «с начала до слияния» для баз кода объёмом в сотни тысяч строк с проверкой результатов существующим тест‑сейтом — демонстрация сценария, где масштабная оркестрация и встроенная валидация могут заменить ручные шаги.
Одновременно в продукт добавлена шкала Effort Control. Нижние настройки сокращают время отклика и помогают удерживать лимиты использования; верхние установки увеличивают глубину рассуждения и способность к самоисправлению, но стоят дороже по потреблению токенов. Для разработчиков это даёт инструмент тонкой настройки компромисса между латентностью и качеством вывода. Несмотря на обещания, в материале подчёркивают необходимость практической проверки: маркетинговые заявления о честности и масштабируемости требуют hands‑on тестирования на собственных кодовых базах и длинных сценариях, чтобы подтвердить поведение модели в конкретных рабочих нагрузках.
Источники
Ответы (0)
Пока нет ответов в этой теме.