Aivizor
Aivizor
СкиныКреативыСообщество
Назад
  1. Сообщество
  2. /
  3. Anthropic

Анатомия деградации: как три независимых обновления временно снизили качество работы Claude Code

Разбор

Подробный разбор технического отчета Anthropic о причинах временного ухудшения качества ответов ИИ-агентов.

А
Анна Соколова
Редактор новостной ленты

4/24/2026, 3:04:50 AM

Анатомия деградации: как три независимых обновления временно снизили качество работы Claude Code

В период с начала марта по середину апреля пользователи профессиональных экосистемных инструментов от компании Anthropic, включая такие платформы как Claude Code, Claude Agent SDK и систему совместной работы Claude Cowork, столкнулись с весьма заметным и системным снижением качества работы искусственного интеллекта. Специалисты инженерного подразделения компании провели масштабное расследование инцидентов и достоверно установили, что базовый программный интерфейс приложения (API) и слой логического вывода (inference layer) на самом деле функционировали без каких-либо сбоев. Истинной причиной деградации стали три независимых обновления продуктового уровня, которые случайно наложились друг на друга по времени.

Первая и наиболее масштабная проблема возникла 4 марта и была напрямую связана с попыткой разработчиков найти баланс между глубиной пошаговых рассуждений модели и скоростью отклика пользовательского интерфейса. Сразу после февральского релиза нейросети Opus 4.6 в среде Claude Code, инженеры установили для параметра усилий по рассуждению (reasoning effort) высокое значение по умолчанию. Вскоре профессиональные пользователи начали массово сообщать, что при решении сложных задач интерфейс казался полностью зависшим из-за крайне долгого времени ожидания ответа, что также приводило к непропорционально высокому потреблению токенов. Чтобы снизить задержки, настройку по умолчанию переключили на средний уровень.

Вторая техническая неполадка проявилась 26 марта при неудачном внедрении новой оптимизации системы кэширования промптов. Данный алгоритмический механизм разрабатывался специально для того, чтобы радикально снизить стоимость возобновления работы в сессиях, которые простаивали без активности более одного часа. Изначально планировалось, что система будет однократно удалять устаревшие цепочки промежуточных рассуждений, тем самым уменьшая количество дорогих некэшированных токенов, отправляемых в API. Однако из-за критической ошибки в коде, известной по внутренним отчетам как баг очистки контекста clear_thinking_20251015, стирание внутренней памяти происходило не один раз после перерыва, а на каждом последующем шаге диалога.

Третий фактор, негативно повлиявший на общее качество продукта, был введен в эксплуатацию 16 апреля, когда разработчики добавили новые жесткие инструкции в системный промпт с целью принудительного уменьшения излишней многословности ответов искусственного интеллекта. Эта конкретная корректировка, работая в тесной связке с другими скрытыми изменениями текстовых запросов, привела к совершенно неожиданному побочному эффекту — существенному ухудшению качества генерации программного кода. Данная проблема затронула самую широкую линейку актуальных моделей Anthropic, включая Sonnet 4.6, Opus 4.6 и Opus 4.7. В отличие от двух предыдущих неполадок, неудачное обновление системных инструкций было оперативно отменено уже через четыре дня, 20 апреля.

Главная сложность в своевременном обнаружении всей этой цепочки проблем заключалась в том, что изменения влияли на различные, не пересекающиеся сегменты пользовательского трафика и внедрялись по абсолютно независимым временным графикам. В результате их совокупный эффект выглядел как широкая, но крайне непоследовательная деградация сервиса. Ситуация серьезно осложнялась тем фактом, что первоначально внутренние инструменты оценки качества (evals) и метрики использования Anthropic не могли воспроизвести те специфические ошибки, о которых сообщали клиенты.

Этот многоуровневый инцидент наглядно демонстрирует фундаментальную сложность современной разработки ИИ: балансирование между вычислительными затратами на этапе генерации (test-time compute) и отзывчивостью продукта. Современные нейросети способны решать невероятно сложные задачи, но длительное время рассуждения вступает в прямой конфликт с ожиданиями пользователей относительно мгновенной реакции графического интерфейса и экономией лимитов. Признавая, что предоставленный опыт категорически не соответствовал заявленным стандартам профессиональных инструментов, 23 апреля компания Anthropic в качестве компенсации за технические неудобства произвела полное обнуление лимитов использования для всех своих подписчиков.

Источники

  1. Anthropic Engineering
1
0
0

Ответы (0)

Пока нет ответов в этой теме.

9:41