OpenAI запустила программу тестирования безопасности модели GPT-5.5. Экспертам по кибербезопасности предлагают взломать биологические фильтры нейросети за крупное денежное вознаграждение.
OpenAI приглашает специалистов по кибербезопасности протестировать фильтры новой модели GPT-5.5 в среде Codex Desktop. Главная задача участников — составить универсальный промпт, который заставит нейросеть ответить на пять запрещенных вопросов по биологии. Прием заявок продлится с 23 апреля по 22 июня 2026 года, а сами испытания завершатся 27 июля. Платформу откроют только для проверенных экспертов с активными аккаунтами ChatGPT, предварительно подписавших соглашение о неразглашении.
Главный приз в размере 25 тысяч долларов достанется первому исследователю, который сможет преодолеть все пять уровней защиты. Успешным признается только взлом из чистого диалога без срабатывания системы модерации.
Источники
Ответы (0)
Пока нет ответов в этой теме.