OpenAI ужесточает меры безопасности ChatGPT для предотвращения насилия

Новость

Редактор новостной ленты

4/29/2026, 6:42:09 AM

OpenAI ужесточает меры безопасности ChatGPT для предотвращения насилия

Компания OpenAI объявила об усилении мер безопасности в своей платформе ChatGPT. Эти нововведения призваны предотвратить использование ИИ-инструмента для планирования, обсуждения или поощрения насильственных действий, способных причинить вред в реальном мире. Данный шаг OpenAI предпринят на фоне активно обсуждаемых в индустрии искусственного интеллекта вопросов баланса между инновациями и ответственностью, что имеет большое значение для формирования доверия пользователей к ИИ-платформам и определяет дальнейшее направление развития технологий.

Для разработки и внедрения этих новых протоколов OpenAI привлекла широкий круг экспертов: психологов, психиатров, специалистов по гражданским свободам и представителей правоохранительных органов. Их вклад имеет решающее значение для создания многогранного подхода к безопасности, учитывающего как этические, так и практические аспекты применения искусственного интеллекта. Эти специалисты помогают компании ориентироваться в сложных решениях, связанных с безопасностью, конфиденциальностью и доступом к технологиям ИИ.

В основе подхода OpenAI лежит принцип, изложенный в спецификации модели: максимизация полезности и свободы пользователей при минимизации риска вреда через разумные настройки. Модели ChatGPT обучены отказывать в запросах на получение инструкций, тактик или планов, способствующих насилию. При этом платформа поддерживает обсуждения, когда пользователи задают нейтральные вопросы о насилии с фактическими, историческими, образовательными или превентивными целями. В таких случаях допускаются дискуссии, но с четкими границами безопасности, например, путем исключения подробных оперативных инструкций, способных облегчить нанесение вреда.

Разделение между безобидным и вредоносным использованием может быть тонким, что требует постоянного совершенствования подхода. Компания работает с экспертами, чтобы помочь различить безопасные, ограниченные ответы и конкретные шаги, направленные на осуществление реального вреда. В рамках этой непрерывной работы OpenAI расширяет свои меры предосторожности, чтобы ChatGPT мог лучше распознавать тонкие признаки риска причинения вреда в различных контекстах. Это включает в себя понимание того, что риски безопасности проявляются со временем: одно сообщение само по себе может показаться безобидным, но более широкая закономерность в длинной или нескольких беседах может указывать на нечто более тревожное.

Работа по обеспечению безопасности также распространяется на ситуации, когда пользователи могут находиться в состоянии дистресса или рискуют причинить себе вред. В такие моменты цель состоит не только в том, чтобы избежать содействия вредоносным действиям, но и помочь деэскалировать ситуацию, направив людей к реальной поддержке. ChatGPT предоставляет локализованные кризисные ресурсы, призывает обращаться к специалистам по психическому здоровью или доверенным близким, а в наиболее серьезных случаях направляет за экстренной помощью. Такой подход подчеркивает обязательство компании способствовать благополучию пользователей.

OpenAI предполагает добросовестность своих пользователей, но при обнаружении попыток использования инструментов для планирования или осуществления насилия, компания принимает меры, включая отзыв доступа к своим услугам. Политики использования четко устанавливают приемлемые рамки и запрещают использование сервисов для угроз, запугивания, преследования, терроризма или насилия, разработки оружия, незаконной деятельности, уничтожения имущества или систем, а также попыток обойти защитные меры. Для выявления потенциально опасной активности в больших масштабах используются автоматизированные системы обнаружения.

Когда учетная запись или разговор помечаются системой, они оцениваются обученным персоналом в контексте. Человеческие рецензенты, работающие в рамках строгих мер конфиденциальности и безопасности, обучены политике и протоколам компании. Их доступ к информации о пользователях ограничен, осуществляется в защищенных системах и подлежит требованиям конфиденциальности и защиты данных. Роль этих рецензентов заключается в оценке помеченной активности с учетом контекста взаимодействия, окружающего разговора и закономерностей поведения с течением времени. Такой детальный контекстный анализ критически важен, так как автоматизированные системы не всегда могут полностью уловить намерение или нюансы.

Источники

OpenAI News · 4/28/2026

Ответы (0)

Пока нет ответов в этой теме.