
Крупные ИИ‑лаборатории привлекают философов в команды ответственности и разработки, чтобы формулировать проблемы, метрики и тесты для моделей: от проверки моральной компетентности LLM до задач выравнивания ценностей и риска злоупотреблений.
DeepMind и Anthropic начали активно включать в свои команды профессиональных философов, чтобы прорабатывать этические крайние случаи и формулировать практические требования к моделям ИИ-от критериев безопасности до способов тестирования. По внешним подсчётам, в DeepMind работает минимум десять философов, а в Anthropic — как минимум четыре; компании не раскрывают точных чисел. в центральном лондонском офисе DeepMind площадью около 180 000 квадратных футов философы встроены в команду по ответственности. «Наверное, лучшее время для философа со времен наёма Аристотеля на должность учителя Александра Великого», — отмечает Хенри Эйдер, философ‑аспирант, советующий правительству Великобритании и стартапам по вопросам ИИ. Это напрямую влияет на то, как будут формулироваться требования и тесты для будущих версий моделей и агентов.
Роль философов смещается от абстрактных споров о сознании к прикладным задачам: выравнивание ценностей, справедливость, дезинформация, злоупотребления и неисправные агенты. Их работы уже цитируются в сотнях научных публикаций и влияют на конструкцию моделей, а университеты вводят совместные программы «компьютерные науки + философия» и курсы по этике ИИ, что, по словам Эдварда Харкурта, профессора философии и директора Института этики ИИ Оксфорда, увеличивает приток специалистов с нужными навыками. По словам Иасона Гэбриэла, появление больших языковых моделей в начале 2020‑х дало «возможность кодировать гораздо более богатый набор ценностей», а современные ИИ‑агенты уже выполняют практические задачи — отправляют письма, планируют встречи и пишут код, влияя на действия людей и организаций.
В академии и среди критиков такой тренд вызывает осторожность: оплачивание исследователей коммерческими компаниями может скомпрометировать независимость работы. Харкурт предупреждает о риске «самовосхваления», когда участие философов используется для улучшения репутации компаний, даже если это частично является элементом маркетинга. Тем не менее разработчики подчёркивают, что построение безопасных агентов требует не только технических мер, но и философского участия в формулировании проблем, выборе метрик и разработке тестов. Джулия Хаас из DeepMind, философ ума и соавтор статьи в Nature, работает над рамкой для проверки моральной компетентности LLM и подчёркивает потребность различать подлинную моральную компетентность и её имитацию.
Источники
Ответы (0)
Пока нет ответов в этой теме.