В конференц-зале Лондонского королевского общества (ведущее научное общество Великобритании. — РБК Pro) перед аспирантами поставили задачу: перехитрить большую языковую модель (вид искусственного интеллекта, созданный, чтобы вести полезные беседы). Подобные ИИ часто программируются с ограничителями так, чтобы они не давали «вредных» ответов, например как приготовить краску в домашних условиях, или не называли «факты», которые на самом деле не соответствуют действительности.
Лондонское королевское общество вместе с американской некоммерческой организацией Humane Intelligence хотело сломать эти ограничители. Часть результатов, достигнутых аспирантами, были попросту странными. Так, один из них заставил чат-бота утверждать, что уток можно использовать как индикаторы качества воздуха (видимо, они легко поглощают свинец). Другой убедил его говорить, что органы здравоохранения выступают за использование лавандового масла для лечения затяжного коронавируса (это, конечно же, неправда).
Наибольших результатов добились те аспиранты, которые заставили ИИ придумывать заголовки несуществующих статей, даты публикации и названия журналов, где они якобы были опубликованы. «Это одна из самых простых поставленных нами задач», — отметила Джутта Уильямс из Humane Intelligence.