Материал раздела Технологии

Скажи «poop»: какой путь прошло человечество, чтобы получить ChatGPT

Языковые модели прошли четыре стадии эволюции: статистические (SLM), нейронные (NLM), предварительно обученные (PLM) и большие (LLM). Все это время компьютеры учились мыслить как люди. Что получилось и что нас ждет дальше, — рассказывает журнал IT-Expert
Фото: Midjourney
Фото: Midjourney

Отличие мышления человека от машины

В 1950 году в философском журнале ‘Mind’ была опубликована статья под названием «Вычислительные машины и разум». Ее автор, британский криптограф Алан Тьюринг, предложил научной общественности эмпирический тест. Он придумал метод, который, по его мнению, должен определить, способен ли компьютер мыслить как человек. Точнее, можно ли, не видя собеседника, уверенно сказать, кто за ширмой — человек или компьютер?

Испытуемым в подобном тесте должен выступать человек. Он получает ответы в письменной форме, но не знает, кто именно написал ему текущее сообщение. Сможет ли он назвать, опираясь на полученный ответ, с кем он разговаривает в текущий момент? У него есть право на ошибку. Но если он будет ошибаться слишком часто, то сторонний рефери вынесет вердикт, что испытуемый не смог отличить машину от человека.

Прошло почти 70 лет, как появился другой, упрощенный вариант теста Тьюринга. Он был обнародован в 2018 году исследователем Джоном Маккоем в соавторстве с другими учеными из Массачусетского технологического института. Новый тест получил название ‘Minimal Turing Test’, проводился в два этапа и отличался максимально упрощенными правилами. Сначала участникам опроса (в нем приняли участие 1089 человек) предстояло назвать несколько слов, которые, с их точки зрения, могли безошибочно указывать на то, что они были произнесены человеком.

В результате получился довольно разношерстный список, а тoп-10 самых популярных ответов на них выглядел так: «любовь» (12,3%), «сострадание» (3%), «человеческий» (2,8%), «пожалуйста» (2,3%), «милосердие» (1,7%), «сопереживание» (1,6%), «эмоция» (1,3%), «робот» (1,2%), «человечество» (1,0%), «живой» (0,8%).

Второй этап был противоположен первому: из слов, отобранных на первом этапе, были составлены двухсложные конструкции (прилагательное + существительное), а опрошенные, зная, что часть вариантов составлена компьютером, должны были снова выбрать самые «человеческие» варианты.

Казалось бы, что слово «любовь» должно победить снова. Но опрошенные посчитали иначе: «самым человеческим» на этот раз стало слово «poop» (экскременты человека). Как? Почему?