Материал раздела Основной

Что такое «корпуса» для нейросетей и почему они будут очень дорого стоить

Чтобы научить ChatGPT общаться, создатели «загрузили» в нейросеть тексты из социальных сетей, научных журналов и сайтов. Этот массив данных называют корпусом — и, возможно, скоро корпусы для ИИ будут стоить огромных денег. Вот что нужно об этом знать
Фото: Shutterstock
Фото: Shutterstock

Благодаря ChatGPT и другим похожим платформам в 2023 году все обсуждают искусственный интеллект. Ни дня не проходит без новых статей о том, как ИИ может спасти или уничтожить креативные сферы, рабочие места или человечество.

Во всех последних статьях используется слово «корпус». Генеральный директор Reddit Стив Хаффман, основатель Wikipedia Джимми Уэйлс, основатель Microsoft Билл Гейтс — все они упоминали его.

Рассказываем, что оно значит и почему так важно понимать, как работают платформы искусственного интеллекта — например, ChatGPT и Midjourney.

Что такое корпус в области ИИ

Изучавшие латынь знают, что корпус (лат. corpus) — это «тело». Английское слово «труп» также происходит от него — corpse. Другие могут помнить его по юридической практике, в которой до сих пор используется фраза «хабеас корпус» (лат. habeas corpus). Ее можно перевести как «ты должен иметь тело». Она означает, что каждый арестованный имеет право обратиться к суду, чтобы определить, было ли задержание законным.