Вверх по лестнице: от искусственного интеллекта до GPT

Искусственный интеллект не ограничивается чат-ботами. Рассказываем о машинном обучении и его методах, о нейросетях и их видах, а также о том, что такое большие языковые модели, и об их самом популярном представителе — GPT

Нейросети способны влиять на искусство и диагностировать болезни. А могут ли они прогнозировать результаты матчей, лишая работы спортивных аналитиков? Или, может, точно предсказывать курс валют? Не будем заставлять вас читать этот текст до конца, чтобы получить отрицательный ответ.

GPT-модель, с которой интернет-пользователи в основном имеют дело, нередко отождествляется с понятием нейросети вообще. Но нейросеть в смысле языковой модели GPT — это лишь верхушка айсберга искусственного интеллекта. А GPT — лишь одна из языковых моделей.

Artboard 1 copy 50.webp

Искусственный интеллект и машинное обучение

Искусственный интеллект — это способность компьютера решать задачи, требующие человеческого мышления. Люди обучают машины имитировать собственное поведение, поэтому такой интеллект и называют искусственным: он создан наподобие подлинного. Как пластиковые цветы на свадьбе, обеспечивающие необходимый антураж, но лишённые запаха.

Машинное обучение (Machine Learning, ML) — область искусственного интеллекта, смысл которой заключается в том, чтобы обучить ИИ вести себя как человек и решать его задачи.

Существует несколько методов машинного обучения. Используя GPT, мы сталкиваемся с наиболее известным из них — нейросетями. Но перед тем как поговорить о нейронных сетях, разберёмся, какие ещё бывают методы ML.

Наряду с нейросетями выделяют следующие методы машинного обучения

Классическое обучение — его используют с середины прошлого века и по сей день. Основа этого метода заключается в поисках закономерностей. При этом есть два способа классического обучения:

  • Обучение с учителем — когда машине дают знания через примеры. Например, показывают, что слова «срочно» и «скидка» в электронном письме свидетельствуют о спаме, а значит, видеть его в папке «Входящие» пользователю не нужно.

  • Обучение без учителя — когда машина самостоятельно анализирует большой объём данных и находит закономерности. По этому принципу iPhone может собрать в одном альбоме фото одного и того же человека.

Обучение с подкреплением. Грубо говоря, подкреплением выступают ошибки обучаемого, например робота-пылесоса. Обучить домашнего помощника, велев избегать предметов на пути, недостаточно. Поэтому процесс обучения происходит в некой виртуальной среде, где моделируются всевозможные варианты препятствий.

Ансамбли. В культуре и искусстве ансамбль — это группа артистов. В контексте нашей темы это группа недостаточно эффективных методов обучения, которые учат исправлять ошибки друг друга. У ансамблей, в свою очередь, есть собственные методы, один из которых называется «беггинг». Пример его использования — распознавание лиц в режиме реального времени при фотографировании.

Вы наверняка замечали: если в социальной сети появляются новые фотографии с вами в каких-нибудь группах или у друзей, вам приходит соответствующее уведомление. Это всё работа нейросетей совместно с технологиями компьютерного зрения, в которых работают ансамбли.

Нейросети

Нейросеть — это один из методов машинного обучения, программа, обучающаяся на основе данных и примеров. GPT может самостоятельно написать текст на основе тысяч изученных текстовых материалов, а нейросети, работающие с изображениями, способны после изучения миллионов фотографий сгенерировать новую по текстовому запросу.

Принцип работы нейросетей основывается на трёх слоях:

  • входной, где нейронная сеть получает данные;

  • скрытый, где происходит обработка данных;

  • выходной, где нейросеть даёт ответ на запрос.

Если загрузить изображение собаки и спросить у нейросети, что на фото, она справится с этой задачей, назвав даже породу — по общим признакам. Это возможно благодаря ранее обработанному массиву данных и примеров.

Artboard 1 copy 40.webp

Но если загрузить изображение человека и попросить назвать его имя, она этого не сделает.

Artboard 1 copy 60.webp

Это говорит о том, что здесь нейросеть работает благодаря богатой базе примеров. Функции распознавания лиц у неё нет.

Нейросети можно разграничить в зависимости от конечного продукта, который вы получаете:

  • Изображения и видео. «Шедеврум» сгенерирует их по текстовому описанию.

  • Эмодзи. С такой задачей справится ruDALL-E Emojich.

  • Фото несуществующих людей. Для этого создана This Person Does Not Exist.

  • Логотипы. В их создании поможет LogoAI. Причём запрос формируется не самостоятельно, а через опросник.

  • Анимация. «Оживить» статичные изображения можно благодаря нейросети Runaway.

  • Музыка и звуки. Например, Stable Audio 2.0.

Это не все нейросети. Но уже становится понятно, что они создают почти любой контент.

Большие языковые модели, LLM

Большая языковая модель (Large Languages Models, LLM) — это тип нейросетей, обучающихся на основе модели глубокого обучения, которая понимает и генерирует текст на человеческом языке. Модели учатся на больших объёмах текстовых данных, благодаря чему способны выполнять задачи по созданию текстов, их переводу, а также отвечать на запросы пользователей и поддерживать с ними диалог (подробно об обучении LLM мы писали ранее).

Кроме прочего LLM можно использовать в качестве продвинутого поисковика, для генерации кода и осуществления аналитической работы.

GPT-технологии

GPT (Generative Pre-trained Transformer) — это лишь одна из языковых моделей, основанная на технологии нейронных сетей и используемая для генерации текста. Её можно сравнить с огромной библиотекой, в которой хранятся накопленные человечеством знания. Соответственно, использовать эту библиотеку для получения знаний, которых в ней нет, мы не можем.

Языковая модель GPT обучается на большом количестве текстовых материалов, анализируя и запоминая не только слова, но и контекст вместе с правилами построения предложений. Благодаря этому она способна самостоятельно составлять полноценные тексты.

С помощью GPT создают планы питания для похудения на ближайшую неделю, получают список тем для новых статей и придумывают для них привлекательные заголовки, а также подбирают релевантные источники информации для выпускных квалификационных работ (дипломов) в университетах. Использование GPT позволяет сэкономить время на тех процессах, что выполняются посредством анализа внушительных объёмов текстовых данных людьми самостоятельно.

Возвращаясь к вопросу о создании спортивных прогнозов: GPT это по силам. Но прогнозы будут основаны на текстах из интернета, которые к тому же могут содержать ошибки. То есть верными их назвать нельзя.

Например, в одном из туров общего этапа Лиги чемпионов состоялся матч «Ливерпуль» — «Байер». Вот часть ответа GPT на промт по написанию прогноза на матч.

Artboard 1 copy 30.webp

На момент написания этой статьи Юрген Клопп уже полгода как не главный тренер мерсисайдцев. Если GPT ошибается в настолько известных футбольным болельщикам вещах, то неточности могут быть и в остальных аспектах анализа матчей. Так что нейросеть — это не спортивный альманах 2025–2050. А «Ливерпуль», к слову, выиграл 4:0, тогда как GPT спрогнозировал счёт 2:1.

GPT — это машина, которая читает много текстов, чтобы уметь писать (генерировать) много текстов.

Таким образом, в структуре искусственного интеллекта GPT — лишь его небольшая часть. Если представить, что ИИ — это пятиэтажный жилой дом, то GPT — квартира друзей, к которым вы приехали в гости. При этом на пути к ней нужно преодолеть подъезд (машинное обучение), несколько этажей (нейронные сети) и несколько других квартир на этаже (большие языковые модели), чтобы найти нужную.