Вверх по лестнице: от искусственного интеллекта до GPT
Нейросети способны влиять на искусство и диагностировать болезни. А могут ли они прогнозировать результаты матчей, лишая работы спортивных аналитиков? Или, может, точно предсказывать курс валют? Не будем заставлять вас читать этот текст до конца, чтобы получить отрицательный ответ.
GPT-модель, с которой интернет-пользователи в основном имеют дело, нередко отождествляется с понятием нейросети вообще. Но нейросеть в смысле языковой модели GPT — это лишь верхушка айсберга искусственного интеллекта. А GPT — лишь одна из языковых моделей.
Искусственный интеллект и машинное обучение
Искусственный интеллект — это способность компьютера решать задачи, требующие человеческого мышления. Люди обучают машины имитировать собственное поведение, поэтому такой интеллект и называют искусственным: он создан наподобие подлинного. Как пластиковые цветы на свадьбе, обеспечивающие необходимый антураж, но лишённые запаха.
Машинное обучение (Machine Learning, ML) — область искусственного интеллекта, смысл которой заключается в том, чтобы обучить ИИ вести себя как человек и решать его задачи.
Существует несколько методов машинного обучения. Используя GPT, мы сталкиваемся с наиболее известным из них — нейросетями. Но перед тем как поговорить о нейронных сетях, разберёмся, какие ещё бывают методы ML.
Наряду с нейросетями выделяют следующие методы машинного обучения
Классическое обучение — его используют с середины прошлого века и по сей день. Основа этого метода заключается в поисках закономерностей. При этом есть два способа классического обучения:
-
Обучение с учителем — когда машине дают знания через примеры. Например, показывают, что слова «срочно» и «скидка» в электронном письме свидетельствуют о спаме, а значит, видеть его в папке «Входящие» пользователю не нужно.
-
Обучение без учителя — когда машина самостоятельно анализирует большой объём данных и находит закономерности. По этому принципу iPhone может собрать в одном альбоме фото одного и того же человека.
Обучение с подкреплением. Грубо говоря, подкреплением выступают ошибки обучаемого, например робота-пылесоса. Обучить домашнего помощника, велев избегать предметов на пути, недостаточно. Поэтому процесс обучения происходит в некой виртуальной среде, где моделируются всевозможные варианты препятствий.
Ансамбли. В культуре и искусстве ансамбль — это группа артистов. В контексте нашей темы это группа недостаточно эффективных методов обучения, которые учат исправлять ошибки друг друга. У ансамблей, в свою очередь, есть собственные методы, один из которых называется «беггинг». Пример его использования — распознавание лиц в режиме реального времени при фотографировании.
Вы наверняка замечали: если в социальной сети появляются новые фотографии с вами в каких-нибудь группах или у друзей, вам приходит соответствующее уведомление. Это всё работа нейросетей совместно с технологиями компьютерного зрения, в которых работают ансамбли.
Нейросети
Нейросеть — это один из методов машинного обучения, программа, обучающаяся на основе данных и примеров. GPT может самостоятельно написать текст на основе тысяч изученных текстовых материалов, а нейросети, работающие с изображениями, способны после изучения миллионов фотографий сгенерировать новую по текстовому запросу.
Принцип работы нейросетей основывается на трёх слоях:
-
входной, где нейронная сеть получает данные;
-
скрытый, где происходит обработка данных;
-
выходной, где нейросеть даёт ответ на запрос.
Если загрузить изображение собаки и спросить у нейросети, что на фото, она справится с этой задачей, назвав даже породу — по общим признакам. Это возможно благодаря ранее обработанному массиву данных и примеров.
Но если загрузить изображение человека и попросить назвать его имя, она этого не сделает.
Это говорит о том, что здесь нейросеть работает благодаря богатой базе примеров. Функции распознавания лиц у неё нет.
Нейросети можно разграничить в зависимости от конечного продукта, который вы получаете:
-
Изображения и видео. «Шедеврум» сгенерирует их по текстовому описанию.
-
Эмодзи. С такой задачей справится ruDALL-E Emojich.
-
Фото несуществующих людей. Для этого создана This Person Does Not Exist.
-
Логотипы. В их создании поможет LogoAI. Причём запрос формируется не самостоятельно, а через опросник.
-
Анимация. «Оживить» статичные изображения можно благодаря нейросети Runaway.
-
Музыка и звуки. Например, Stable Audio 2.0.
Это не все нейросети. Но уже становится понятно, что они создают почти любой контент.
Большие языковые модели, LLM
Большая языковая модель (Large Languages Models, LLM) — это тип нейросетей, обучающихся на основе модели глубокого обучения, которая понимает и генерирует текст на человеческом языке. Модели учатся на больших объёмах текстовых данных, благодаря чему способны выполнять задачи по созданию текстов, их переводу, а также отвечать на запросы пользователей и поддерживать с ними диалог (подробно об обучении LLM мы писали ранее).
Кроме прочего LLM можно использовать в качестве продвинутого поисковика, для генерации кода и осуществления аналитической работы.
GPT-технологии
GPT (Generative Pre-trained Transformer) — это лишь одна из языковых моделей, основанная на технологии нейронных сетей и используемая для генерации текста. Её можно сравнить с огромной библиотекой, в которой хранятся накопленные человечеством знания. Соответственно, использовать эту библиотеку для получения знаний, которых в ней нет, мы не можем.
Языковая модель GPT обучается на большом количестве текстовых материалов, анализируя и запоминая не только слова, но и контекст вместе с правилами построения предложений. Благодаря этому она способна самостоятельно составлять полноценные тексты.
С помощью GPT создают планы питания для похудения на ближайшую неделю, получают список тем для новых статей и придумывают для них привлекательные заголовки, а также подбирают релевантные источники информации для выпускных квалификационных работ (дипломов) в университетах. Использование GPT позволяет сэкономить время на тех процессах, что выполняются посредством анализа внушительных объёмов текстовых данных людьми самостоятельно.
Возвращаясь к вопросу о создании спортивных прогнозов: GPT это по силам. Но прогнозы будут основаны на текстах из интернета, которые к тому же могут содержать ошибки. То есть верными их назвать нельзя.
Например, в одном из туров общего этапа Лиги чемпионов состоялся матч «Ливерпуль» — «Байер». Вот часть ответа GPT на промт по написанию прогноза на матч.
На момент написания этой статьи Юрген Клопп уже полгода как не главный тренер мерсисайдцев. Если GPT ошибается в настолько известных футбольным болельщикам вещах, то неточности могут быть и в остальных аспектах анализа матчей. Так что нейросеть — это не спортивный альманах 2025–2050. А «Ливерпуль», к слову, выиграл 4:0, тогда как GPT спрогнозировал счёт 2:1.
GPT — это машина, которая читает много текстов, чтобы уметь писать (генерировать) много текстов.
Таким образом, в структуре искусственного интеллекта GPT — лишь его небольшая часть. Если представить, что ИИ — это пятиэтажный жилой дом, то GPT — квартира друзей, к которым вы приехали в гости. При этом на пути к ней нужно преодолеть подъезд (машинное обучение), несколько этажей (нейронные сети) и несколько других квартир на этаже (большие языковые модели), чтобы найти нужную.