Как работает ИИ для улучшения ИИ

В мире ИИ появилась новая «звёздочка» — AlphaEvolve от Google DeepMind. Она создаёт сложные алгоритмы и за минуты находит самое эффективное решение из тысячи вариантов. Это может кратно ускорить научные открытия. Рассказываем, как устроена система и где она уже применяется

алгоритмы
скайнет
математика
оптимизация
cover.webp

Как это работает

Большинство языковых моделей (LLM) пишут отдельные фрагменты кода. AlphaEvolve, в отличие от них, не просто генерирует варианты, а может оценивать их, комбинировать и развивать, чтобы создавать уникальные работающие алгоритмы. Для этого система использует разные инструменты: генетическое программирование, интеграцию с языковыми моделями, автоматизированную систему оценки решений и хранилище данных.

  1. Генетическое программирование.
    Система использует в программировании метод, который повторяет работу естественного отбора: скрещивания, мутации и выживание сильнейших. Представьте, что нужно найти наилучший способ решить задачу. Для этого система делает примерно следующее:
    1. Создаёт множество разных решений — алгоритмов.
    2. Выбирает среди них лучшие и комбинирует между собой.
    3. Вносит случайные изменения в полученные комбинации — например, меняет формулу, структуру цикла, порядок операций.
    4. Оценивает, насколько эффективен каждый из полученных вариантов, и повторяет всё заново.

На каждом этапе сохраняются наиболее эффективные алгоритмы по множеству метрик. Спустя сотни или тысячи таких циклов появляется уникальное решение — самое быстрое и точное.

Люди боятся случайных изменений в решениях. А ИИ учится вносить их, и побольше. Это мутации алгоритма.
  1. Интеграция с LLM.
    Второй важный элемент AlphaEvolve — искусственный интеллект. Система использует разные версии Gemini — языковой модели Google. Модель Gemini Flash генерирует большое количество решений, а Gemini Pro даёт советы по их улучшению.

  2. Автоматизированная система оценки.
    Каждое решение проходит набор автоматических проверок (evaluator pool), которые оценивают:

  • корректность работы кода — с помощью юнит-тестов;

  • производительность — насколько быстро код обрабатывает данные;

  • сколько ресурсов тратит код — процессор, память, видеокарта;

  • устойчивость кода к ошибкам и предсказуемость поведения при разных входных данных.

  1. Хранилище данных.
    Все успешные алгоритмы попадают в program database — базу данных проверенных и хорошо работающих решений. При следующих циклах AlphaEvolve может использовать лучшие из них в качестве «шаблонов» для новых комбинаций. Благодаря этому система не ищет каждый раз решения с нуля, а развивает уже удачные варианты.

Сначала генератор запросов (prompt sampler) собирает запрос для языковых моделей (LLM). Затем языковые модели по этому запросу создают новые версии алгоритмов. Они проходят автоматическую систему оценок (evaluator pool) и потом попадают в базу данных программ (program database)

Где уже используют

Пока доступ к AlphaEvolve ограничен. Исследователи тестируют её для своих проектов:

table.webp
  1. Решение математических задач.
    AlphaEvolve помогла с решением задач из разных разделов математики: анализ, комбинаторика, геометрия, теория чисел. Примерно в 75% случаев система выделила лучшие решения из ранее известных, а в 20% даже придумала варианты лучше, чем были раньше.

  2. Оптимизация работы дата-центров.
    Система придумала способ лучше распределять задачи между компьютерами в дата-центрах Google. Благодаря этому удалось вернуть в работу около 0,7% вычислительных мощностей — раньше они простаивали или использовались неэффективно.

  3. Обучение ИИ.
    Во время обучения языковой модели приходится перемножать большие таблицы чисел (матрицы) — огромные наборы данных, которые нейросеть использует, чтобы учиться и понимать информацию. AlphaEvolve помогла ускорить процесс умножения на 23%. Благодаря этому время обучения модели сократилось примерно на 1%. Для обучения таких моделей нужны огромные вычислительные мощности, так что любая экономия ресурсов очень важна.

Где пригодится в будущем

AlphaEvolve может повлиять почти на все сферы жизни, где нужно решать сложные задачи: от автоматизации производства до кибербезопасности. Приведём несколько примеров.

  1. Наука.
    Может быть полезна в задачах, где слишком много возможных вариантов и человек физически не может проверить их все. Например, если нужно подобрать идеальную комбинацию для создания вакцины в медицине или найти формулу, которая описывает поведение сложной системы в физике.

  2. Робототехника.
    Сейчас обучение робота требует много ручного труда и тестов. AlphaEvolve может ускорить и упростить этот процесс. За минуты система протестирует тысячи комбинаций, как двигать ногами, поворачивать корпус, держать равновесие, и выберет те, что будут лучше всего работать при заданных условиях.

  3. Программирование.
    Разработчикам не придётся вручную тестировать и переписывать десятки вариантов кода. Система предложит улучшения и новые подходы, которые программист не смог бы придумать сам. Например, AlphaEvolve поможет найти наиболее быстрый способ анализа больших данных и обработки запросов или сэкономить ресурсы: электроэнергию, вычислительные мощности.

ещё по теме