Physical AI: как работает искусственный интеллект у роботов

Загрузка

Physical AI: как работает искусственный интеллект у роботов

Что такое физический ИИ и чем он отличается от других нейросетей

Физический искусственный интеллект — это класс ИИ-систем, которые управляют роботизированными устройствами: самими роботами, дронами, автономным транспортом. А ещё физический ИИ анализирует сигналы с камер, сенсоров и манипуляторов, понимает свойства объектов и может выполнить задачу в реальном мире — поднять груз, удержать равновесие, выбрать безопасную траекторию движения.

Физический ИИ — это «мозг» для роботов и других устройств с интеллектом.

Модели компьютерного зрения распознают объекты и сцены, рекомендательные алгоритмы помогают разбирать большие массивы данных, языковые модели работают с текстами. Все они существуют в цифровой среде: интерпретируют информацию, но не взаимодействуют с физическим миром напрямую. У робота же есть корпус, приводы, сенсоры и реальная среда вокруг, поэтому на него ложится ответственность за каждое движение — и именно здесь требуется Physical AI.

Кто разрабатывает Physical AI в России

За российский Physical AI отвечает Яндекс Роботикс и команда автономного транспорта. По сути, это люди, которые много лет учат роботов жить в реальном мире: ориентироваться, принимать решения и работать рядом с человеком.

Команда автономного транспорта учит машины перемещаться по улицам: выбирать безопасную траекторию движения, учитывать сигналы светофора, обращать внимание на пешеходов и автомобили. Всё началось с небольших роботов-курьеров — они уже более пяти лет доставляют заказы.

Поначалу им было трудно: они терялись в пространстве, не могли перейти дорогу, застревали в сугробах.

Но у команды Яндекса с помощью машинного обучения получилось научить курьеров на колёсиках справляться с узкими дорожками или неожиданным препятствием в виде огромной лужи.

Этот опыт оказался полезным для работы над физическим искусственным интеллектом.

Яндекс Роботикс помогает оптимизировать работу складов с помощью роботов. Уже сегодня на площадках работают разные типы техники: палетайзеры формируют палеты и готовят их к отправке, мобильные роботы перемещают и сортируют товар, а пикеры собирают заказы для конечных покупателей. Все эти задачи требуют точности, аккуратного обращения с продукцией и умения работать в тесном пространстве между стеллажами.

Чтобы выполнять операции безопасно и надёжно, робот опирается на данные с камер, лидаров и других датчиков. Он оценивает форму и положение коробки, подбирает правильный хват и поднимает груз без повреждений. Physical AI помогает управлять флотом роботов: с ИИ им легче понимать окружение, держать дистанцию, подстраиваться под реальные условия склада и работать с разноформатными объектами.

Какие задачи стоят перед физическим ИИ

(01)

Рассказывали в 8БИТ о том, как люди научили машины видеть лучше себя самих.Читать

Physical AI нужен для того, чтобы роботы могли ориентироваться в реальной меняющейся среде. Конечно, те же роботы-доставщики уже оснащены сенсорами и HD-камерами, но чем лучше будут роботы, тем более сложные задачи им можно будет поручить.

Понимание среды. Чтобы робот мог уверенно работать в городе, квартире или на складе, ему мало «видеть» объекты — нужно ориентироваться и выполнять свои задачи, никому не мешая. Благодаря физическому ИИ робот сможет воспринимать мир через камеры и сенсоры.

Кстати, именно так курьеры на колёсах научились перемещаться по городу. Они получают информацию одновременно с камер, лидара, радара и ультразвуковых датчиков. Камеры формируют панорамное изображение, а лидар создаёт трёхмерную модель окружения: по отражённым лучам робот определяет расстояние до ближайших объектов и их форму. С помощью радара робот-курьер также оценивает скорость движущихся предметов.

Все эти сигналы позволяют собрать цифровую модель района вокруг робота. Поэтому курьер видит, что перед ним: человек, столб, ступенька, бордюр или свободное место. На основе этих данных робот может оценить ситуацию целиком, а не реагировать на отдельные триггеры.

Чем лучше робот понимает мир вокруг, тем проще ему строить прогнозы и принимать решения, которые не навредят окружающим людям.

Принятие решений и универсальность. Идея о физическом искусственном интеллекте строится на надеждах, что роботы смогут самостоятельно анализировать контекст, оценивать риски и принимать решения.

На некоторые решения роботы способны уже сейчас — например, пикер от Яндекс Роботикс понимает, что хрупкие предметы нужно укладывать бережно, а для поднятия листа бумаги нужен особый хват.

Другие решения роботам только предстоят: однажды им можно будет поручать не только доставку пиццы, но и выбор оптимального маршрута для доставки товаров из одного конца страны в другой. Тогда роботу, оснащённому искусственным интеллектом, придётся опираться не только на заранее прописанные правила, но и на реальную среду, а значит, становиться автономным.

(02)

Приходите учить роботов в Роботикс. Возможно, именно вам они пожмут руку в знак благодарности.Читать

Технологии Physical AI для промышленных и сервисных роботов

Роботы становятся сложнее, требования к ним тоже постоянно повышаются. Сейчас от них уже ждут осмысленных действий в постоянно меняющейся среде. Поэтому и зарубежные, и российские инженеры сосредоточены на технологиях, которые объединяют восприятие, понимание команд и само действие. Также активно разрабатываются системы, способные надёжно управлять флотом роботов. Именно об этих технологиях расскажем ниже.

Модель VLA (Vision-Language-Action)

В основе Physical AI лежит модель VLA. Это архитектура, которая связывает три ключевых сигнала (зрение, язык и действие), без которых робот не может уверенно работать в реальной среде:

Зрение (Vision). Робот получает изображение с камер и сенсоров и строит представление о том, что происходит вокруг: где лежит объект, насколько свободен проход, как расположены полки и препятствия.

Язык (Language). Оператор формулирует задачу обычной фразой: «Перенеси коробку на верхнюю полку», «Подай инструмент к станку». Модель интерпретирует просьбу и уточняет, какое именно действие требуется.

Действие (Action). Система превращает понимание задачи и картинки в последовательность движений: подойти, захватить, поднять, обойти, поставить. То есть сразу выдаёт готовый план выполнения.

На этом объединении строится поведение Physical AI. В модели есть набор базовых действий: взять предмет, повернуть, перенести, поставить. Эти действия работают как универсальные «кирпичики»: их можно комбинировать под конкретную задачу, а значит, одна и та же модель подходит и для сервисных роботов, и для промышленных платформ.

У роботов есть свой язык действий, и у этого языка есть свой словарь. И на букву Я там Яндекс!

Команды Яндекса планируют расширять словарь действий, чтобы сформировать универсальный интеллект, полезный как для сервисных роботов, так и для промышленных платформ.

Всё просто: робот видит ситуацию, понимает просьбу и на лету подбирает нужную последовательность шагов. Ему не нужно заранее готовить алгоритм действий под каждый стеллаж или тип тележки — он ориентируется на текущие условия и прошлый опыт. Поэтому основное преимущество VLA — гибкость. Одна и та же модель может работать на разных роботах и в разных помещениях — от склада до городской квартиры.

Система управления Yandex RMS

Physical AI отвечает за то, как действует отдельный робот. A Yandex RMS направляет десятки таких роботов и следит, чтобы они не мешали друг другу. Система работает как диспетчер: получает задания, распределяет их между машинами и координирует всё движение на складе.

Задания приходят из WMS (Warehouse management system) или другой учётной системы: например, нужно собрать заказ, переместить палету, доставить коробки к зоне отбора. RMS разбивает эту задачу на шаги и выбирает исполнителей. При выборе учитывается тип робота, его загруженность, расстояние до нужной точки и текущая ситуация в проходах.

RMS постоянно обменивается данными с внешними сервисами по API. Система знает карту склада, получает статусы от роботов и датчиков. На основе этих данных строятся дашборды: где сейчас каждая машина, какие операции выполняются, какие зоны перегружены.

Physical AI для роботов-гуманоидов

Большие и маленькие роборуки, автономные машинки на колёсах — это только начало. Основной технологический тренд в робототехнике — гуманоиды. Во-первых, людям легче воспринимать тех, кто выглядит и ведёт себя «по-человечески», а во-вторых, вся инфраструктура создана под людей. Поэтому логичнее практиковаться в создании роботов, которым будет легко подниматься по лестницам, открывать двери, нажимать на кнопки лифта.

Но создать человекоподобного робота сложно — не только из-за эффекта зловещей долины. Основная проблема в том, что гуманоид должен стоять на двух ногах, удерживать баланс, работать руками, переносить вес — и всё это рядом с людьми.

Для полноценного взаимодействия одной интерактивной карты и сканеров не хватит. Перед захватом нужно оценить форму и устойчивость предмета, понять, как распределён вес, а затем двигаться, чтобы не перегрузить суставы и не потерять равновесие. Любое наше действие (например, то, как мы поднимаем и обхватываем коробку) влияет на положение корпуса, а перенос тяжёлого груза — на центр тяжести. У человека эти реакции автоматические, а вот роботу придётся учиться держать баланс и соизмерять силы.

Задача со звёздочкой — научить гуманоида взаимодействовать с людьми так, чтобы случайно не задеть их. Для этого роботу придётся учиться тормозить, поворачивать и ещё внимательнее отслеживать поведение людей.

(03)

Люди делают роботов похожими на себя не просто так. А почему — читайте в 8БИТ (где же ещё).Читать

Физический искусственный интеллект будет работать на полную мощность — заданных скриптов не хватит, придётся учить роботов реагировать по ситуации.

Зачем бизнесу универсальный Physical AI

Универсальный физический ИИ убирает главный барьер на пути роботизации — необходимость подгонять процессы под конкретную машину. Не нужно перестраивать инфраструктуру, тратить время и деньги на наём программистов и ML-инженеров. Искусственный интеллект воспринимает голос, жесты и обычный текст, поэтому сотрудникам достаточно описать роботу задачу так же, как коллегам.

Наверное, через пару лет можно будет даже шутить с роботами и обсуждать, как всем хочется в отпуск.

Пока что физический ИИ не понимает шуток, зато легко переводит человеческую просьбу в набор действий: найти нужный объект, подойти, взять, перенести, обойти препятствия, аккуратно поставить. Благодаря этому роботы уже сейчас полезны в дарксторах, на складах и в распределительных центрах.

Чем сильнее будет развиваться физический интеллект, тем выше будет масштабируемость. Один и тот же ИИ сможет работать на разных типах роботов и осваивать новые операции по мере роста задач. Бизнес получит гибкую систему, которую не нужно переписывать под каждую модель оборудования. Благодаря этому роботам можно будет передавать не только простые рутинные поручения, но и автоматизацию целых логистических или производственных цепочек.

Чем хорош Яндекс Роботикс

Роботы Яндекса давно вышли за пределы демонстрационных стендов. Они ездят по тротуарам, проверяют стеллажи, помогают с инвентаризацией и сборкой заказов. Ниже — примеры предприятий, где роботы дают ощутимый эффект.

«Азбука Вкуса»: автоматизация инвентаризации

Сеть внедрила робота-инвентаризатора для регулярного пересчёта запасов. Раньше инвентаризация требовала остановки участка и большого количества ручной работы. Робот выполняет проверку автоматически: сканирует товары, двигаясь по аллеям склада, а затем сверяет данные с WMS. При этом операционные процессы не останавливаются — склад работает в обычном режиме.

«СТА Карго»: учёт крупногабаритных грузов

У логистического оператора «СТА Карго» под управлением находится более 90 000 м² складской недвижимости. Это масштабные логистические объекты с высоким оборотом грузов, в том числе нестандартных и крупногабаритных. Естественно, инвентаризация вручную занимала огромное количество времени — и здесь очень пригодились роботы-инвентаризаторы от Яндекс Роботикс. Они самостоятельно сравнивают фактическое размещение грузов с записями WMS и сообщают, если есть расхождения. На одну аллею склада у робота уходит 4 минуты, в то время как сотрудники тратили на эту задачу целый рабочий день.

Есть и заметные результаты: после внедрения точность учёта выросла с 89 до 96%, а полнота данных — с 50 до 90%. Сотрудники тоже выиграли: их направили на новые сервисы и улучшение обслуживания.

Яндекс Лавка: роботизированная сборка и доставка

У Яндекс Лавки один из самых масштабных парков роботов-курьеров. Ежедневно маленькие роботы доставляют более тысячи заказов, а система управления помогает им двигаться по тротуарам и дворам, обходя препятствия и прогнозируя движения людей.

В одном из московских дарксторов запущена «робозона»: 12 автономных роботов привозят стеллажи к сборщикам, а Yandex RMS распределяет задачи и контролирует маршруты.

Благодаря этому заказы собираются на 30% быстрее, а у сотрудников Лавки гораздо меньше физической нагрузки. Слава роботам!

Итак…

Physical AI — это шаг к роботам, которые умеют работать в реальной среде, а не в заранее подготовленных условиях. Универсальный «мозг» помогает им видеть сцену, учитывать физику мира и принимать решения. Благодаря этому роботы под управлением одного ИИ смогут работать на складе, в доставке, в сервисе и многих других сферах.

В индустрии часто сравнивают генеративный ИИ с появлением парового двигателя: когда одна технология открыла сразу множество новых областей применения. Физический ИИ может сыграть похожую роль для современной робототехники — стать фундаментом, на котором строится следующая волна автоматизации.

И чем дальше продвигаются эти системы, тем заметнее становится: роботам не нужно подстраивать мир под себя. Это они учатся подстраиваться под мир, в котором живут люди.

Physical AI: как работает искусственный интеллект у роботов

Краткий пересказ от YandexGPT

ещё по теме

Что такое физический ИИ и чем он отличается от других нейросетей

Кто разрабатывает Physical AI в России

Какие задачи стоят перед физическим ИИ

(01)

(02)

Технологии Physical AI для промышленных и сервисных роботов

Physical AI для роботов-гуманоидов

(03)

Зачем бизнесу универсальный Physical AI

Чем хорош Яндекс Роботикс