Гуманоиды: зачем делать роботов похожими на людей

Зачем роботам руки и ноги? Стоит ли приделывать их всем подряд? И насколько сложно научить машину думать как человек? Спросили об этом Ваню Калинова — руководителя робототехнического подразделения в Яндексе. Он работает над мобильными роботами, умными роборуками и системой управления, которая помогает машинам действовать слаженно. А ещё он интересно и понятно отвечает на вопросы нашей редакции

ручки и ножки
умная машина
робот
андроид
яндексатор 3000
cover.webp

Зачем делать роботов, похожих на людей?

  1. С практической точки зрения.
    Всё сводится к тому, что инфраструктура вокруг нас уже создана под человека. Поэтому логично разрабатывать роботов, которые будут похожи на людей и смогут эффективно взаимодействовать с этим пространством: передвигаться по лестницам, открывать двери, нажимать кнопки.

  2. С социальной точки зрения.
    Чем более «человечным» выглядит робот, тем проще ему интегрироваться в общество.

Детям или пожилым людям может быть комфортнее общаться не с бездушной железкой, а с роботом, внешне напоминающим няню или сиделку.

Это повышает уровень доверия. А про важность доверия к роботам сняли немало фильмов, мы с вами их видели-знаем.

То есть роботов делают более «человечными», чтобы людям было легче их воспринимать?

Там, где есть эмоциональный контакт с человеком, роботов действительно стараются делать внешне и поведенчески более «человечными». Убедиться в этом наверняка можно будет только после первых массовых внедрений.

Сейчас есть примеры, которые показывают, как человек привязывается к более «человечным» технологиям. Например, есть кейсы, когда пожилые люди начинают регулярно общаться с Алисой. Им одиноко и просто хочется, чтобы кто-то разговаривал с ними. В таких ситуациях технологии делают более персонализированными: добавляют им эмоции, интонации, «характер». С роботами, скорее всего, будет происходить то же самое.

Но если речь идёт о производстве, где важно только выполнение задач, здесь гуманизация ни к чему. Робота, наоборот, можно упростить, убрать лишние элементы вроде глаз или лица, если они не нужны.

Почему крупные компании, в том числе Яндекс, двигаются в сторону гуманоидных решений?

  1. Во-первых, есть общий технологический тренд.
    Крупные компании часто экспериментируют с передовыми решениями, чтобы не отставать в развитии и быть готовыми к будущим вызовам.

  2. Во-вторых, у таких компаний, как Яндекс, есть большой офлайн-бизнес.
    В операционных процессах задействовано много людей, и их не всегда хватает. Чтобы обеспечить бесперебойную работу, приходится искать дополнительные ресурсы, в том числе робототехнические.

Роботы протягивают Яндексу свою железную руку. Слава роботам!

Где-то можно использовать узкоспециализированных роботов, а где-то возникает интерес к более универсальным решениям — в том числе к гуманоидным. Человекоподобные роботы могут быть гибче в адаптации под уже существующую инфраструктуру и задачи. Поэтому компании начинают проводить эксперименты, чтобы наработать технологическую базу и быть готовыми масштабироваться, когда это станет необходимо. Но в Яндексе таких роботов пока нет.

А как же роборука?

Полноценным гуманоидом такую систему назвать сложно. Гуманоид — это формфактор, максимально приближенный к человеку целиком: с руками, ногами, телом и головой. Если у робота, например, есть только одна рука — это всего лишь отдельный функциональный модуль, а не полноценная человекоподобная машина.

Формфактор — это внешний вид и устройство робота, то есть его форма, размеры, структура и особенности конструкции, которые определяют, как он будет двигаться, выглядеть и взаимодействовать с окружающим миром.

Если рассматривать существующие решения, то мобильных роботов можно условно сравнить с нижней частью тела. Пусть это и не ноги, но колёсная база выполняет ту же задачу — передвижение в пространстве. Роборуки, в свою очередь, представляют собой верхнюю часть. Они взаимодействуют с объектами и окружающей средой.

Постепенно из таких модулей можно собрать функционального «гуманоида» — не обязательно с лицом или головой, но с нужным набором возможностей.

Он бы мог не копировать человека внешне, но эффективно выполнять схожие задачи. И для многих сфер — например, складов или производств — именно это и имеет решающее значение.

Такой робот был бы по своей сути воплощённым искусственным интеллектом. Он действовал бы в физическом мире и справлялся с операциями, которые мы ассоциируем с человеческими.

И в этом контексте не так важно, будет ли у него лицо. Главное — это его функциональность. Особенно если он работает не с людьми напрямую, а, например, на складе или производстве, где важна эффективность, а не «человечность».

Окей! В Яндексе гуманоидов пока нет. А будут?

Вероятно, да и вот почему. Яндекс открыл фонд технологических инициатив Yet Another Tech Fund, который будет поддерживать новаторские проекты сотрудников. Один из первых проектов, получивших инвестиции фонда, — разработка роботов-гуманоидов. Команда работает над программным обеспечением для таких роботов на базе технологий Яндекса, включая искусственный интеллект.

Сначала команда хочет научить роботов передвигаться, ориентироваться в пространстве, понимать команды и безопасно взаимодействовать с людьми. Впоследствии планируется освоить полный цикл разработки роботов, включая создание собственного «железа», а также делегировать им рабочие задачи: например, доставку посылок по офису или плановые обходы здания.

Насколько далеко продвинулись другие компании в этой области?

Ни в России, ни в мире не видно массового применения гуманоидных роботов. Есть новости о том, что Amazon тестирует человекоподобных роботов, чтобы освободить персонал от некоторых задач.

Иногда в сети можно встретить ролики, где роботы сортируют посылки или передвигаются по складу. Но это пока не масштабное внедрение с чёткой экономикой и отлаженной логикой применения. Скорее, первые эксперименты и задел на будущее.

Но по мнению аналитиков через 2 года цена робота будет сравнима с годовой зарплатой в США, а следующим этапом может появится недорогое серийное производство. Кажется, что после наступления этих двух событий стоит ожидать массовых внедрений.

А есть ли реальные задачи, где руки и ноги у робота стали бы необходимостью?

Существуют такие примеры.
У Яндекс Лавки есть робот-доставщик, который довозит заказ до подъезда, но не может войти в здание. Ну или только пока...

Он не способен открыть дверь, нажать кнопку в лифте или самостоятельно достать пакет, может только откинуть крышку. В таких случаях наличие рук или хотя бы манипуляторов уже становится актуальным.

При этом в промышленности и логистике часто эффективнее использовать специализированных роботов. Например, если нужно сортировать товары, то достаточно мобильной платформы и одной роботизированной руки — не обязательно собирать «тело» полностью. Если робот справляется с задачей быстро и точно, внешний вид и антропоморфность уходят на второй план.

Не секрет, что во всём мире гуманоидных роботов сейчас в основном учат развлекать — например, танцевать, как в Boston Dynamics, делать сальто или другие трюки. Но меня больше вдохновляют проекты, где ты, во-первых, придумал, как это реализовать, во-вторых, запустил это в жизнь, а в-третьих — принес пользу обществу. Я бы, например, с интересом посмотрел на полностью автономную фабрику, которая сама производит роботов. А потом с их помощью выпускает какие-то полезные устройства.

Насколько технически сложно создавать гуманоидных роботов?

Это действительно непростая задача — особенно если мы говорим не про робота, который выполняет одну и ту же операцию, а про более универсальные решения. В индустрии есть условная классификация поколений роботов, которая помогает понимать уровень сложности их разработки.

  1. Поколение 1: классическая автоматизация
    Это самые простые роботы. Они выполняют одну заскриптованную задачу по заранее заданному маршруту — например, перемещают предмет из точки A в точку B. У них нет технического зрения, они не «видят» и не реагируют на изменения вокруг. Просто делают то, что заложено в коде.
  2. Поколение 2: роботы с техническим зрением и вариативностью
    У этих роботов уже есть «глаза»: сенсоры, камеры, лидары.

        Они способны считывать данные из окружающей среды и выполнять несколько разных сценариев в зависимости от ситуации. Довольно гибкие роботы, но всё ещё ограниченные системой правил.

        Например, если по конвейеру едут яблоки и груши, робот определяет, что и где лежит, подъезжает, берёт и раскладывает их по разным корзинам. Или мобильный робот едет из точки А в точку B и по пути может распознать пешеходный переход, остановиться, объехать препятствие. Территория заранее не задана, но поведение описано в рамках заранее подготовленных сценариев.
  1. Поколение 3: роботы с возможностью «думать».
    Третье поколение — это уже история про визуально-языковые модели (Visual-Language-Action models), которые действуют не по шаблону, а на основе понимания ситуации. Это роботы, которые умеют интерпретировать визуальные данные, связывать их с командами на естественном языке и принимать решения в реальном времени.

        Они не обучены заранее на все возможные случаи, но умеют обобщать, находить похожие ситуации и на основе этого действовать. Роборука — пример такого подхода. Она может попытаться схватить любой предмет, даже если не видела его раньше, и при этом адаптировать поведение под контекст.

        Гуманоидные роботы теоретически тоже могут быть разного уровня. Они могут работать строго по заданному маршруту, и это всё ещё будет робот второго поколения. Пример: робот-бариста, который двигается вдоль одной полки и повторяет одни и те же действия. А могут быть построены на архитектуре третьего поколения, когда гуманоид сам решает, как эффективнее справиться с задачей в конкретных условиях. И это действительно сложная техническая задача, над которой сейчас работает весь рынок.

Какое место будут занимать роботы в нашей жизни через 10–15 лет?

Скорее всего, внедрений станет значительно больше.

Роботы перестанут восприниматься как нечто необычное. Вспомним 2007 год: у большинства ещё не было смартфонов, а теперь без них сложно представить жизнь.

Вместе с ними пришли и новые сервисы, которые раньше казались фантастикой.

С роботами будет так же. Сейчас они воспринимаются как диковинка, но через 10–15 лет будут частью повседневности. Как это произошло с нейросетями, роботы станут своего рода «членами общества». Особенно это коснётся тех сфер, где важно взаимодействие с людьми.

Если говорить о типах роботов, то, скорее всего, будут развиваться и специализированные, и гуманоидные. В случае утилитарных задач — на производстве, в логистике — будут выигрывать специализированные роботы с понятной экономикой и эффективностью. В сферах, где важно общение, эмоции и комфорт, — например, в образовании, здравоохранении, помощи пожилым — будут востребованы именно гуманоидные роботы.

ещё по теме