ИИ помог учёным создать робота-выживальщика

6 мин
ИИ помог учёным создать робота-выживальщика

Исследователи из Северо-Западного университета в Иллинойсе применили искусственный интеллект, чтобы создать высокоадаптивного робота. 

Обычно робототехнику создают с учётом конкретных условий окружающей среды, и она не обладает адаптивностью за этими пределами. Даже роботы, предназначенные для работы на открытом воздухе и обычно способные передвигаться по неровной местности, могут испытывать трудности, сталкиваясь с препятствиями, для преодоления которых они не были специально запрограммированы.

Исследователи из Северо-Западного университета изучают другой решение. Вместо того чтобы проектировать роботов для конкретных условий или пытаться предсказать каждый возможный сценарий, они экспериментируют с машинами, которые могут перестраиваться и адаптировать свои движения зависимо от ситуации. Результатом их работы стала «шагающая метамашина» — прочный модульный робот, который странно выглядит и движется, но способен функционировать, даже если его распилить пополам.

Робот состоит из нескольких модулей, похожих на детали конструктора Lego, которые могут собираться в разнообразные конфигурации. Каждый модуль представляет собой функционального робота, содержащего батарею, двигатель и компьютер. Конструкция относительно проста — центральный шар и две примыкающие к нему руки (или ноги), которые могут вращаться вокруг одной оси. Сам по себе компонент может независимо катиться, крутиться и прыгать. 

Каждый модульный блок состоит из двух звеньев и шарнирной сферы (A). Внутри сферы находится батарея (B), специальная печатная плата с встроенной электроникой обработки, датчиков и связи; (C), держатель печатной платы (D) и двигатель (E). Звенья могут свободно вращаться на 360° вокруг оси вращения, приводимой в движение двигателем. Используя эту единственную степень свободы, модуль может взлететь в воздух (F–I), повернуться на месте (J–M) и катиться вперед (N–P) по поверхности. Выученная стратегия поворота остаётся неизменной при переворачивании (L), сохраняя то же вращение по часовой стрелке (M). Выученная стратегия качения оказывает сопротивление при отталкивании назад (O), быстро тормозя и возобновляя движение вперёд (P). Один модуль может соединяться с другим в трёх ориентациях (повороты на 120°) в 18 точках соединения вдоль его шарнира и звеньев, что дает 435 различных вариантов двухмодульных тел (подмножество которых показано на рисунках Q–V). Док-станции крепятся с помощью гаек и болтов (W) и спроектированы таким образом, чтобы выдерживать высокие нагрузки во всех направлениях, что позволяет выполнять агрессивные динамические движения. Контроллер использует только внутренние (проприоцептивные и вестибулярные) датчики; данные захвата движений контроллеру не предоставлялись.
Каждый модульный блок состоит из двух звеньев и шарнирной сферы (A). Внутри сферы находится батарея (B), специальная печатная плата с встроенной электроникой обработки, датчиков и связи; (C), держатель печатной платы (D) и двигатель (E). Звенья могут свободно вращаться на 360° вокруг оси вращения, приводимой в движение двигателем. Используя эту единственную степень свободы, модуль может взлететь в воздух (F–I), повернуться на месте (J–M) и катиться вперед (N–P) по поверхности. Выученная стратегия поворота остаётся неизменной при переворачивании (L), сохраняя то же вращение по часовой стрелке (M). Выученная стратегия качения оказывает сопротивление при отталкивании назад (O), быстро тормозя и возобновляя движение вперёд (P). Один модуль может соединяться с другим в трёх ориентациях (повороты на 120°) в 18 точках соединения вдоль его шарнира и звеньев, что дает 435 различных вариантов двухмодульных тел (подмножество которых показано на рисунках Q–V). Док-станции крепятся с помощью гаек и болтов (W) и спроектированы таким образом, чтобы выдерживать высокие нагрузки во всех направлениях, что позволяет выполнять агрессивные динамические движения. Контроллер использует только внутренние (проприоцептивные и вестибулярные) датчики; информация захвата движений контроллеру не предоставлялись.

В собранном виде конструкция выглядит интереснее. Обмениваясь данными через внутренние компьютеры, она может прыгать, ползать, катиться, волнообразно двигаться и выполнять много других движений, которые довольно хаотичны, но одновременно весьма эффективны. 

По сути, робот выполняет свою задачу — любым способом добраться из точки А в точку Б. Модульная конструкция выступает источником его «неуязвимости». Если какой-либо компонент отсоединится от сборки или получит повреждение, остальная часть машины найдёт способ продолжить движение, выполняя свою основную задачу.

Пятимодульная конструкция (A) была обучена совершать прыжки и повороты по требованию, вращая тело в воздухе на 66° по часовой стрелке вокруг поперечной плоскости (B–F). Конструкция также была обучена поддерживать вертикальную позу и походку, самостоятельно выравниваясь в перевёрнутом положении (G–L). При переворачивании вверх ногами (с помощью деревянной доски; красная точка на H) конструкция быстро изгибается и скручивает тело, чтобы восстановить вертикальную позу и походку (L). Все конструкции, созданные в рамках результатов данной работы, оказались способными к обучению этим акробатическим действиям.
Пятимодульная конструкция (A) была обучена совершать прыжки и повороты по требованию, вращая тело в воздухе на 66° по часовой стрелке вокруг поперечной плоскости (B–F). Конструкция также была обучена поддерживать вертикальную позу и походку, самостоятельно выравниваясь в перевёрнутом положении (G–L). При переворачивании вверх ногами (с помощью деревянной доски; красная точка на H) конструкция быстро изгибается и скручивает тело, чтобы восстановить вертикальную позу и походку (L). Все конструкции, созданные в рамках результатов данной работы, оказались способными к обучению этим акробатическим действиям.

Вместо того чтобы проектировать робота напрямую, команда предоставила ИИ набор строительных блоков, модулей и простую цель: найти наиболее эффективный метод передвижения техники. Затем ИИ запустил процедура рассуждений, имитирующий естественную эволюцию.

Для генерации последовательностей сенсомоторных обучающих данных для различных ампутаций моделируемого четвероногого робота (A–F) использовались экспертные стратегии. В дополнение к исходному контроллеру локомоции, который был принят за эксперта для неповреждённого робота (A и F), были предварительно обучены три дополнительные экспертные стратегии, соответствующие потере одной (B и D), двух (C) или четырёх конечностей (E) соответственно. Генеративная модель успешного поведения была получена путём авторегрессивного прогнозирования сенсомоторных взаимосвязей экспертов во времени (G), подобно тому, как языковая модель изучает правила грамматики из текста. Имея недавнюю историю сенсорных наблюдений, обученная модель предсказывает оптимальное двигательное действие. Это понимание правил успешного поведения было использовано в качестве стратегии, не зависящей от ампутации, которая позволяет физическому роботу (H) сохранять функциональность после радикальных изменений в его строении тела (I–K). Политика, не зависящая от ампутации (L–O), и исходная экспертная политика робота (P-S) были протестированы на трёх ранее не встречавшихся сценариях повреждений (I–K), а также на многих других в симуляции. У неповреждённого робота чистое перемещение, генерируемое политикой, не зависящей от ампутации (красная полоса на H), статистически не отличалось от исходной политики (синяя полоса на H и серые полосы на I–K). При удалении одной задней конечности в случайной точке разреза (I), удалении обеих задних конечностей (J) и сохранении всех модулей, кроме одного (K), политика, не зависящая от ампутации, неизменно генерировала большее движение вперёд, чем исходная.
Для генерации последовательностей сенсомоторных обучающих данных для различных ампутаций моделируемого четвероногого робота (A–F) использовались экспертные стратегии. В дополнение к исходному контроллеру локомоции, который был принят за эксперта для неповреждённого робота (A и F), были предварительно обучены три дополнительные экспертные стратегии, соответствующие потере одной (B и D), двух (C) или четырёх конечностей (E) соответственно. Генеративная схема успешного поведения была получена путём авторегрессивного прогнозирования сенсомоторных взаимосвязей экспертов во времени (G), подобно тому, как языковая модель изучает правила грамматики из текста. Имея недавнюю историю сенсорных наблюдений, обученная схема предсказывает оптимальное двигательное действие. Это понимание правил успешного поведения было использовано в качестве стратегии, не зависящей от ампутации, которая даёт возможность физическому роботу (H) сохранять функциональность после радикальных изменений в его строении тела (I–K). Политика, не зависящая от ампутации (L–O), и исходная экспертная политика робота (P-S) были протестированы на трёх ранее не встречавшихся сценариях повреждений (I–K), а также на многих других в симуляции. У неповреждённого робота чистое перемещение, генерируемое политикой, не зависящей от ампутации (красная полоса на H), статистически не отличалось от исходной политики (синяя полоса на H и серые полосы на I–K). При удалении одной задней конечности в случайной точке разреза (I), удалении обеих задних конечностей (J) и сохранении всех модулей, кроме одного (K), политика, не зависящая от ампутации, неизменно генерировала большее движение вперёд, чем исходная.

«Эволюция может выявлять новые конструкции, отличающиеся от того, что люди могли себе представить раньше, или даже превосходящие эти догадки. Поэтому мы действительно хотели изучить, как и почему это работает. Лучший способ, или, по чрезвычайной мере, самый увлекательный, — это заставить эволюционировать структуры в реалистичных условиях», — объясняет Сэм Кригман, руководитель исследования и эксперт по биороботике. 

В компьютерной симуляции ИИ сгенерировал тысячи возможных конфигураций роботов. Каждая конструкция была протестирована в бесчисленных экстремальных виртуальных средах. Наиболее успешные конструкции, те, которые двигались дальше или лучше справлялись с препятствиями, были сохранены, а более слабые отброшены.

Из поколения в поколение конструкции эволюционировали, пока ИИ не создал высокоэффективные конфигурации. Затем разработчики физически собрали их.

В ходе испытаний на открытом воздухе получившийся робот эффективно передвигался по различным пересечённым поверхностям, в том числе траву, гравий и грязь. 

«Эти роботы могут выжить, если их разрубить пополам или разрезать на множество частей. При разделении каждый модуль внутри метамашины может стать отдельным агентом», — сообщает Кригман. 

Исследователи также утверждают, что это начальный эволюционировавший робот, который вышел за пределы симуляции и попал в реальный мир. 

Пока техника находится на самых ранних стадиях развития. Например, у машины нет внешних датчиков, она не может видеть препятствия или составлять карту окружающей среды. Робот может определять свою собственную ориентацию (перевёрнут ли он или застрял) и положение модулей. С другой стороны, он медленный, неуклюжий и не обладает сенсорными возможностями, необходимыми для решения реальных задач.

Даже сами исследователи признают, что робот пока не особенно полезен. Одна из целей проекта — изменить представление инженеров о роботах. Благодаря эволюционной робототехнике, основанной на искусственном интеллекте, исследователи решили фундаментальную задачу любого эволюционирующего вида: выживания.

Между тем в MIT представили Wave-Former — систему, которая позволяет роботу восстанавливать 3D-форму предметов, скрытых за картоном, гипсокартоном, деревом или тканью. Для этого используются миллиметровые радиоволны (те же, что в Wi-Fi) и специально обученная генеративная модель.

А исследователи из Университета штата Оклахома пытаются решить проблему ошибок в работе робототехники, обучая машины реагировать на человеческие инстинкты в режиме реального времени. Команда разрабатывает нейроадаптивную систему управления, которая позволяет роботам улавливать сигналы из человеческого мозга и мгновенно корректировать свои действия. Итак, если оператор-человек чувствует, что что-то идёт не так, робот должен отреагировать до того, как ошибка возникнет в реальном мире.

Читают сейчас

Японская Balmuda совместно с Джони Айвом выпустила The Clock — минималистичный будильник с режимами для фокусировки

53 минуты назад

Японская Balmuda совместно с Джони Айвом выпустила The Clock — минималистичный будильник с режимами для фокусировки

Японская организация Balmuda совместно с бывшим дизайнером Apple Джони Айвом (Jony Ive) выпустила минималистичные часы-будильник The Clock. Помимо привычных функций, ожидаемых от будильника, есть режи

ВК ДжейТи Встреча: оптимизация и масштабируемость на Go

55 минут назад

ВК ДжейТи Встреча: оптимизация и масштабируемость на Go

Привет, овчане! Весной стартует F1 для Go-разработчиков, встречаемся в двух столицах: 4 апреля — в Москве, 11 апреля — в Санкт-Петербурге. Обсудим реальные кейсы из практики VK и архитектурные решения

Исследователь провёл реверс-инжиниринг TiinyAI Pocket Lab на основе маркетинговых данных

55 минут назад

Исследователь провёл реверс-инжиниринг TiinyAI Pocket Lab на основе маркетинговых данных

Энтузиаст воссоздал характеристики мини-ПК TiinyAI Pocket Lab по маркетинговым фотографиям. Выяснилось, что организация во многом преувеличила возможности устройства. Читать далее

В Антарктиде построят станцию для молодых учёных

57 минут назад

В Антарктиде построят станцию для молодых учёных

Российские учёные смогут приступить к исследованиям на антарктическом острове Смоленск уже в январе 2027 года. Для этого планируется создать новую полярную станцию по инициативе Фёдора Конюхова, о чём

Цукерберг разрабатывает персонального ИИ-агента, который должен помочь ему выполнять работу гендиректора

1 час назад

Цукерберг разрабатывает персонального ИИ-агента, который должен помочь ему выполнять работу гендиректора

Генеральный директор Meta* Марк Цукерберг разрабатывает персонального агента на искусственном интеллекте, который должен помочь выполнять работу главы корпорации, пишет Wall Street Journal. Источники