Сверхбыстрое мета-обучение на примере робота PR2

Команда исследователей из Калифорнийского университета в Беркли продемонстрировала ускоренный метод обучения ИИ. С новым алгоритмом серийно выпускаемый робот PR2 учится, просто наблюдая за человеком. Для отдельных задач ему хватает всего одной демонстрации.

После неудачи Rethink Robotics на рынке, другие компании стремятся поскорее предложить своих универсальных роботов с искусственным интеллектом. Как правило, все они обучаются новым навыкам посредством подражания, и это требует от учителя определённой квалификации.

Сначала оператор (или другой робот) показывают, как надо выполнять какой-то набор элементарных действий – например, выбрать определённую деталь, захватить её и переместить в контейнер. Затем робот пытается воспроизвести эту последовательность, но поначалу допускает ошибки. Оператор вносит коррективы и раз за разом запускает следующую попытку до тех пор, пока не получит удовлетворяющий его результат.

В общем случае требуется выполнить множество повторений, прежде чем распознавание объектов станет уверенным, а грубая траектория манипулятора по изломанной линии станет похожа на эталонное движение руки хотя бы в первом приближении.

Аспирант Тяньхэ Ю и постдокторант Челси Финн (кстати, также являющаяся научным сотрудником проекта Google Brain) предложили свой подход. Они взяли коммерчески доступную модель робота PR2 и сосредоточились на том, чтобы научить его двигать объект в нужную сторону, не заботясь о точной траектории.

Используя домен-адаптивное мета-обучение, робот сам рассчитывает траекторию движения манипулятора, исходя из фактического начального и требуемого конечного положения объектов. В условиях простого теста PR2 научился помещать разные предметы в контейнеры с яркой цветовой кодировкой, просто однократно понаблюдав, как это делают люди.

Прототип робота был представлен ещё в 2010 году. Это очень мощная модель, оснащённая сразу двумя встроенными серверами на базе четырёхъядерных процессоров Xeon. Суммарный объём оперативной памяти составляет 24 ГБ. Для хранения ОС и базовых настроек используется внутренний жёсткий диск объёмом 500 Гб. Обучающие выборки и другие данные можно размещать на внешнем диске (входит в комплект) ёмкостью 1,5 Тб.


Из-за симметричного дизайна ширина и глубина робота составляет 668 мм. Телескопический позвоночник позволяет ему изменять высоту от 1330 до 1645 мм. Поворотная голова с механизмом наклона (Pan/Tilt) обеспечивает панорамирование на 350° и наклон в пределах 115°.

Робот перемещается на четырёх колёсах со скоростью до 1 м/с. Обладая крутящим моментом запястья 4 Нм и силой сцепления манипулятора 80 Н, он может захватывать и перемещать предметы массой до 1,8 кг.

«Современные роботы все ещё не приблизились к тому, на что способен человек. Мы учим роботов выполнять сортировку и другие задачи, просто наблюдая, как человек выполняет их один раз. Мы надеемся, что с помощью демонстрации сможем дать им возможность выполнять более общие задачи», – пояснил Тяньхэ Ю.

Источники:
One-Shot Imitation from Observing Humans via Domain-Adaptive Meta-Learning // Yu Tianhe, Finn Chelsea et al. (2018);

Willowgarage.com; Inverse.com

Загрузка ...
The Robot
Adblock
detector