RL-инженер в команду локомоции человекоподобных роботов
Компания: Яндекс
О компании
Яндекс — это одна из ведущих IT-компаний в России, предлагающая широкий спектр продуктов и услуг, включая поисковую систему, облачные решения и разработки в области искусственного интеллекта. Компания активно занимается робототехникой, создавая решения, которые помогают автоматизировать множество процессов в жизни бизнеса и общества.
Основные направления работы Яндекса включают разработку технологий для автономных транспортных средств, решения для локомоции человекоподобных роботов и многое другое. Яндекс проводит активные исследования и разработки в области машинного обучения и компьютерного зрения, что делает компанию одним из лидеров в высокотехнологичных отраслях.
О вакансии
В команде локомоции человекоподобных роботов Яндекса вы будете заниматься разработкой и обучением RL-агентов, чтобы научить роботов выполнять сложные двигательные действия в реальных условиях. Основные проекты сосредоточены вокруг симуляций и тестирования моделей на гибридных физических платформах, таких как Isaac Lab и MuJoCo.
Ваша работа будет заключаться в исследовании современных методов обучения с подкреплением, адаптации идей из научных статей и их применении для решения задач локомоции. Вы будете вовлечены в проектирование симуляционных сред, анализ поведения агентов и внедрение успешных решений на реальные платформы.
Чем предстоит заниматься:
- Обучение RL-агентов, создание политик ходьбы и балансировки
- Применение современных RL-методов и адаптация их к локомоции
- Проектирование физических сцен для обучения роботов
- Анализ и улучшение поведения агентов через разраоработку метрик
- Внедрение разработанных решений на реальные платформы
Что мы предлагаем:
- Работа в команде, занимающейся передовыми технологиями в области роботов
- Доступ к ресурсам компании для обучения и развития
Обязанности
- Создание и обучение RL-агентов для локомоции роботов
- Исследование и внедрение современных методов обучения с подкреплением
- Проектирование симуляционных сред с лестницами и неровными поверхностями
- Анализ и оптимизация поведения агентов с использованием метрик
- Внедрение разработанных политик на реальные роботехники