Старший разработчик в команду ML-планера робота доставки (RL)
Компания: Яндекс
О компании
Яндекс — один из крупнейших технологических холдингов в России, предоставляющий широкий спектр интернет-услуг и продуктов, включая поисковую систему, карты, такси и многое другое. Крупное направление компании связано с разработкой и внедрением технологий в области искусственного интеллекта и машинного обучения.
Компания активно развивает направление доставки, в частности, роботов, которые ежедневно перевозят еду и посылки по улицам городов России.
Ключевые факты:
- Год основания: 1997
- Более 10 000 сотрудников
- Более 50 продуктов, включая Яндекс.Такси, Яндекс.Карты, Яндекс.Деньги
- Применение технологий машинного обучения в различных системах и сервисах
О вакансии
Команда ML-планера робота доставки Яндекса занимается созданием сложных моделей для планирования и прогнозирования траекторий движения. Каждый день она разрабатывает алгоритмы, которые принимают миллионы решений, управляя движением роботов на улицах. Команда активно исследует и внедряет методы Reinforcement Learning, применяя трансформерные архитектуры и мощные симуляторы для обучения.
Ваша роль будет включать поиск новых подходов для обучения RL-планера, внедрение передовых модулей и улучшение симуляционных сцен. Основная цель — развитие продакшн-пайплайна моделей, который справится с реальными вызовами на городских улицах.
Чем предстоит заниматься:
- Поиск и интеграция новых методов обучения для RL-планера
- Проектирование и внедрение модуля трансформерных моделей планирования
- Разработка новых сценариев симуляции для тренировки моделей
Что мы предлагаем:
- Уникальная возможность работать с передовыми технологиями в области ML
- Участие в проектах, имеющих реальное влияние на повседневную жизнь людей
Обязанности
- Исследование и интеграция новых подходов в обучение RL-планера
- Прототипирование и настройка алгоритмов RL
- Разработка reward-функций и сценариев обучения
- Проектирование модулей на базе трансформеров
- Ответственность за качество и стабильность обучения моделей
- Создание сложных сцен для симуляции и тестирования
- Закрытие sim-to-real gap для улучшения устойчивости планера