RL+NLP Разработчик

Долгопрудный, Первомайская улица, 3Полная занятость1–3 года

О компании

Институт ИИ МФТИ является одним из ведущих институтов в России, специализирующимся на области искусственного интеллекта. В его состав входят высококвалифицированные специалисты и ключевые лаборатории, занимающиеся такими направлениями, как робототехника, компьютерное зрение и математическое моделирование. Институт активно работает над разработкой прорывных технологий и научных исследований для различных отраслей экономики страны.

Ключевые факты:

1-е место среди технических вузов России в международных рейтингах THE и CWUR (2025)
1-е место в предметном рейтинге RAEX по направлению "Информационные технологии" (2025)
1-е место в рейтинге передовых инженерных школ (2025)
1-е место в рейтинге вузов по качеству подготовки специалистов в области ИИ (2024)

О вакансии

Центр когнитивного моделирования Института ИИ МФТИ объединяет фундаментальную науку и инженерные решения для решения прикладных задач. Здесь разработка технологий востребована ведущими российскими компаниями, с публикацией результатов в авторитетных международных изданиях и на крупных конференциях, посвящённых интеллектуальным системам и робототехнике.

Лаборатория интеллектуального транспорта фокусируется на разработке технологий компьютерного зрения, активно сотрудничая с индустриальными партнёрами, и публикуя исследования в высокоимпактных журналах, таких как IEEE Transactions on ITS и Neurocomputing.

Чем предстоит заниматься:

Исследование методов асинхронного обучения с подкреплением для оптимизации reasoning-моделей
Разработка подходов на основе SAC и PPO для обучения в условиях задержек и разреженных вознаграждений
Прототипирование и эксперименты по curriculum learning для ускорения решения сложных задач
Анализ влияния low-bit представлений на качество обучения
Разработка пайплайнов и участие в создании фреймворка для асинхронного обучения
Поддержка и валидация рабочего кода, проведение сравнительных экспериментов.

Что мы предлагаем:

Работа в ведущем техническом вузе в Долгопрудном, в 15-ти минутах от метро
Оформление в соответствии с ТК РФ
Бесплатное посещение бассейна и тренажерного зала
Справка о наличии (отсутствии) судимости для оформления вуза.

Навыки

PyTorchPythonRLОбучение с подкреплениемDreamerDecision transformerBehavioral cloningDQNPPOSAC

Обязанности

Исследование методов асинхронного обучения с подкреплением для улучшения reasoning-моделей
Разработка подходов на основе SAC и PPO для устойчивого обучения
Создание прототипов и проведение экспериментов по curriculum learning
Анализ влияния low-bit представлений на качество обучения
Разработка исследовательских пайплайнов
Поддержка рабочего кода и проведение сравнительных экспериментов

Требования

Высшее техническое образование.
Знания в области статистики и теории алгоритмов.
Уверенное владение Python и PyTorch.
Опыт разработки под Linux (Ubuntu) и использования Docker.
Практика применения RL для обучения языковых моделей.
Понимание архитектуры больших языковых моделей.
Свободное владение техническим английским языком.

Условия

Работа в ведущем техническом вузе страны
Оформление в соответствии с ТК РФ
Бесплатное посещение бассейна и тренажерного зала
Необходимо предоставить справку о наличии судимости