0%соответствие
МФТИ

RL+NLP Разработчик

Долгопрудный, Первомайская улица, 3Полная занятость1–3 года

О компании

Институт ИИ МФТИ является одним из ведущих институтов в России, специализирующимся на области искусственного интеллекта. В его состав входят высококвалифицированные специалисты и ключевые лаборатории, занимающиеся такими направлениями, как робототехника, компьютерное зрение и математическое моделирование. Институт активно работает над разработкой прорывных технологий и научных исследований для различных отраслей экономики страны.

Ключевые факты:

  • 1-е место среди технических вузов России в международных рейтингах THE и CWUR (2025)
  • 1-е место в предметном рейтинге RAEX по направлению "Информационные технологии" (2025)
  • 1-е место в рейтинге передовых инженерных школ (2025)
  • 1-е место в рейтинге вузов по качеству подготовки специалистов в области ИИ (2024)

О вакансии

Центр когнитивного моделирования Института ИИ МФТИ объединяет фундаментальную науку и инженерные решения для решения прикладных задач. Здесь разработка технологий востребована ведущими российскими компаниями, с публикацией результатов в авторитетных международных изданиях и на крупных конференциях, посвящённых интеллектуальным системам и робототехнике.

Лаборатория интеллектуального транспорта фокусируется на разработке технологий компьютерного зрения, активно сотрудничая с индустриальными партнёрами, и публикуя исследования в высокоимпактных журналах, таких как IEEE Transactions on ITS и Neurocomputing.

Чем предстоит заниматься:

  • Исследование методов асинхронного обучения с подкреплением для оптимизации reasoning-моделей
  • Разработка подходов на основе SAC и PPO для обучения в условиях задержек и разреженных вознаграждений
  • Прототипирование и эксперименты по curriculum learning для ускорения решения сложных задач
  • Анализ влияния low-bit представлений на качество обучения
  • Разработка пайплайнов и участие в создании фреймворка для асинхронного обучения
  • Поддержка и валидация рабочего кода, проведение сравнительных экспериментов.

Что мы предлагаем:

  • Работа в ведущем техническом вузе в Долгопрудном, в 15-ти минутах от метро
  • Оформление в соответствии с ТК РФ
  • Бесплатное посещение бассейна и тренажерного зала
  • Справка о наличии (отсутствии) судимости для оформления вуза.
Навыки
PyTorchPythonRLОбучение с подкреплениемDreamerDecision transformerBehavioral cloningDQNPPOSAC

Обязанности

  • Исследование методов асинхронного обучения с подкреплением для улучшения reasoning-моделей
  • Разработка подходов на основе SAC и PPO для устойчивого обучения
  • Создание прототипов и проведение экспериментов по curriculum learning
  • Анализ влияния low-bit представлений на качество обучения
  • Разработка исследовательских пайплайнов
  • Поддержка рабочего кода и проведение сравнительных экспериментов

Требования

  • Высшее техническое образование.
  • Знания в области статистики и теории алгоритмов.
  • Уверенное владение Python и PyTorch.
  • Опыт разработки под Linux (Ubuntu) и использования Docker.
  • Практика применения RL для обучения языковых моделей.
  • Понимание архитектуры больших языковых моделей.
  • Свободное владение техническим английским языком.

Условия

  • Работа в ведущем техническом вузе страны
  • Оформление в соответствии с ТК РФ
  • Бесплатное посещение бассейна и тренажерного зала
  • Необходимо предоставить справку о наличии судимости

Похожие вакансии

Прогноз зарплаты
000 000 ₽
00%соответствие вакансии
Откликнуться