0%соответствие
Lamoda Tech

Senior Data Scientist (LLM)

Москва, Крылатская улица, 15УдалённоПолная занятость3–6 лет

О компании

Lamoda Tech — это частная IT-компания, работающая в сегменте e-commerce, специализирующаяся на модных товарах. С момента своего основания компания активно развивает технологии глубокого обучения для оптимизации процессов в области моды и стиля. Lamoda Tech внедряет инновационные решения, которые помогают миллионам пользователей находить подходящие товары через персонализированный подход.

Ключевые факты:

  • Основана в 2011 году
  • Более 50 ML-моделей внедрены в продакшн
  • Зрелый сетап разработки решений в области машинного обучения
  • Высокий уровень культуры разработки и минимальная бюрократия
  • Команда из middle и senior специалистов в области data science

О вакансии

Команда, в которую мы ищем Senior Data Scientist, активно использует глубокое обучение для создания инновационных решений в рамках Lamoda. Ваша работа будет сосредоточена на разработке LLM-стилиста, который поможет пользователям находить стильные вещи и получать советы по выбору одежды. Мы ищем профессионала, который сможет привести LLM к высокому уровню понимания стиля, что в свою очередь улучшит общий опыт клиентов.

Вы будете участвовать в полном цикле дообучения LLM, что включает в себя Continual pretraining, SFT и Preference Optimization. Ваша роль также будет включать в себя разработку алгоритмов поиска и создание внутренних бенчмарков для оценки различных языковых моделей.

Чем предстоит заниматься:

  • Обучение LLM-стилиста для поддержки диалога и помощи пользователям
  • Полный цикл дообучения LLM с применением современных методов
  • Разработка RAG пайпланов для улучшения поиска в базе знаний
  • Создание алгоритмов для визуального поиска и релевантных документов
  • Построение связи между LLM-стилистом и моделями генерации образов
  • Разработка методов оценки языковых моделей с использованием llm as judge подходов

Что мы предлагаем:

  • Гибкий график работы (гибрид/удаленно)
  • Доступ к мощным серверам с GPU и большому Hadoop-кластеру
  • Участие в создании data-driven продуктов на всех этапах
  • Возможности для предложений и внедрения новых идей
  • Персональные карьерные маршруты
  • Культура роста и обмена опытом в команде
Навыки
Big DataHadoopPySparkApache HivePythonApache AirflowSQLPyTorch

Обязанности

  • Обучение LLM-стилиста для помощи пользователям в выборе одежды
  • Проведение полного цикла дообучения LLM, включая Continual pretraining
  • Разработка RAG пайпланов для поиска документов
  • Создание retrieval алгоритмов для поиска визуальных и текстовых объектов
  • Связывание LLM-стилиста с моделями генерации образов
  • Разработка внутренних бенчмарков для оценки языковых моделей

Требования

  • Опыт работы в ML не менее 5 лет, в Deep Learning от 3 лет.
  • Уверенное владение Python и сложными SQL-запросами.
  • Опыт работы с Hadoop, PySpark и Airflow.
  • Навыки в дообучении LLM и построении RAG-пайплайнов.
  • Знания математической статистики и алгоритмов.

Условия

  • Полная занятость с гибким графиком (офис/удаленно)
  • Доступ к мощным ресерч-серверам с GPU
  • Работа в зрелом сетапе разработки ML-решений
  • Культура code review и минимальная бюрократия
  • Развитое сообщество data science и возможности для роста

Похожие вакансии

Прогноз зарплаты
000 000 ₽
00%соответствие вакансии
Откликнуться