Middle+/Senior Data Scientist (LLM)
Компания: Ecom.
Локация: Москва, Новокузнецкая, Овчинниковская набережная, 18/1с2
О компании
Компания Ecom разрабатывает и внедряет современные решения в области электронной коммерции, предлагая разнообразные сервисы для пользователей. Они активно используют передовые технологии и алгоритмы для улучшения клиентского опыта, что позволяет им оставаться конкурентоспособными на рынке.
Команда Умного поиска Самоката фокусируется на использовании данных и машинного обучения для повышения качества поиска и предоставления ответов клиентам.
Ключевые факты:
- Локация: Москва, Новокузнецкая, Овчинниковская набережная, 18/1с2
- Опыт работы: 3-6 лет
- Стек технологий: Python, FastAPI, MLflow, Apache Airflow, PostgreSQL
О вакансии
Команда Умного поиска Самоката ищет Middle+/Senior Data Scientist для работы над улучшением качества поисковых услуг. Основная задача — анализ данных для поднятия метрик эффективности и внедрения актуальных моделей.
Специалист будет заниматься доработкой соответствующих моделей и метрик, а также написанием кода для продуктивных приложений на Python. Взаимодействие с командой происходит в оперативном режиме, с использованием передовых практик разработки и качественного анализа результатов.
Чем предстоит заниматься:
- Улучшение качества поиска и ответов, анализ ошибок и предложение гипотез.
- Доработка и улучшение RAG и эмбеддинг-моделей.
- Настройка метрик качества, включая precision/recall и LLM-as-judge.
- Проведение offline-экспериментов и доработка продового пайплайна.
- Написание production-кода и тестов на Python (FastAPI, asyncio).
- Анализ изменений, влияющих на латентность и стоимость LLM.
- Создание промптов и дообучение моделей.
Что мы предлагаем:
- Конкурентоспособная зарплата в соответствии с опытом.
- Участие в интересных проектах с использованием новейших технологий.
- Гибкий график работы.
- Возможности для профессионального роста и обучения.
Обязанности
- Анализ и улучшение качества поиска и ответов.
- Доработка RAG и эмбеддинг-моделей.
- Настройка метрик качества поисковой системы.
- Проведение offline-экспериментов.
- Написание и тестирование production-кода на Python.
- Анализ влияния изменений на latency и качество.
- Создание и дообучение промптов и моделей.