Senior Data Scientist (NLP) в команду моделей и сервисов для ИИ-ассистентов
Компания: Wildberries
Локация: Москва
О компании
Wildberries — это международная технологическая компания, созданная в результате объединения IT-компании Wildberries и оператора наружной рекламы Russ. Компания занимает прочные позиции на рынке, внедряя инновационные технологии в различные сферы, включая системы на базе машинного обучения и глубокого обучения для автоматизации взаимодействия с пользователями.
Команда Wildberries активно разрабатывает и реализует проекты, направленные на улучшение пользовательского опыта, включая автоматизацию поддержки клиентов и разработку интеллектуальных ассистентов на основе LLM. Члены команды могут участвовать в профильных конференциях и обучениях, что способствует их профессиональному развитию.
Ключевые факты:
- Объединенная компания Wildberries и Russ
- Лидер в автоматизации коммуникаций с пользователями
- Активное участие в профильных конференциях
- Внутренние программы обучения для специалистов Data Science
- Возможность работы с высоконагруженными ML-сервисами
О вакансии
В команде Wildberries открыт набор на позицию Senior Data Scientist (NLP), где специалист будет заниматься созданием и обучением моделей машинного обучения, в том числе NLP, для обработки текстовых запросов пользователей. Основная задача — оптимизация существующих ML-решений и интеграция LLM в бизнес-процессы компании.
Команда активно работает над автоматизацией поддержки, включая проектирование архитектуры решений и выкатку их в продакшен. Важное направление работы включает продуктивизацию решений с большой языковой моделью (LLM), что требует высокого уровня навыков в анализе данных и машинном обучении.
Чем предстоит заниматься:
- Создавать и обучать модели машинного обучения для понимания текстовых запросов
- Оптимизировать кодовую инфраструктуру для ML-сервисов с LLM
- Участвовать в проектировании архитектуры решений и проводить код-ревью
- Использовать историю взаимодействия с пользователем для улучшения моделей
Что мы предлагаем:
- Участие в профильных конференциях
- Возможности для профессионального роста через внутренние обучающие программы
- Разнообразные проекты по автоматизации и внедрению технологий
Обязанности
- Создание и обучение моделей машинного обучения для обработки текстов
- Оптимизация инфраструктуры для машинного обучения с LLM
- Проектирование архитектур решений и проведение код-ревью
- Использование пользовательских данных для улучшения моделей
- Поддержка высоконагруженных ML-сервисов
Требования
- Все вакансии
- Попасть в команду
- Строительство
- Сервисные позиции
- Все вакансии
- Попасть в команду
- Строительство
- Сервисные позиции
- Использовать историю взаимодействия с пользователем для улучшения моделей;
- Создавать и обучать модели машинного обучения и NLP для понимания и обработки текстовых запросов пользователей;
- Заниматься продуктивизацией решений с LLM под капотом, масштабировать и оптимизировать кодовую инфраструктуру;
- Участвовать в проектировании архитектуры решений, проводить код-ревью, отвечать за выкатку решений в прод.
- Опыт разработки, вывода в прод и поддержки высоконагруженного ML-сервиса с LLM;
- Опыт в области анализа данных и машинного обучения от 3х лет;
- Знание Python, методов работы с большими данными;
- Опыт работы с библиотеками: HuggingFace, PyTorch, transformers, accelerate, vllm, LangChain, LlamaIndex, FastAPI, asyncio;
- Опыт работы с LLM (использование для решения бизнес-задач, fine-tuning / обучение);
- Знание теорий вероятностей и математической статистики;
- Знание алгоритмов и структур данных.
- Обучение и развитие: языковые клубы, собственный корпоративный университет, программы развития управленческих навыков и многое другое;
Условия
- Гибкий график работы
- Обучение и развитие через корпоративный университет и языковые клубы
- Участие в профильных конференциях