Старший Data Scientist в команду Поиска
Компания: Авито
Локация: Москва
О компании
Авито является лидером на российском рынке онлайн-объявлений, предлагая широкий спектр услуг для покупателей и продавцов. В компании активно внедряются современные технологии, включая AI и машинное обучение, для улучшения пользовательского опыта и оптимизации процессов.
Немного о нас в цифрах:
- Лидер на рынке онлайн-объявлений в России
- Множество уникальных предложений по товарам и услугам
- Софтуерные решения с использованием передовых технологий AI
О вакансии
В команде Поиска Авито мы разрабатываем новые подходы к улучшению поиска товаров и объявлений. Наша основная задача заключается в создании более интеллектуального AI-ассистента, который повышает удовлетворенность покупателей.
Как старший Data Scientist, вы будете значительно вовлечены в весь процесс разработки. Это включает сбор и подготовку данных, создание и внедрение моделей, а также оценку их эффективности. Мы стремимся привлечь специалиста с опытом в RAG-системах, который сможет внести свежий взгляд и оптимизировать наши процессы.
Чем предстоит заниматься:
- Разрабатывать RAG для товаров и отдельных объявлений
- Обучать и внедрять модели векторного поиска
- Создавать пайплайн валидации для ассистентного поиска
Что мы предлагаем:
- Участие в инновационных проектах с использованием AI
- Возможность работать в дружелюбной и опытной команде
- Конкурентные условия работы и развития
Обязанности
- Разрабатывать RAG для товаров и отдельных объявлений
- Обучать и внедрять модели векторного поиска
- Построить пайплайн валидации для ассистентного поиска
Требования
- Разработка RAG для товаров и отдельных объявлений;
- Обучение и внедрение моделей векторного поиска;
- Построение пайплайна валидации для ассистентного поиска.
- Имеете большой опыт в разработке на Python, понимаете основы параллельного программирования;
- Обладаете уверенными навыками работы с PyTorch и успешным опытом в создании нетиповых пайплайнов обучения;
- Знаете основные DL-архитектуры в своём домене, понимаете архитектуру трансформера;
- Обладаете кругозором в области LLM и умеете отличать промптинг от обучения, обучение от дистилляции, а дистилляцию от квантизации.