DS инженер в команду Search Recall
Компания: Авито
Локация: Москва
О компании
Авито — это крупнейшая рекламная онлайн-платформа в России, специализирующаяся на размещении объявлений о продаже товаров и услуг. Площадка помогает миллионам пользователей находить нужные предложения и предоставляет возможность продавать свои товары. Авито активно развивает свои технологии, включая искусственный интеллект и машинное обучение для повышения качества поиска и удобства использования.
Немного о нас в цифрах:
- Более 40 миллионов ежемесячных пользователей
- Более 25 миллионов активных объявлений
- Более 3 миллионов размещенных товаров в день
- Команда состоит из более 3,000 специалистов
О вакансии
В команде Search Recall разрабатываются и оптимизируются технологии, отвечающие за первичное получение объявлений для поисковой выдачи. Специалисты работают над созданием систем, позволяющих выбирать релевантные товары из обширного списка позиций. В своей работе команда использует как простые логические решения, так и сложные deep learning модели.
Команда активно взаимодействует с другими подразделениями, стремясь обеспечить быструю и масштабируемую работу поиска. Главная цель — сохранить высокое качество и полезность выдачи для пользователей, начиная с момента запроса.
Чем предстоит заниматься:
- Улучшение качества векторного поиска и эксперименты с новыми архитектурами эмбеддингов
- Разработка LLM-моделей для суммаризации объявлений и обогащения данных
- Создание новых кандидатогенераторов с учетом специфики категорий и пользовательских сценариев
- Оптимизация и развитие существующих кандидатогенераторов для повышения точности поиска
- Участие в проектировании и разработке платформы для ускоренного создания кандидатов
- Подготовка данных, аналитика и формирование гипотез для улучшения качества поиска
- Разработка MLP-моделей от прототипов до продакшн-решений
- Работа с backend-сервисами на Python и Go
- Участие в проектировании новых компонентов
- Проведение A/B-тестов и анализ результатов экспериментов
Что мы предлагаем:
- Возможность влиять на опыт миллионов пользователей
- Участие в интересных и сложных задачах на большом масштабе
- Работа в сильной команде, всегда готовой помочь
Обязанности
- Улучшение качества векторного поиска и эксперименты с новыми архитектурами эмбеддингов
- Разработка LLM-моделей для суммаризации объявлений и обогащения данных
- Создание новых кандидатогенераторов с учётом специфики отдельных категорий и сценариев
- Оптимизация и развитие существующих кандидатогенераторов для повышения точности поиска
- Участие в проектировании и разработке внутренней платформы для ускоренного создания кандидатогенераторов
- Подготовка данных, аналитика и формирование гипотез для улучшения поиска
- Разработка MLP-моделей от прототипов до продакшен-решений
- Работа с backend-сервисами на Python и Go
- Запуск A/B-тестов и анализ результатов
Требования
- улучшение качества векторного поиска и эксперименты с новыми архитектурами эмбеддингов;
- разработка LLM-моделей для суммаризации объявлений и обогащения данных;
- cоздание новых кандидатогенераторов с учётом специфики отдельных категорий и пользовательских сценариев;
- оптимизация и развитие существующих кандгенов для повышения точности и покрытия поиска;
- участие в проектировании и разработке внутренней платформы для ускоренного создания и тестирования кандгенов.
- готовить данные, проводить аналитику и формировать гипотезы для улучшения качества поиска;
- разрабатывать MLP-модели — от быстрых прототипов до продакшен-готовых решений;
- работать с backend-сервисами на Python и Go, участвовать в проектировании и разработке новых компонентов;
- проявлять продуктовое мышление и оценивать влияние изменений на ключевые метрики и пользовательский опыт;
- запускать A/B-тесты, контролировать корректность экспериментов и анализировать результаты.
- имеете большой опыт в разработке на Python, понимаете основы параллельного программирования;
- обладаете уверенными навыками работы с PyTorch и успешным опытом в создании нетиповых пайплайнов обучения;
- знаете основные DL-архитектуры в своём домене, понимаете архитектуру трансформера.
- пишете на Go или любом другом строго типизированном языке;
- имеете опыт в распределённом обучении;
- имеете опыт в поисковых и рекомендательных системах;
- имеете опыт внедрения DL-моделей в продакшен и оптимизации инференса.
- возможность улучшать опыт миллионов пользователей;
- интересные и сложные задачи на большом масштабе;
- сильная команда, которая всегда готова прийти на помощь;