Разработчик ML в инфраструктуру данных для еком-сценариев
Компания: Яндекс
Локация: Санкт-Петербург
О компании
Яндекс — это ведущая IT-компания в России, известная своими инновациями в области интернет-технологий и различных сервисов для пользователей. Мы занимаемся созданием высококачественной товарной базы для рунета, индексиируя и обрабатывая огромные объемы данных, что позволяет нам предоставлять актуальную информацию для пользователей.
Среди нас более 10 000 сотрудников, работающих над разнообразными проектами, от поиска информации до разработки сложнейших алгоритмов. Мы используем передовые технологии для работы с данными, чтобы оптимизировать поиск товаров в интернете.
О вакансии
В команде, занимающейся инфраструктурой данных для e-com сценариев, основное внимание уделяется созданию эффективных решений для обработки и анализа товаров в интернет-пространстве. Мы интегрируем данные из множества источников, создаем и поддерживаем системы, обеспечивающие актуальность информации для пользователей.
Работа включает как исследовательские задачи, так и продакшн-код с использованием C++ и Python, а также реализацию решений с применением машинного обучения (ML), таких как YandexGPT, BERT и других моделей.Команда ищет опытного разработчика ML для улучшения продуктового поиска и создания удобства для пользователей.
Чем предстоит заниматься:
- Использование связей между товарами и каталогами для пополнения базы.
- Определение доступности товаров для заказа, включая мониторинг недоступных страниц.
Что мы предлагаем:
- Расширенная медицинская страховка с стоматологией и чекапами.
- Психотерапия в офисе или онлайн.
- Лазерная коррекция зрения после года работы.
- Льготные условия для отпуска по беременности через два года.
Обязанности
- Разработка и внедрение ML-моделей для товарного поиска
- Использование C++ и Python для создания продакшн-кода
- Анализ и оптимизация индексации данных
- Улучшение качества информации в базе данных
- Разработка решений для интеграции данных с внешними источниками
Требования
- Как находить новые товары в интернете?
- Как на потоке быстро понимать, что интернет-страница является товарной, и доставать из неё всю полезную информацию?
- Как приоритизировать индексацию страниц, чтобы максимизировать актуальность информации?
- Как контролировать качество данных в базе?
- Хорошо понимаете классическое ML
- Разбираетесь в NLP
- Имеете опыт продуктовой разработки
- Готовы учиться и осваивать новые технологии
- психотерапия в офисе или онлайн-сервисах;
- лазерная коррекция зрения через год работы;
- ведение беременности и роды — через два года.
Условия
- Гибкий график работы без фиксированного начала и конца дня
- Расширенная медицинская страховка, начинающая действовать с первого месяца
- Льготные условия на покупку жилья
- Доступ к внутренней образовательной платформе и менторству
- Спортивные занятия и участие в спортивных командах