Тимлид в группу безопасного поиска
Компания: Яндекс
Локация: Москва
О компании
Яндекс — одна из ведущих интернет-компаний в России, предоставляющая широкий спектр продуктов и услуг, включая поисковые системы, картографические сервисы и системы управления данными. Компания активно разрабатывает технологии искусственного интеллекта и машинного обучения, что делает её значимым игроком на рынке технологий.
Команда Яндекса работает над повышение качества поиска, что включает анализ контента и алгоритмов для фильтрации нежелательной информации. Это позволяет обеспечить безопасность и интерес пользователей интернет-сервиса.
Ключевые факты:
- Основана в 1997 году
- Более 30 000 сотрудников
- Ежедневная аудитория превышает 60 миллионов пользователей
О вакансии
В команде безопасного поиска, вы будете играть ключевую роль в создании более безопасного и интересного продукта для пользователей Яндекса. Здесь фокусируются на практической реализации алгоритмов, которые исключают нежелательный контент из поисковой выдачи. Вы будете вести команду к достижению конкретных целей и принимать активное участие в разработке новых решений.
Основная задача — это формализация проблем и оцифровка метрик для оценки работы алгоритмов. Вы будете разрабатывать инструкции и разметки, а также внедрять и обучать модели, такие как LLM и VLM, что критически важно для улучшения поискового ранжирования.
Чем предстоит заниматься:
- Оцифровка проблем и контроль метрик для разработки алгоритмов
- Создание и актуализация инструкций для краудсорсинга
- Обучение моделей и внедрение их в поисковый рантайм
- Разработка процессов подготовки данных для переобучения моделей
- Проведение A/B-экспериментов для оценки эффективности алгоритмов
Что мы предлагаем:
- Участие в значимых проектах с реальным влиянием на продукт
- Доступ к современным ML-инструментам и технологиям
- Возможности для профессионального роста и развития в команде лидеров
Обязанности
- Оцифровка проблем и контроль их решения с помощью метрик
- Создание и проверка актуальности инструкций для краудсорсинга
- Разработка гибридных пайплайнов разметки с использованием CV, LLM и VLM
- Обучение LLM, VLM и CatBoost-моделей для поискового рантайма
- Подготовка данных для переобучения моделей и их применение
- Проведение A/B-экспериментов для оценки работы алгоритмов