Ведущий разработчик Inference-server в отдел ML-инфраструктуры
Компания: Яндекс
Локация: Москва
О компании
Яндекс — один из крупнейших IT-гигантов в России, который предлагает широкий спектр интернет-сервисов, включая поисковую систему, карты, почту и облачные технологии. Компания активно развивает технологии машинного обучения и искусственного интеллекта, что делает её лидером на рынке в области разработки ML-продуктов.
В подразделении, где открыта вакансия, разрабатываются высоконагруженные решения для реализации нейросетевых моделей для обработки данных в реальном времени.
Ключевые факты:
- Служба из 10 специалистов
- Масштабируемая команда ML-инфраструктуры
- Высокие нагрузки — сотни тысяч RPS
- Занимаются как базовыми технологиями, так и сервисами для ML Inference
О вакансии
Команда, занимающаяся ML-инфраструктурой в Яндексе, разрабатывает уникальные сервисы для обучения и использования нейронных моделей. Основное внимание уделяется созданию высокоэффективных решений, которые могут работать в продакшне, обеспечивая быструю обработку запросов, независимо от сложности моделей.
Команда состоит из 10 человек и активно развивается. Часть сотрудников фокусируется на внедрении технологий и поддержании сервисов, в то время как другая часть решает задачи, связанные с высоким трафиком и ресурсами. Все участники команды обладают крепкой теоретической базой и реальным опытом работы с высоконагружаемыми системами.
Чем предстоит заниматься:
- Разрабатывать и улучшать сервисы для быстрого запуска нейронных моделей.
- Создавать системы с многоуровневым кешированием и мониторингом.
- Осуществлять интеграцию новых моделей в рабочие процессы.
Что мы предлагаем:
- Работа в команде высококвалифицированных специалистов.
- Возможность развиваться в области ML и AI.
- Участие в командных встречах и мероприятиях, таких как вечеринки и обсуждения технологий.
Обязанности
- Создание и улучшение сервиса, позволяющего запускать нейронные модели.
- Обеспечение интеграции с различными проектами Яндекса для ML-инженеров.
- Оптимизация работы сервисов для увеличения скорости обработки запросов.
- Разработка многоуровневого кеширования и системы мониторинга.
- Ведение роадмапа и руководство командой.
Условия
- Офисная работа в Москве.
- Дружеская атмосфера и командные мероприятия.
- Возможность участия в образовательных инициативах.