Ведущий разработчик Inference-server в отдел ML-инфраструктуры

Компания: Яндекс

Локация: Москва

О компании

Яндекс — один из крупнейших IT-гигантов в России, который предлагает широкий спектр интернет-сервисов, включая поисковую систему, карты, почту и облачные технологии. Компания активно развивает технологии машинного обучения и искусственного интеллекта, что делает её лидером на рынке в области разработки ML-продуктов.

В подразделении, где открыта вакансия, разрабатываются высоконагруженные решения для реализации нейросетевых моделей для обработки данных в реальном времени.

Ключевые факты:

Служба из 10 специалистов
Масштабируемая команда ML-инфраструктуры
Высокие нагрузки — сотни тысяч RPS
Занимаются как базовыми технологиями, так и сервисами для ML Inference

О вакансии

Команда, занимающаяся ML-инфраструктурой в Яндексе, разрабатывает уникальные сервисы для обучения и использования нейронных моделей. Основное внимание уделяется созданию высокоэффективных решений, которые могут работать в продакшне, обеспечивая быструю обработку запросов, независимо от сложности моделей.

Команда состоит из 10 человек и активно развивается. Часть сотрудников фокусируется на внедрении технологий и поддержании сервисов, в то время как другая часть решает задачи, связанные с высоким трафиком и ресурсами. Все участники команды обладают крепкой теоретической базой и реальным опытом работы с высоконагружаемыми системами.

Чем предстоит заниматься:

Разрабатывать и улучшать сервисы для быстрого запуска нейронных моделей.
Создавать системы с многоуровневым кешированием и мониторингом.
Осуществлять интеграцию новых моделей в рабочие процессы.

Что мы предлагаем:

Работа в команде высококвалифицированных специалистов.
Возможность развиваться в области ML и AI.
Участие в командных встречах и мероприятиях, таких как вечеринки и обсуждения технологий.

Обязанности

Создание и улучшение сервиса, позволяющего запускать нейронные модели.
Обеспечение интеграции с различными проектами Яндекса для ML-инженеров.
Оптимизация работы сервисов для увеличения скорости обработки запросов.
Разработка многоуровневого кеширования и системы мониторинга.
Ведение роадмапа и руководство командой.

Условия

Офисная работа в Москве.
Дружеская атмосфера и командные мероприятия.
Возможность участия в образовательных инициативах.

Ведущий разработчик Inference-server в отдел ML-инфраструктуры

О компании

О вакансии

Обязанности

Условия

Похожие вакансии