Яндекс

Разработчик Inference Server на C++ в отдел ML-инфраструктуры

Минскoffice

О компании

Яндекс — одна из крупнейших IT-компаний в России, специализирующаяся на разработке технологий и сервисов в области поиска, рекламы, трансформации данных и инфраструктуры машинного обучения. Компания предлагает широкий ассортимент продуктов, включая поисковую систему, навигационные и сервисы для бизнеса. Яндекс занимает лидирующие позиции на рынке интернет-технологий, активно внедряя инновационные решения.

Ключевые факты:

Год основания: 1997
Количество сотрудников: более 10 000
Основные продукты: поисковая система, Яндекс.Бар, Яндекс.Карты, Яндекс.Маркет, Яндекс.Такси, Яндекс.Облако.
Наличие исследовательского университета (ШАД) для подготовки специалистов в области AI и ML.

О вакансии

В команде ML-инфраструктуры Яндекса открыта вакансия разработчика Inference Server на C++. Наша задача заключается в создании мощных сервисов для выполнения нейронных моделей, которые позволяют эффективно использовать вычислительные ресурсы и обеспечивают высокую скорость обработки запросов. Команда активно работает над оптимизацией использования CPU и GPU, а также разрабатывает решения для быстрого развертывания и внедрения новых моделей.

Мы стремимся предоставить ML-инженерам удобный интерфейс для интеграции нашего сервиса в их проекты. Наша команда также занимаетcя исследованием современных моделей и их внедрением в продуктивные системы, обеспечивая простоту и скорость работы.

Чем предстоит заниматься:

Разработка и оптимизация сервисов для инференса нейронных моделей.
Обеспечение высокой производительности и утилизации ресурсов при выполнении запросов.
Внедрение многоуровневого кеширования и мониторинга.
Поддержка и дообучение моделей в продакшне.

Что мы предлагаем:

Возможность работать в команде с сильнейшими специалистами.
Участие в интересных технологиях и проектах на cutting-edge технологиях.
Дружелюбная атмосфера и неформальные мероприятия.

Обязанности

разработка и оптимизация сервисов для нейронного инференса
обеспечение высокой производительности и утилизации CPU/GPU
внедрение многоуровневого кеширования в продукты
мониторинг работы сервисов
поддержка и дообучение нейронных моделей

Условия

работа в офисе в Москве
дружелюбная рабочая атмосфера
неформальные мероприятия и командные выезды
возможность участия в обсуждении технологий

Как получить эту работу — с ИИ-помощником РаботаМакс

Бесплатно поможем на каждом шаге. Нажмите, чтобы раскрыть.

Разработчик Inference Server на C++ в отдел ML-инфраструктуры

О компании

О вакансии

Обязанности

Условия

Похожие вакансии