Разработчик Inference Server на C++ в отдел ML-инфраструктуры
Компания: Яндекс
Локация: Минск
О компании
Яндекс — одна из крупнейших IT-компаний в России, предоставляющая широкий спектр услуг, включая поисковую систему, облачные решения и музыкальные сервисы. Компания активно развивает направление машинного обучения, создавая технологии, с помощью которых пользователи могут использовать различные AI-сервисы в своих проектах.
Команда Яндекса включает специалистов из сильнейших вузов, что обеспечивает высокий уровень экспертизы и инноваций в области разработки ПО. Яндекс нацелен на расширение своих ML-технологий и создание удобного интерфейса для пользователей.
Ключевые факты:
- Один из лидеров в IT-отрасли России
- Более 10 000 сотрудников
- Сервисы используются миллионами пользователей ежедневно
- Активное развитие в сфере машинного обучения
О вакансии
Наша команда разрабатывает передовые сервисы для упрощения внедрения и использования нейронных моделей в продуктивной среде. Мы нацелены на создание доступных сервисов, которые могут легко использоваться ML-инженерами в любых проектах. Наша работа включает разработку технологий, обеспечивающих высокую производительность, низкую задержку и высокую утилизацию ресурсов CPU и GPU.
Команда состоит из 10 человек и активно масштабируется для достижения амбициозных целей. Наша работа построена так, чтобы внедрение сервисов было эффективным и удобным для всех подразделений компании. Мы также заняты в области разработки ML Inference-сервисов для рекламы, где приложения сталкиваются с высокими нагрузками и требуют эффективного использования аппаратных ресурсов.
Чем предстоит заниматься:
- Участие в разработке сервисов для обработки нейронных моделей
- Оптимизация производительности запросов к моделям
- Работа с многоуровневыми системами кеширования и мониторинга
- Упрощение процесса доставки новых моделей для пользователей
- Содействие в повышении утилизации ресурсов CPU/GPU
Что мы предлагаем:
- Работа в дружной команде экспертов
- Возможность участвовать в сложных и ответственных проектах
- Участие в мероприятиях, обсуждающих новшества в технологиях
- Совместные выездные мероприятия для расширения команды
Обязанности
- Участвовать в разработке сервисов для ML-инфраструктуры
- Оптимизировать производительность нейронных моделей
- Обеспечивать удобство и доступность сервисов для ML-инженеров
- Создавать решения для высоких нагрузок и кэширования
- Работать с системой мониторинга и дообучения моделей
Условия
- Работа в офисе в Москве
- Возможность участия в выездных мероприятиях
- Совместные мероприятия для улучшения командной атмосферы