ML-разработчик в команду ускорения инференса
Компания: Яндекс
О компании
Яндекс — одна из крупнейших IT-компаний в России, работающая в различных областях, включая поиск, облачные технологии и искусственный интеллект. Компания активно развивает свои продукты, внедряя алгоритмы машинного обучения для максимально эффективного использования данных и повышения качества сервиса.
Яндекс ожидает, что его решения помогут не только пользователям, но и бизнесу, делая их более удобными и инновационными. Команда по ускорению инференса ML ищет инженера, способного преодолеть вызовы, связанные с оптимизацией алгоритмов и снижением затрат на ресурсы.
Ключевые факты:
- Год основания: 1997
- Штаб-квартира: Москва
- Среднее количество пользователей в месяц: более 50 миллионов
- Лидирующие позиции в области поиска и технологий ИИ
О вакансии
Команда Яндекса по ускорению инференса активно работает над оптимизацией и внедрением ML-моделей в различные сервисы компании. Они стремятся уменьшить затраты на ресурсы для инференса моделей, что особенно критично при больших объемах данных. Ищется ML-разработчик с опытом, который сможет работать с новыми архитектурами и проводить эксперименты по ускорению инференса.
В рамках этой роли инженеру предстоит погружаться в научные статьи, систематизировать их, внедрять новые методы и разработать универсальные инструменты для переиспользования в команде ML-инженеров Яндекса. Это позволит не только улучшить качество моделей, но и повысить их производительность.
Чем предстоит заниматься:
- Анализировать и систематизировать более 20 научных статей по ускорению инференса
- Применять методы к Alice AI LLM, проводить эксперименты и подтверждать их практическую применимость
- Разрабатывать универсальные ML-инструменты для внутреннего использования в Яндексе
Что мы предлагаем:
- Работа в комфортной офисной среде в Москве
- Доступ к актуальным ресурсам и обучению для повышения квалификации
- Участие в интересных проектах на переднем крае технологий искусственного интеллекта
Обязанности
- Анализировать и систематизировать научные статьи по ускорению инференса
- Проводить эксперименты и проверять гипотезы для Alice AI LLM
- Разрабатывать универсальные решения для переиспользования внутри команды