Руководитель команды CUDA-инференса в Автономный транспорт
Компания: Яндекс
Локация: Санкт-Петербург
О компании
Яндекс — одна из ведущих IT-компаний в России, предлагающая широкий спектр услуг, включая поисковые технологии, облачные решения и системы искусственного интеллекта. Бренд активно развивает технологии для автономного вождения, стремясь улучшить безопасность и эффективность перевозок на современных автомобилях.
Компания фокусируется на использовании передовых методов машинного обучения и глубокого обучения для разработки эффективных решений в области автономного транспорта, обеспечивая высокое качество моделей для восприятия окружающей среды и планирования.
О вакансии
В команде Яндекса по автономному транспорту вы будете заниматься оптимизацией инференса нейронных сетей, направленных на автономное вождение. Основные задачи команды заключаются в обеспечении эффективного выполнения моделей на аппаратных платформах, используя современные подходы и инструменты.
Вы будете руководить направлением низкоуровневой оптимизации, отвечая за техническое руководство, формирование приоритетов и контроль выполнения проектов. Ваша работа будет включать проектирование и оптимизацию CUDA-ядр и улучшение производительности над ключевыми вычислительными блоками моделей, что имеет критическое значение для достижения максимального ускорения и эффективности использования ресурсов.
Команда также активно взаимодействует с другими подразделениями для достижения целей по улучшению производительности и оптимизации архитектуры GPU, что обогащает опыт работы и создает уникальные возможности для профессионального роста.
Чем предстоит заниматься:
- Руководство командой по CUDA-оптимизации инференса
- Проектирование и оптимизация CUDA-ядр
- Анализ bottleneck с помощью профилировщиков и внедрение оптимизаций
- Формирование технических планов и контроль исполнения проектов
Что мы предлагаем:
- Работа в команде с высококвалифицированными специалистами
- Участие в крупных и значимых проектах в области автономного вождения
- Возможность влиять на решения в области низкоуровневой оптимизации
Обязанности
- Руководство командой, занимающейся оптимизацией CUDA-инференса
- Контроль исполнения проектов и достижения результатов по latency и throughput
- Проектирование и оптимизация вычислительных ядер для ключевых блоков моделей
- Системный анализ bottleneck с помощью профилировщиков
- Формирование технических планов и приоритетов для команды