Руководитель команды CUDA-инференса в Автономный транспорт

Компания: Яндекс

Локация: Санкт-Петербург

О компании

Яндекс — одна из ведущих IT-компаний в России, предлагающая широкий спектр услуг, включая поисковые технологии, облачные решения и системы искусственного интеллекта. Бренд активно развивает технологии для автономного вождения, стремясь улучшить безопасность и эффективность перевозок на современных автомобилях.

Компания фокусируется на использовании передовых методов машинного обучения и глубокого обучения для разработки эффективных решений в области автономного транспорта, обеспечивая высокое качество моделей для восприятия окружающей среды и планирования.

О вакансии

В команде Яндекса по автономному транспорту вы будете заниматься оптимизацией инференса нейронных сетей, направленных на автономное вождение. Основные задачи команды заключаются в обеспечении эффективного выполнения моделей на аппаратных платформах, используя современные подходы и инструменты.

Вы будете руководить направлением низкоуровневой оптимизации, отвечая за техническое руководство, формирование приоритетов и контроль выполнения проектов. Ваша работа будет включать проектирование и оптимизацию CUDA-ядр и улучшение производительности над ключевыми вычислительными блоками моделей, что имеет критическое значение для достижения максимального ускорения и эффективности использования ресурсов.

Команда также активно взаимодействует с другими подразделениями для достижения целей по улучшению производительности и оптимизации архитектуры GPU, что обогащает опыт работы и создает уникальные возможности для профессионального роста.

Чем предстоит заниматься:

Руководство командой по CUDA-оптимизации инференса
Проектирование и оптимизация CUDA-ядр
Анализ bottleneck с помощью профилировщиков и внедрение оптимизаций
Формирование технических планов и контроль исполнения проектов

Что мы предлагаем:

Работа в команде с высококвалифицированными специалистами
Участие в крупных и значимых проектах в области автономного вождения
Возможность влиять на решения в области низкоуровневой оптимизации

Обязанности

Руководство командой, занимающейся оптимизацией CUDA-инференса
Контроль исполнения проектов и достижения результатов по latency и throughput
Проектирование и оптимизация вычислительных ядер для ключевых блоков моделей
Системный анализ bottleneck с помощью профилировщиков
Формирование технических планов и приоритетов для команды

Руководитель команды CUDA-инференса в Автономный транспорт

О компании

О вакансии

Обязанности

Похожие вакансии