Бэкенд-разработчик в команду голосовых технологий
Компания: Яндекс
Локация: Москва
О компании
Компания Яндекс — один из крупнейших IT-гигантов в России, предоставляющий широкий спектр интернет-сервисов и решений, начиная от поисковых систем до облачных технологий. Яндекс активно разрабатывает инновационные продукты, включая голосовые технологии и нейросетевые модели, что позволяет ей оставаться на переднем крае технологического прогресса и обеспечивать высокое качество своих услуг.
Ключевые факты:
- Год основания: 1997
- Более 20 000 сотрудников
- Продукты: Поиск, Алиса, Яндекс.Такси, Яндекс. маркет
О вакансии
В команде голосовых технологий в Яндексе вы будете работать над созданием и поддержкой бэкенд-инфраструктуры, необходимой для современных голосовых решений. Команда отвечает за проектирование и разработку gRPC-сервисов, оптимизацию нейросетевых моделей, что позволяет обеспечить высокую производительность и стабильность.
Сейчас голосовые технологии находятся на этапе бурного роста, что ставит перед вами задачи, связанные с интеграцией сложных моделей видения и синтеза речи. К основным продуктам, в которые будет интегрирована ваша работа, относятся Алиса и Поиск, а также другие сервисы компании.
Чем предстоит заниматься:
- Внедрение новых моделей синтеза и распознавания речи
- Разработка высоконагруженных gRPC-сервисов на C++
- Оптимизация инференса нейросетей с использованием современных движков
- Улучшение мониторинга, добавление метрик и автоматизация процессов релиза
Что мы предлагаем:
- Расширенная медицинская страховка с первого месяца работы
- Психотерапия в офисе и онлайн
- Лазерная коррекция зрения через год
- Жилищные займы с льготной ставкой
- Гибкий график работы
Обязанности
- Разрабатывать высоконагруженные gRPC-сервисы с нуля на C++
- Оптимизировать инференс современных нейросетей
- Внедрять новые модели распознавания и синтеза речи
- Участвовать в полном цикле разработки продуктов
- Повышать надёжность сервисов через улучшение мониторинга
Требования
- Знакомы с современными фреймворками для инференса LLM-моделей: SGLang, vLLM, TensorRT-LLM
- Работали с GPU NVIDIA: понимаете архитектуру GPU, разрабатывали или оптимизировали алгоритмы с использованием CUDA или Triton
- психотерапия в офисе или онлайн-сервисах;
- лазерная коррекция зрения через год работы;
- ведение беременности и роды — через два года.
Условия
- Расширенная медицинская страховка с первого месяца
- Поддержка психотерапии в офисе или онлайн
- Льготы на лазерную коррекцию зрения через год работы
- Гибкий график работы
- Льготные условия по жилищным займам