Разработчик инфраструктуры LLM

Компания: Яндекс

О компании

Яндекс — одна из ведущих технологических компаний в России, активно внедряющая инновационные решения в различных областях, включая поисковые технологии и машинное обучение. Она предлагает широкий спектр продуктов и услуг, от облачных технологий до адаптивной рекламы и виртуальных ассистентов.

Яндекс постоянно стремится улучшать свои алгоритмы и инфраструктуру, чтобы обеспечивать пользователям высокий уровень сервиса и доступности. Команда разработки инференса LLM фокусируется на оптимизации и улучшении инфраструктуры для обработки больших моделей.

О вакансии

Команда, занимающаяся разработкой инфраструктуры для инференса LLM, решает сложные задачи, связанные с обеспечением высокой доступности и минимального времени отклика сервиса. Работа включает в себя оптимизацию движков инференса, что напрямую влияет на производительность и качество приложения.

Ваша основная задача будет заключаться в снижении задержек при выполнении инференса на GPU, что требует комплексного подхода к разработке и масштабированию решений.

Вы также будете заниматься созданием и улучшением инструментов для диагностики и устранения проблем, влияющих на стабильность системы, а также применять современные методы оптимизации и параллелизации алгоритмов.

Чем предстоит заниматься:

Что мы предлагаем:

Обязанности

Похожие вакансии