SRE в команду AI Studio Yandex Cloud
Компания: Яндекс
Локация: Санкт-Петербург
О компании
Яндекс — ведущая IT-компания в России, предлагающая широкий спектр продуктов и услуг в области информационных технологий. Яндекс Cloud предоставляет инфраструктуру и инструменты, которые позволяют компаниям разрабатывать и внедрять решения на базе облачных технологий, включая машинное обучение и большие языковые модели.
Команда AI Studio разрабатывает решения, которые упрощают использование машинного обучения для клиентов с различным уровнем технической подготовки, обеспечивая доступ к передовым технологиям.
Ключевые факты:
- Основной бизнес с 1997 года
- Работает с миллионами пользователей по всему миру
- Специализируется на разработке AI-решений и облачных сервисов
- Широкий ассортимент продуктов, включая поисковые технологии и облачные сервисы
О вакансии
Команда AI Studio в Яндекс Cloud фокусируется на разработке инструментов, которые делают применение машинного обучения доступным для всех. Ваша роль как SRE будет связана с поддержкой и развитием инфраструктуры, которая стоит за этими сервисами.
Вы будете работать над автоматизацией процессов и улучшением наблюдаемости сервисов, что включает в себя помощь продуктовым командам в их внедрении. Ваша задача будет также актуализировать инфраструктуру по мере роста функциональности и увеличения числа пользователей. К примеру, вы будете заниматься автоматизацией развертывания ML-моделей.
Помимо этого, анализ и устранение неполадок высоконагруженных сервисов будет ключевой частью вашей работы. Вы будете отслеживать производительность таких систем, как YandexGPT, чтобы минимизировать количество отказов и время отклика.
Чем предстоит заниматься:
- Поддержка и развитие инфраструктуры сервисов
- Автоматизация инфраструктурных подходов и практик
- Улучшение observability сервисов
- Исследование отказов и устранение их причин
- Разработка новых сервисов по мере необходимости
Что мы предлагаем:
- Возможность работать с передовыми технологиями в сфере AI
- Поддержка профессионального развития и обучение новым навыкам
- Работа в команде экспертов своего дела
Обязанности
- Поддержка и развитие инфраструктуры сервисов
- Автоматизация существующих и создание новых инфраструктурных подходов
- Разработка решений для обеспечения observability сервисов
- Устранение неполадок и анализ причин отказов высоконагруженных сервисов
- Создание новых сервисов по мере необходимости