Разработчик в Reliability Tools Yandex Cloud
Компания: Яндекс
Локация: Москва
О компании
Яндекс — одна из ведущих технологических компаний в России, специализирующаяся на разработке интернет-сервисов и решений в области IT. Компания предлагает широкий спектр продуктов, включая поисковую систему, онлайн-рекламу, облачные технологии и другие платформы, активно используемые миллионами пользователей.
Среди ключевых направлений Яндекса — разработка инструментов на базе облачных технологий, где команда Reliability Tools вносит значительный вклад в надежность и эффективность сервисов.
О вакансии
Команда Reliability Tools работает над системами, обеспечивающими высокую производительность и надежность облачных сервисов Яндекс. Ваша роль будет заключаться в развитии и поддержке критически важных инструментов для мониторинга и анализа, а также в оптимизации CI/CD процессов.
Вы будете взаимодействовать с командами для создания эффективных решений, которые улучшат уровень надежности и качества услуг, предоставляемых Яндекс Cloud. На текущий момент важным проектом является система агрегации данных по SLI, а также аналитика качества алертов, что является основным в улучшении мониторинга.
Важным аспектом вашей работы также будет настройка и развитие инфраструктуры, включая работу с Kubernetes и настройку процессов CI/CD для новых сервисов.
Обязанности
- Разработка и поддержка системы агрегации данных по SLI для сервисов Яндекс Cloud
- Проектирование и развитие системы аналитики качества алертов
- Настройка CI/CD процессов для новых сервисов
- Отладка сервисов в Kubernetes
- Сбор и анализ метрик надежности
Требования
- Разрабатывали и поддерживали отказоустойчивые системы
- Выстраивали и эксплуатировали CI/CD-процессы для сервисов, использовали концепцию Infrastructure as Code
- Умеете хорошо писать код на Golang и/или Kotlin
- Знаете, как построить идеальный мониторинг
- Любите улучшать процессы и автоматизировать задачи, писали сервисы и утилиты для автоматизации