С++ разработчик в группу надёжности Поиска в VK, Москва
Компания: VK
Локация: Москва
О компании
VK — одна из крупнейших технологических компаний в России, специализирующаяся на разработке продуктов в области социальных сетей, мессенджеров и онлайн-сервисов. Её экосистема включает в себя такие приложения, как VK, OK.ru и другие, предоставляя пользователям широкий спектр услуг — от общения до развлечений и коммерции. Компания активно развивает свои технологии и стремится к инновациям, поэтому приглашает профессионалов присоединиться к своей команде.
Ключевые факты:
- Крупная технологическая компания в России
- Разработка популярных приложений и сервисов
- Прочное положение на рынке онлайн-коммуникаций
- Многообразие проектов, включая OpenVK и другие инициативы
О вакансии
В команде надёжности Поиска в VK обеспечивается поддержка и развитие систем, отвечающих за стабильность и эффективность поиска. Команда фокусируется на создании вспомогательных сервисов диагностики, инструментов анализа инцидентов и повышении устойчивости к сбоям. Принятые здесь меры позволяют обеспечивать высокие стандарты качества и надёжности продуктов.
Специалисты работают над улучшением наблюдаемости приложений через метрики, логи и дашборды. Основная задача команды заключается в автоматизации процессов эксплуатации и реагировании на инциденты, что способствует снижению риска деградации и повышению общей надёжности системы.
В тесном сотрудничестве с другими командами Поиска, разработчики активно внедряют практики надёжности и работают над улучшением процессов, что позволяет создавать эффективные решения и достигать высоких результатов в обеспечении сервиса.
Чем предстоит заниматься:
- Разрабатывать вспомогательные сервисы надёжности для Поиска
- Улучшать наблюдаемость: метрики, логи, алертинг
- Автоматизировать эксплуатацию и процессы деплоя
- Работать с инфраструктурой, обеспечивая устойчивость к отказам
- Разбирать инциденты и деградации, участвуя в расследованиях
- Взаимодействовать с командами Поиска для внедрения практик надёжности
Что мы предлагаем:
- Участие в инновационных проектах на уровне крупной компании
- Доступ к современным инструментам и передовым практикам
- Работа в динамичной и коллегиальной среде
Обязанности
- Разработка систем диагностики и автоматических проверок
- Улучшение наблюдаемости через сбор метрик и логов
- Автоматизация процессов деплоя и откатов
- Работа с конфигурациями и сервис-дискавери
- Участие в investigations инцидентов и формирование решений
- Взаимодействие с командами для внедрения надёжности
Требования
- О компании VK Экскурсия по офису в Москве
- Экскурсия по офису в Москве
- Проекты Проекты OpenVK Секреты цифровой доступности
- Секреты цифровой доступности
- Кандидатам Как попасть в команду Стажировка в VK Условия работы
- Как попасть в команду
- Стажировка в VK
- Условия работы
- Разрабатывать вспомогательные сервисы надёжности для Поиска: системы диагностики, health-check/guardrail-компоненты, автоматические проверки, инструменты для расследования инцидентов и анализа деградаций
- Улучшать наблюдаемость: метрики, логи, трассировки, SLI/SLO, дашборды, алертинг, снижение шума и повышение полезности сигналов
- Автоматизировать эксплуатацию: деплой/роллауты, безопасные выкладки, откаты, canary/эксперименты, runbooks, автоматические действия при типовых авариях
- Работать с инфраструктурой: конфигурации, сервис-дискавери, балансировка, лимиты/квоты, управление ресурсами, устойчивость к отказам ДЦ
- Разбирать инциденты и деградации: участие в on-call/дежурствах, проведение расследований, формирование и реализация action items, улучшение процессов
- Взаимодействовать с командами Поиска: помогать внедрять практики надёжности, согласовывать требования, находить узкие места и доводить изменения до продакшена
- Уверенный опыт backend-разработки на уровне Middle-Senior
- Хорошее знание C++ и готовность писать и поддерживать production-код
- Практический опыт эксплуатации сервисов в проде: понимание, что такое latency, tail latency, отказоустойчивость, деградации, capacity, инциденты, откаты
- Навыки DevOps/SRE-подхода: мониторинг, алертинг, диагностика, автоматизация, инфраструктурное мышление
- Умение разбираться в большой кодовой базе и сложной распределённой системе, находить причины проблем, предлагать и внедрять улучшения
- Коммуникация и ответственность: умение договариваться со смежными командами и доводить инициативы до результата