Яндекс

Разработчик С++ в команду индексации еком

Санкт-Петербургhybridmiddle

О компании

Яндекс — один из ведущих IT-гигантов России, специализирующийся на разработке интернет-сервисов, включая поисковые технологии, онлайн-рекламу и облачные решения. Компания известна своими инновациями и высокими стандартами в области разработки программного обеспечения.

Ключевые факты:

  • Основана в 1997 году
  • Команда разработчиков насчитывает более 10 000 специалистов
  • Обрабатывает миллиарды запросов ежедневно
  • Официальные офисы находятся в России и за рубежом

О вакансии

В команде индексации Яндекса вы будете заниматься разработкой ключевых компонентов, связанных с краулингом и обработкой больших объемов данных. Команда нацелена на создание и поддержку систем, которые превращают разрозненные данные из интернета в структурированную базу товаров, обеспечивая актуальность информации в условиях высокой динамики.

Ваша работа будет включать реализацию стратегий обхода и обработки данных, разработку модулей для высоконагруженных сервисов на C++, а также интеграцию внешних данных из B2B-источников. Важным аспектом будет работа с YTsaurus для эффективного хранения и обработки терабайтных наборов данных.

Кроме того, вам предстоит участвовать во внедрении ML-моделей в продакшен и оптимизацию алгоритмов обработки данных, чтобы улучшить качество и быстродействие систем.

Чем предстоит заниматься:

  • Реализация стратегий планирования обхода интернета
  • Разработка модулей потоковой обработки данных на C++
  • Работа над пайплайнами хранения и обработки данных на базе YTsaurus
  • Интеграция ML-моделей в продакшен-пайплайны

Что мы предлагаем:

  • Участие в разработке крупных высоконагруженных систем
  • Возможность работать с большими данными
  • Доступ к образовательным ресурсам и программам повышения квалификации
Навыки
C++

Обязанности

  • Индексация и краулинг данных из интернета
  • Разработка стратегий обхода и приоритизации
  • Создание модулей для потоковой обработки на C++
  • Работа с YTsaurus для обработки больших объемов данных
  • Обеспечение консистентности и актуальности данных
  • Интеграция внешних B2B-источников данных
  • Внедрение ML-моделей в продакшен
  • Оптимизация алгоритмов обработки данных

Похожие вакансии

Откликнуться