Яндекс — один из ведущих IT-гигантов России, специализирующийся на разработке интернет-сервисов, включая поисковые технологии, онлайн-рекламу и облачные решения. Компания известна своими инновациями и высокими стандартами в области разработки программного обеспечения.
Ключевые факты:
В команде индексации Яндекса вы будете заниматься разработкой ключевых компонентов, связанных с краулингом и обработкой больших объемов данных. Команда нацелена на создание и поддержку систем, которые превращают разрозненные данные из интернета в структурированную базу товаров, обеспечивая актуальность информации в условиях высокой динамики.
Ваша работа будет включать реализацию стратегий обхода и обработки данных, разработку модулей для высоконагруженных сервисов на C++, а также интеграцию внешних данных из B2B-источников. Важным аспектом будет работа с YTsaurus для эффективного хранения и обработки терабайтных наборов данных.
Кроме того, вам предстоит участвовать во внедрении ML-моделей в продакшен и оптимизацию алгоритмов обработки данных, чтобы улучшить качество и быстродействие систем.
Чем предстоит заниматься:
Что мы предлагаем: