Разработчик формата хранения данных в динамических таблицах YTsaurus
Компания: Яндекс
Локация: Москва
О компании
Яндекс — один из крупнейших интернет-компаний в России, ориентированный на разработку и внедрение высококачественных технологий для обработки данных. Основные продукты компании включают поисковую систему, рекламные технологии, а также облачные решения и сервисы для бизнеса. Яндекс активно использует современные подходы и идеи из области разработки СУБД и распределённых систем.
Ключевые факты:
- Основан в 1997 году
- Более 10 000 сотрудников
- Обширный портфель продуктов, включая Yandex.Food, Yandex.Maps, Yandex.Music и др.
- Один из лидеров на рынке онлайн-рекламы в России
О вакансии
Наша команда занимается разработкой YTsaurus — современного инструмента для хранения и обработки данных в Яндексе. Мы работаем над тем, чтобы улучшить эффективность сервиса, особенно в обработке документных и иерархических данных. Ищем разработчика, который поможет в оптимизации форматов хранения данных, чтобы обеспечить быструю аналитику и поддержку транзакционно-аналитических задач.
Вы будете работать с иерархическим форматом данных, что включает в себя использование различных механизмов сжатия и низкоуровневую оптимизацию. Знания о SIMD-инструкциях и иерархии памяти будут необходимы для адаптации хранения данных к специфическим задачам. Также будете реализовывать аналитические индексы, такие как SMA и star-tree, чтобы усовершенствовать процесс обработки SQL-запросов.
Чем предстоит заниматься:
- Оптимизация формата хранения данных для динамических таблиц
- Анализ и применение высокоэффективных механизмов сжатия
- Адаптация кода под уровень памяти и процессора
- Построение аналитических индексов и работа с SQL-запросами
Что мы предлагаем:
- Расширенная медицинская страховка с первого месяца работы, включая стоматологию и лечение критических заболеваний
- Психотерапия в офисе или онлайн
- Льготная лазерная коррекция зрения и поддержка беременности
- Спортивные мероприятия и фитнес-программы
- Гибкий график работы и возможность удалённой работы
- Поддержка в обучении и развития карьеры через внутренние программы и конференции
Обязанности
- Оптимизация формата хранения данных для аналитических задач
- Работа с механизмами сжатия и низкоуровневыми оптимизациями
- Адаптация алгоритмов под иерархию памяти и конвейер процессора
- Разработка и реализация аналитических индексов
- Участие в процессе обработки SQL-запросов
Требования
- Умеете программировать на C++
- Знаете и продолжаете узнавать новые алгоритмы
- Любите погружаться в особенности работы железа
- Хотите строить надёжный сервис для пользователей
- Работали с низкоуровневыми оптимизациями: подгоняли алгоритм под иерархию памяти и конвейер процессора
- Разбираетесь в алгоритмах сжатия, особенно быстрого
- Знакомы с общими принципами построения СУБД и обработки SQL-запросов
- психотерапия в офисе или онлайн-сервисах;
- лазерная коррекция зрения через год работы;
- ведение беременности и роды — через два года.
Условия
- Гибкий график работы без фиксированного времени начала и конца
- Расширенная медицинская страховка
- Участие в спортивных мероприятиях и программы профессионального развития
- Льготные жилищные займы для сотрудников