Data Engineer (команда Rec Sys)
Компания: Okko
Локация: Москва, Верхние Котлы, Крымская, Крымская, Варшавское шоссе, 9
О компании
Okko — современная платформа для потокового видео с широким ассортиментом контента, включая фильмы, сериалы и оригинальные проекты. Компания активно внедряет технологии и data-driven подходы для повышения качества своих услуг. С момента своего образования она зарекомендовала себя как один из лидеров на российском рынке видеостриминга. Вместе с командами разработки, аналитики и продуктового управления, Okko стремится улучшать пользовательский опыт и оптимизировать свои внутренние процессы в области данных и аналитики.
Ключевые факты:
- Местоположение: Москва, Верхние Котлы, Крымская, Варшавское шоссе, 9
- Численность команды в направлении рекомендаций: 2 Data Engineer
- Основные технологии: Python, SQL, ClickHouse
О вакансии
Команда по работе с рекомендациями в компания Okko активно развивает платформу данных и строит надежные пайплайны. Задачи включают как классическое ETL для аналитических витрин, так и потоковую обработку в реальном времени для машинного обучения. В команде ценят опыт и вклад каждого специалиста, который позволяет значительно повысить качество аналитики и эффективность ML-моделей.
Текущий состав команды включает двух Data Engineer, и мы ищем нового коллегу, который поддержит разработку и поможет развивать функциональности, такие как потоковая обработка данных и feature store.
Чем предстоит заниматься:
- Поддержка и разработка batch ETL-пайплайнов на Airflow для аналитических витрин и ML
- Потоковая обработка данных с использованием Spark Streaming, Kafka, MongoDB
- Развитие feature store, наполнение его фичами и интеграция данных для ML-моделей
- Документирование, оптимизация и мониторинг пайплайнов и потоков данных
Что мы предлагаем:
- Необходимое оборудование и софт для работы
- Официальное трудоустройство
- ДМС со стоматологией, офисный врач, доплата больничного листа, корпоративные скидки
- Льготные условия ипотеки в рамках зарплатного проекта
- Бесплатная подписка на сервисы партнеров
- Корпоративный спорт
- Насыщенная корпоративная жизнь
- Электронная библиотека издательства МИФ с почти 2000 единицами контента
Обязанности
- поддержка и разработка batch ETL-пайплайнов на Airflow
- потоковая обработка данных с использованием Spark Streaming
- развитие feature store и интеграция данных для ML-моделей
- документирование и мониторинг пайплайнов
- оптимизация потоков данных
Условия
- необходимое оборудование и софт для работы
- официальное трудоустройство
- ДМС со стоматологией и офисный врач
- доплата больничного листа и корпоративные скидки
- льготные условия ипотеки в рамках зарплатного проекта
- бесплатная подписка на сервисы партнеров
- корпоративный спорт
- электронная библиотека издательства МИФ