Яндекс

ML-инженер в команду ядра Справочника

Москваhybridmiddle

О компании

Яндекс — ведущая IT-компания в России и за её пределами, предлагающая широкий спектр сервисов и продуктов, включая поисковые технологии, карты и такси. Справочник Яндекса представляет собой обширную платформу, которая включает информацию о миллионах организаций по всему миру.

Команда Яндекса фокусируется на постоянной актуализации данных, учитывая изменения в реальном мире, такие как закрытие кафе, перемещение офисов и устаревание телефонов. Это достигается за счёт работы с множеством источников данных, чтобы предлагать пользователям точную и актуальную информацию.

Ключевые факты:

  • Локация: Москва
  • Продукты: Поиск, Карты, Такси
  • Отрасль: IT
  • Общее количество клиентов: миллионы пользователей по всему миру
  • Объём данных: большие объёмы данных, включая миллионы организаций и миллиарды сигналов

О вакансии

В команде ядра Справочника Яндекса разрабатываются и поддерживаются технологии, связанные с обработкой и актуализацией данных о различных организациях. Команда отвечает за интеграцию данных, начиная с их получения и заканчивая публикацией в таких сервисах, как Карты.

Используемые технологии включают Python, SQL, C++ и MapReduce, что позволяет обрабатывать большие объёмы информации. Это критически важно для обеспечения точности и актуальности данных, которые необходимы пользователям для принятия решений, например, когда они ищут подходящие рестораны или планируют маршрут.

Чем предстоит заниматься:

  • Разрабатывать алгоритмы для обработки и анализа больших данных.
  • Следить за актуальностью данных, получаемых из различных источников.
  • Строить модели машинного обучения для улучшения качества информации.
  • Работать с классификаторами и ВЛМ для автоматизации обработки данных.

Что мы предлагаем:

  • Участие в уникальных проектах в области обработки данных.
  • Кросс-функциональная работа в динамичной среде.
  • Возможности для обучения и роста в области ML и анализа данных.
Навыки
SQLPythonC++

Обязанности

  • Разработка и оптимизация алгоритмов на Python и SQL
  • Обработка и анализ больших объёмов данных с использованием C++
  • Реализация моделей машинного обучения для повышения качества данных
  • Сбор и актуализация информации из различных источников
  • Формализация задач и построение гипотез для анализа данных

Похожие вакансии

Откликнуться