Альфа-Банк

Старший специалист по разработке нейронных сетей

Москвапроектная работаНе указано

О компании

Альфа-Банк - один из крупнейших частных банков в России, активно развивающий инновационные технологические решения в области финансовых услуг. Он предлагает широкий спектр продуктов, включая кредитные карты, ипотечные и потребительские кредиты, а также инвестиционные и страховые услуги. Банк активно использует современные технологии, включая нейронные сети и искусственный интеллект, для улучшения клиентского опыта и оптимизации бизнес-процессов.

Ключевые факты:

  • Год основания: 1990
  • Обороты: более 1,5 трлн рублей
  • Число сотрудников: более 20 000
  • Клиенты: более 3 миллионов частных и более 500 000 корпоративных клиентов
  • Награды: «Лучший банк по качеству обслуживания в России» по версии Euromoney

О вакансии

Команда разработки Альфа-Банка занимается созданием передовых решений в области обработки естественного языка и разработки нейронных сетей. В рамках команды вы будете участвовать в проектировании оркестраторов диалогов, а также в создании LLM-агентов, которые помогают пользователям эффективно взаимодействовать с банковскими услугами.

Вы будете непосредственно работать над улучшением качества NLP-моделей, используя современные подходы к машинному обучению, включая обучение моделей, их дообучение, а также оптимизацию и оценку качества. Кроме того, важным аспектом работы станет взаимодействие с другими командами для сбора требований и оценки влияния внедряемых решений на продукты банка.

Чем предстоит заниматься:

  • Разработка оркестратора для управления диалогами и маршрутизации запросов между компонентами ассистента.
  • Работа с мультиинтентными запросами: извлечение, классификация и корректная обработка нескольких намерений в одном сообщении.
  • Проектирование и реализация агентных систем (LLM-агенты).
  • Улучшение качества NLP-моделей: обучение, дообучение, оценка и оптимизация.
  • Анализ пользовательских диалогов и внедрение улучшений на основе данных.
  • Обучение моделей BERT-like и LLM.
  • Проектирование RAG пайплайнов.
  • Оптимизация моделей по latency.
  • Проектирование оценки качества и мониторинга решений.
  • Документирование архитектурных решений и экспериментов.

Что мы предлагаем:

  • Работа в команде профессионалов
  • Доступ к современным инструментам и технологиям
  • Участие в интересных и масштабных проектах
  • Обучение и повышение квалификации в области ML и AI

Обязанности

  • Разработка оркестратора для управления диалогами
  • Работа с мультиинтентными запросами
  • Проектирование и реализация LLM-агентов
  • Улучшение качества NLP-моделей
  • Анализ пользовательских диалогов
  • Обучение BERT-like и LLM моделей
  • Проектирование RAG пайплайнов
  • Оптимизация моделей по latency
  • Проектирование оценки качества
  • Документирование архитектурных решений

Требования

  • Всё о работе
  • Приведи друга
  • Разработка оркестратора для управления диалогами и маршрутизации запросов между компонентами ассистента.
  • Работа с мультиинтентными запросами: извлечение, классификация и корректная обработка нескольких намерений в одном сообщении.
  • Проектирование и реализация агентных систем (LLM-агенты), способных выполнять последовательности действий для решения пользовательских задач.
  • Улучшение качества NLP-моделей: обучение, дообучение, оценка и оптимизация.
  • Анализ пользовательских диалогов и внедрение улучшений на основе данных.
  • Обучение моделей BERT-like и LLM (PEFT, RLHF)
  • Проектирование и реализация RAG пайплайнов
  • Оптимизация моделей по latency (квантование, distillation, ONNX/TF оптимизации, Triton и т. п.
  • Проектирование оценки качества и мониторинга решений
  • Взаимодействие с командой продукта, инженерами данных и ML инженерами для сбора требований и оценки влияния решений.
  • Документирование архитектурных решений, экспериментов и инструкций по эксплуатации.
  • Опыт работы в области Data Science/ML: 3+ лет.
  • Практический опыт внедрения моделей в продакшен: 1+ год.
  • Глубокие навыки Python и распространённых библиотек: PyTorch и/или TensorFlow, Hugging Face Transformers.
  • Опыт с LLM/RAG: построение пайплайнов, embeddings, retrieval (FAISS/Milvus/Pinecone), LangChain/Haystack
  • Опыт оптимизации моделей: квантование, дистилляция, ONNX, TorchScript, Triton или аналогичные технологии.
  • Навыки тестирования ML (unit tests для моделей, интеграционные тесты, E2E).
  • Знание MLOps-инструментов: Docker, Kubernetes, CI/CD (GitLab CI/GitHub Actions), MLflow/W&B.

Похожие вакансии

Откликнуться