Альфа-Банк

Старший специалист по разработке нейронных сетей

Москвапроектная работаНе указано

О компании

Альфа-Банк - один из крупнейших частных банков в России, активно развивающий инновационные технологические решения в области финансовых услуг. Он предлагает широкий спектр продуктов, включая кредитные карты, ипотечные и потребительские кредиты, а также инвестиционные и страховые услуги. Банк активно использует современные технологии, включая нейронные сети и искусственный интеллект, для улучшения клиентского опыта и оптимизации бизнес-процессов.

Ключевые факты:

Год основания: 1990
Обороты: более 1,5 трлн рублей
Число сотрудников: более 20 000
Клиенты: более 3 миллионов частных и более 500 000 корпоративных клиентов
Награды: «Лучший банк по качеству обслуживания в России» по версии Euromoney

О вакансии

Команда разработки Альфа-Банка занимается созданием передовых решений в области обработки естественного языка и разработки нейронных сетей. В рамках команды вы будете участвовать в проектировании оркестраторов диалогов, а также в создании LLM-агентов, которые помогают пользователям эффективно взаимодействовать с банковскими услугами.

Вы будете непосредственно работать над улучшением качества NLP-моделей, используя современные подходы к машинному обучению, включая обучение моделей, их дообучение, а также оптимизацию и оценку качества. Кроме того, важным аспектом работы станет взаимодействие с другими командами для сбора требований и оценки влияния внедряемых решений на продукты банка.

Чем предстоит заниматься:

Разработка оркестратора для управления диалогами и маршрутизации запросов между компонентами ассистента.
Работа с мультиинтентными запросами: извлечение, классификация и корректная обработка нескольких намерений в одном сообщении.
Проектирование и реализация агентных систем (LLM-агенты).
Улучшение качества NLP-моделей: обучение, дообучение, оценка и оптимизация.
Анализ пользовательских диалогов и внедрение улучшений на основе данных.
Обучение моделей BERT-like и LLM.
Проектирование RAG пайплайнов.
Оптимизация моделей по latency.
Проектирование оценки качества и мониторинга решений.
Документирование архитектурных решений и экспериментов.

Что мы предлагаем:

Работа в команде профессионалов
Доступ к современным инструментам и технологиям
Участие в интересных и масштабных проектах
Обучение и повышение квалификации в области ML и AI

Обязанности

Разработка оркестратора для управления диалогами
Работа с мультиинтентными запросами
Проектирование и реализация LLM-агентов
Улучшение качества NLP-моделей
Анализ пользовательских диалогов
Обучение BERT-like и LLM моделей
Проектирование RAG пайплайнов
Оптимизация моделей по latency
Проектирование оценки качества
Документирование архитектурных решений

Требования

Всё о работе
Приведи друга
Разработка оркестратора для управления диалогами и маршрутизации запросов между компонентами ассистента.
Работа с мультиинтентными запросами: извлечение, классификация и корректная обработка нескольких намерений в одном сообщении.
Проектирование и реализация агентных систем (LLM-агенты), способных выполнять последовательности действий для решения пользовательских задач.
Улучшение качества NLP-моделей: обучение, дообучение, оценка и оптимизация.
Анализ пользовательских диалогов и внедрение улучшений на основе данных.
Обучение моделей BERT-like и LLM (PEFT, RLHF)
Проектирование и реализация RAG пайплайнов
Оптимизация моделей по latency (квантование, distillation, ONNX/TF оптимизации, Triton и т. п.
Проектирование оценки качества и мониторинга решений
Взаимодействие с командой продукта, инженерами данных и ML инженерами для сбора требований и оценки влияния решений.
Документирование архитектурных решений, экспериментов и инструкций по эксплуатации.
Опыт работы в области Data Science/ML: 3+ лет.
Практический опыт внедрения моделей в продакшен: 1+ год.
Глубокие навыки Python и распространённых библиотек: PyTorch и/или TensorFlow, Hugging Face Transformers.
Опыт с LLM/RAG: построение пайплайнов, embeddings, retrieval (FAISS/Milvus/Pinecone), LangChain/Haystack
Опыт оптимизации моделей: квантование, дистилляция, ONNX, TorchScript, Triton или аналогичные технологии.
Навыки тестирования ML (unit tests для моделей, интеграционные тесты, E2E).
Знание MLOps-инструментов: Docker, Kubernetes, CI/CD (GitLab CI/GitHub Actions), MLflow/W&B.

Старший специалист по разработке нейронных сетей

О компании

О вакансии

Обязанности

Требования

Похожие вакансии