Data Scientist (NLP / LLM)
Компания: ООО Р-Вижн
Локация: Москва, Площадь Ильича, Римская, Серп и Молот, бульвар Энтузиастов, 2
О компании
Компания Р-Вижн, основанная в 2011 году, занимается разработкой современных систем цифровизации и кибербезопасности. С помощью своих технологий организация помогает клиентам эффективно защищаться от киберугроз, обеспечивая надежность IT-инфраструктуры и поддерживая цифровую трансформацию бизнеса. Их решения успешно применяются в таких секторах, как банковское дело, государственные учреждения, нефтегазовая отрасль, медиа и промышленность.
Команда компании активно развивает текущие продукты и создает новые сервисы, а также обеспечивает интеграцию своих решений в инфраструктуру клиентов, достигая значимого успеха благодаря командной работе.
О вакансии
В команде управления технологий искусственного интеллекта и анализа данных открыта вакансия Data Scientist, который будет заниматься прикладными исследованиями в области NLP и LLM. Ваша работа будет сосредоточена на разработке методов оценки качества генерации и поиска, а также на дообучении языковых моделей с использованием специфики кибербезопасности.
Команда занимается разработкой и интеграцией различных AI-сервисов, включая AI-агентов и системы, которые помогут клиентам в их задачах по защите от угроз. Важно отметить, что у нас четко разделены роли, и вы сможете сосредоточиться на математических моделях и аналитической работе, в то время как MLOps и ML-инженеры будут отвечать за инфраструктуру.
Чем предстоит заниматься:
- Разработка методик оценки качества генерации и поиска.
- Подготовка данных и дообучение языковых моделей для кибербезопасности.
- Создание специализированных языковых моделей для преобразования естественного языка в структурированные запросы.
- Проектирование логики семантического поиска по базам данных.
- Обучение моделей для извлечения сущностей из неструктурированных данных.
- Проектирование логики поведения AI-агентов.
- Проведение анализа и разметки данных.
- Применение классических методов машинного обучения для классификации и регрессии.
Что мы предлагаем:
- Удаленный формат работы.
- Конкурентная оплата труда, соответствующая уровню профессионализма.
- ДМС с полным спектром медицинских услуг и поддержка за границей.
- Компенсация больничного и дополнительный отпуск по болезни.
Обязанности
- Разрабатывать методологии оценки качества генерации и поиска для LLM.
- Подготавливать данные и дообучать языковые модели для специфики кибербезопасности.
- Создавать компактные языковые модели для NLP задач.
- Проектировать архитектуры RAG-систем для семантического поиска.
- Обучать модели для извлечения сущностей из неструктурированных данных.
- Создавать графы рассуждений для AI-агентов.
- Проводить разведочный анализ и разметку данных.
- Применять классические алгоритмы машинного обучения для задач классификации.
Условия
- Удаленный формат работы.
- ДМС со стоматологией и госпитализацией по всей России.
- 100% компенсация больничного и дополнительные дни на отгул по болезни.