Старший LLM-разработчик в команду алайнмента Alice AI LLM
Компания: Яндекс
О компании
Яндекс — крупная технологическая компания, занимающаяся разработкой различных интернет-сервисов и продуктов. В своих решениях Яндекс применяет передовые технологии, включая искусственный интеллект и машинное обучение, предлагая пользователям качественные и инновационные продукты. Команда Яндекса уже сегодня создаёт модели и системы, которыми пользуются миллионы людей по всему миру, делая акцент на полезности и безопасности своих решений.
Ключевые факты:
- Яндекс является одним из лидеров на российском рынке технологий и сервисов.
- Продукты компании, включая Alice AI, активно используют современные алгоритмы машинного обучения.
О вакансии
Команда алайнмента в Яндексе сосредоточена на создании эффективных моделей, которые находятся на стыке научных исследований и разработки практических решений. В команде вы будете работать над улучшением ассистентской модели Alice AI, что включает в себя её интеллектуальные и агентские возможности. Задачи включают не только теоретические исследования, но и их трансформацию в практические продукты, которые смогут использовать миллионы пользователей.
Ваша работа будет связана с разработкой и улучшением моделей награды, что напрямую влияет на выводы и ответы, предоставляемые моделью. Вы будете взаимодействовать с современными подходами, такими как обучение с подкреплением и использование контекстов.
Чем предстоит заниматься:
- Улучшение базовой модели Alice AI LLM
- Разработка масштабируемых моделей награды с использованием RLHF
- Укрепление reasoning-свойств моделей
- Создание RAG следующего поколения
- Оптимизация образовательных возможностей модели
- Работа с агентскими моделями
Обязанности
- Улучшать базовую модель Alice AI LLM
- Разрабатывать масштабируемые модели награды с использованием RLHF
- Усилять reasoning-свойства моделей
- Создавать модели награды для повышения точности пошагового рассуждения
- Строить RAG следующего поколения и учить модели использовать контексты
- Оптимизировать агентские модели и развивать tool-call-режим
- Улучшать модель для образовательных задач