Ко всем вакансиям

Инженер по обеспечению надежности генеративного ИИ

г. Москва
Инженерия и эксплуатация
25 июня 2026 г.

Чем предстоит заниматься:

  • Проектировать и развивать AI Gateway: единый доступ к внешним и внутренним LLM, маршрутизация запросов, лимиты, фоллбэки, контроль стоимости, аутентификация и ролевая модель доступа
  • Развивать платформу LLM-инференса: развертывание и эксплуатация open-source LLM, OpenAI-совместимые API, потоковая генерация, управление версиями моделей, производительность, отказоустойчивость и мониторинг
  • Развивать RAG/Retrieval -платформу: векторные и лексические индексы, гибридный поиск, версионирование индексов, сервис эмбеддингов, кэширование, фильтрация, партицирование данных и интеграции с источниками знаний
  • Развивать Agent Runtime: запуск и сопровождение агентных графов, управление состоянием, очереди асинхронных шагов, отказоустойчивость, ограничения на выполнение и контроль зацикливаний
  • Развивать MCP Gateway/Registry: подключение инструментов и контекстов, управление доступом, мониторинг вызовов инструментов, аудит действий и стандартизация интеграций
  • Автоматизировать жизненный цикл GenAI-артефактов: сборка образов агентов, CI/CD-пайплайны, интеграционные тесты с эмуляторами LLM, прогон evaluation-наборов, канареечные релизы и откаты
  • Развивать платформу оценивания качества GenAI-решений: автоматические проверки, LLM-as-judge, тестовые наборы, метрики качества генерации, качества поиска, безопасности и стабильности поведения
  • Развивать наблюдаемость GenAI-систем: трассировка запросов, вызовы LLM, вызовы инструментов, шаги агентов, метрики задержек, ошибок, качества, стоимости и потребления токенов
  • Внедрять защитные механизмы для GenAI-сервисов: проверка входов и выходов, защита от prompt injection, контроль чувствительных данных, ограничения инструментов и политики безопасного использования
  • Оптимизировать использование вычислительных ресурсов для LLM/RAG/агентных сценариев с учетом надежности, производительности, задержек и стоимости
  • Исследовать новые инструменты и подходы в GenAIOps, оценивать их применимость и внедрять там, где это повышает надежность, скорость разработки или эффективность платформы

Мы ожидаем:

  • Опыт промышленной разработки, внедрения или эксплуатации GenAI-, ML- или Data-платформ
  • Практический опыт работы с LLM-инференсом: vLLM, Text Generation Inference, Triton Inference Server, llama.cpp или аналогичные решения
  • Понимание особенностей эксплуатации LLM: задержки, throughput, batch-запросы, потоковая генерация, контекстное окно, потребление памяти, GPU-ресурсы и стоимость инференса
  • Опыт проектирования или эксплуатации API для доступа к моделям, включая OpenAI-совместимые интерфейсы, авторизацию, лимиты, маршрутизацию и отказоустойчивость
  • Понимание принципов RAG: разбиение документов на фрагменты, эмбеддинги, векторный и гибридный поиск, reranking, фильтрация, версионирование индексов и оценка качества retrieval
  • Практический опыт работы с векторными хранилищами, поисковыми движками или библиотеками поиска: FAISS, Qdrant, Milvus, OpenSearch, Elasticsearch или аналогами
  • Понимание архитектуры AI-агентов: инструменты, состояние, память, графы выполнения, асинхронная обработка, ограничения автономности и эскалация к человеку
  • Опыт запуска и сопровождения сервисов в Kubernetes: workloads, Helm, ingress, autoscaling, observability, диагностика и устранение проблем
  • Опыт настройки CI/CD для сервисов, ML- или GenAI-артефактов, желательно на базе GitLab
  • Уверенное владение Python для разработки платформенных сервисов, автоматизации, интеграций и внутренних инструментов
  • Опыт работы с Docker и OCI-образами: сборка, оптимизация, публикация и эксплуатация
  • Понимание принципов мониторинга и алертинга для GenAI-систем: трассировка, логи, метрики, качество генерации, ошибки инструментов, токены, задержки и стоимость
  • Понимание подходов к оцениванию GenAI-решений: golden datasets, regression tests, LLM-as-judge, human evaluation, метрики качества ответов и качества поиска
  • Опыт безопасной работы с секретами, токенами, сертификатами, чувствительными данными и сервисными учетными записями
  • Понимание основных рисков генеративного ИИ: галлюцинации, prompt injection, утечки данных, небезопасные инструменты, избыточная автономность агентов и неконтролируемая стоимость
  • Уверенное владение Linux: настройка, мониторинг, диагностика сетевых, ресурсных и производительных проблем

Мы предлагаем:

  • ДМС со стоматологией, телемедициной и программой поддержки ментального здоровья;
  • Страхование жизни;
  • Ежемесячные промокоды на Lamoda: два по 25%, два по 15% и в день рождения — 40%;
  • Программа привилегий и скидок от BestBenefits;
  • До 15 дней больничного в год оплачиваем в размере 100% от действующего оклада;
  • Бесплатные юридические консультации;
  • Дополнительные выходные в случае важных событий;
  • Яркие мероприятия и много неформального общения.

Развитие для каждого:

  • Опытный наставник для каждого новичка;
  • Обучение и участие во внешних конференциях;
  • Помогаем развивать личный бренд, выступать на конференциях и писать статьи;
  • Performance Review дважды в год, чтобы развиваться системно;
  • Проводим митапы и demo-дни для обмена знаниями;
  • Погружаем в fashion и каждый сезон знакомим с модными трендами.

Откликайтесь

+7
* – поля обязательные для заполнения

Выберите файл или перетащите резюме сюда
(pdf,doc,docx) Не более 10МБ

Хочу работать в Lamoda!

Выбирай подходящую вакансию в подразделении ИТ, отправляй нам своё резюме и стань частью команды Lamoda.