Мы в поиске SeniorData Scientist в команду Ranking&Recommendations.
Чем предстоит заниматься:
Развивать модели ранжирования товаров в каталоге/поиске, в том числе персонализацию, добавлять онлайн факторы (по текущей сессии), адаптировать ранжирование для новых пользователей
Улучшать алгоритмы построения товарных и пользовательских рекомендаций, персонализировать рекомендации, разрабатывать новые алгоритмы рекомендаций, которые будут полезны пользователям (в том числе с использованием Computer Vision)
Хорошо выстроенные процессы: квартальное планирование по методологии OKR, двухнедельные спринты, регулярные стендапы и проектные встречи для синхронизации.
Сильная команда middle и senior специалистов, развитое DS-сообщество, где есть возможность обмениваться знаниями на внутренних митапах
У нас представлен полный жизненный цикл разработки data-driven продуктов с применением ML — от идеи и генерации гипотез до запуска АБ тестов. В части разработки онлайн-сервисов и деплоя моделей нам помогает команда инженеров.
Мы ожидаем:
Опыт в области анализа данных и машинного обучения (от 2 лет);
Опыт работы с SQL, Hadoop, Hive, Spark;
Владение Python, Linux, методами работы с большими данными;
Опыт работы как минимум с 2 ML библиотеками: Scikit-learn, Vowpal Wabbit, XGBoost, Cat Boost, TensorFlow, Spark ML;
Знания теории вероятностей и математической статистики;
Знания в области машинного обучения, прогнозного моделирования и методов статистического анализа;
Знание алгоритмов и структур данных;
Высшее образование в области прикладной математики, информационных технологий, информатики и т.п;
Английский язык на уровне технического чтения и профессионального общения.
Как мы работаем:
Пишем на Python 3.6+ и PySpark 3.0;
Для ресерча доступны два сервера (80 cores, 650Gb RAM), на которых развернут JupyrerHub и есть доступ к Hadoop-кластеру;
Код с логикой ML-пайплайнов упаковываем в Docker и выкатываем, используя CI/CD-инструменты с запуском code style проверок и тестов;
Используем Airflow для управления ML-пайплайнами и запуском их по расписанию;
В командах есть культура code review как для изменений по части продакшен-пайплайнов, так и для ресерч-задач;
Регулярно проводим командные брейнштормы с целью генерации новых идей по развитию наших data-driven продуктов;
В компании внедрена культура принятия решений на основании данных и все изменения тестируем через АБ-эксперименты.
Вот чем заинтересуем
Интересной работой
Гибридный или удаленный формат работы на выбор
Скидка на каталог Lamoda от 15% до 40%
Мы компенсируем 15 дней больничного, чтобы не терять в зарплате
Социальным пакетом
ДМС со стоматологией с первых дней
Страхование жизни, в т.ч. в путешествиях
Разовая компенсация сотрудникам, которые выходят на удаленный или гибридный формат работы
И комфортными условиями
6 000 привилегий и скидок от партнеров
Корпоративная библиотека MyBook
Оплата такси для тех, кто задержался в офисе
В офисе у нас есть спорт зал с силовой и кардио-зоной, а так же зал для йоги
Коворкинг в Санкт-Петербурге
Кое-что интересное
Каждого новичка встречает buddy и помогает с адаптацией
Performance Review дважды в год
Внешнее обучение на конференциях или на курсах
Помогаем развивать личный бренд, выступать и писать статьи
Развиваем культуру обмена знаниями, проводим митапыи demo-дни