Вакансия: Data Scientist / Deep Learning engineer (Нейронные сети / Time series / Transformers)
Описание вакансии
Ищем эксперта Data Science (Deep Learning для временных рядов / последовательных данных) для компании из сферы финтех под задачи кредитного скоринга и рекомендательных систем.
Проект
Проект представляет собой крупный финтех, ядром линейки продуктов которого являются скоринги физлиц для оценки кредитоспособности на всех этапах жизненного цикла клиента кредитных и некредитных организаций.
Ищем DS на роль эксперта с фокусом на применение глубокого обучения в моделях скорингов физлиц.
- Мы хотим обучить нейросети (RNN, Transformer) работать с сырыми последовательностями в текущих кредитных и транзакционных данных, чтобы выявлять паттерны, недоступные классическим методам.
- Особенность наших данных неравномерные временные интервалы (irregular time intervals) между событиями, наличие цензурированных наблюдений (например, кредит ещё не закрыт) и пропусков, что требует использования специальных техник маскирования (masking) и работы с частичными последовательностями. Знание этих аспектов будет вашим преимуществом.
Команда
В направлении скоринга задействовано 10 Data Scientists (грейды middle, senior). Расширяем команду в связи с новым направлением по нейронным сетям.
- В случае успешной практики применения DL, готовы дополнительно инвестировать в развитие направления.
- Если вы хотите не просто применять готовые методы, а создавать новое, участвовать в непрерывном RnD и внедрять его в практику применения вам к нам.
Стэк
Нейронные сети для временных рядов/последовательных данных (Transformers, RNN, LSTM, GRU) + классик ML (скоринги).
Pytorch, Keras/TensorFlow, Python, pandas, numpy, matplotlib, sklearn, lgbm, xgb, Hadoop, Greenplum.
Чем предстоит заниматься
- Проведение RnD по обучению нейросетевых моделей на околосырых данных в виде последовательностей .
- Фокус на построении нейронных сетей для оценки кредитоспособности физлиц на различных этапах жизненного цикла клиента (предварительное одобрение, рассмотрение заявки, взыскание, банкротство), в дальнейшем потенциально модели склонности и эластичности, Next Best Offer Action).
- Полный цикл работы над моделью: от этапа заказа до вывода в продакшн.
- Взаимодействие с вертикалью продуктов при формализации бизнес-инициатив, защиты результата в зоне ответственности DS.
Что ожидаем от тебя
- Опыт работы не менее 3х лет в роли Data Scientist.
- Опыт работы с нейронными сетями для последовательных данных (временные ряды, транзакционные логи, поведенческие последовательности, кредитные истории).
- Знание архитектур: RNN, LSTM, GRU, Transformer (например, Time Series Transformer).
- Опыт с LLM (GPT, Llama), классический NLP (BERT) будет преимуществом, но без работы с последовательностями не является релевантным. Однако, если у вас есть также проекты с рядами и классическим ML мы будем рады рассмотреть в рамках другой вакансии.
- Опыт работы с большими объемами данных (выборки десятки млн наблюдений и тысячи событий на клиента).
- Отличное знание SQL и опыт работы с реляционными СУБД и корпоративными хранилищами данных (Greenplum, Oracle, MSSQL, PostgreSQL).
- Опыт работы в сфере финтеха (банки, МФО, кредитные бюро, крупные агрегаторы данных и т.д.) будет плюсом.
- Будет плюсом понимание модификаций внимания и подходов к сжатию последовательностей.
Что готовы предложить
- Система мотивации: фиксированный ежемесячный оклад + годовой бонус.
- Оформление по ТК РФ.
- Компания входит в реестр аккредитованных ИТ компаний.
- Удаленный формат работы (в пределах РФ!) . Офис находится в г. Москва.
- ДМС со стоматологией (с 1 рабочего дня + полис путешественника).
- Частичная компенсация фитнеса / обучения / доп. мед. услуг (лимит 25 тыс. рублей в год).
- Дополнительные дни к ежегодному отпуску (всего 31 день в году).
- Выдаем корпоративную технику (Windows, Lenovo ThinkPad).
- Возможности для роста внутри компании.
Как мы проводим собеседования
1. 25-30 минут общение с рекрутером (видео встреча).
2. 60 минут техническое интервью (видео встреча) разговор про опыт; лайвкодинг: SQL-задачи, Python-задача; блок вопросов по классическому ML.
3. 60 минут второе техническое интервью (видео встреча) теория и задачи по нейронкам.
4. Проверка документов 1-2 дня (анкета в электронном виде).
5. Оффер, обсуждение даты выхода на работу.
Мы стараемся как можно быстрее принимать решения!