Вакансия в архиве
Компания больше не ищет сотрудника. Посмотрите похожие предложения

Data Engineer в команду RetailReporting

в Raiffeisen Bank

от 150 000 ₽/мес на руки

📍 Москва (м. Смоленская)Можно удалённо из РФ

Специализация

Data Science / Machine Learning

Уровень

Middle-to-Senior

Команда

6 - 10 человек

АО «Райффайзенбанк» является дочерним банком Райффайзен Банк Интернациональ АГ. Работает в России с 1996 года и оказывает полный спектр банковских услуг частным и корпоративным клиентам.

Ищут Data Engineer'а, который станет частью команды Retail Reporting.

Команда Retail Reporting была создана для того, чтобы помогать коллегам из бизнеса и других команд дирекции Retail&SME решать любые задачи, связанные с платформами GDWH, Cognos, ODS, SAS и Data Lake.

Им интересно разбираться в причинах возникновения поступающих к ним задач и предлагать решения, несущие пользу для бизнеса. В последнее время банк делает большую ставку на развитие Data Lake, и именно команда Retail Reporting является соответствующим центром компетенции в рамках их дирекции.

Технологии/инструменты

SQLNoSQLOnline Analytical Processing (OLAP)Online Transaction Processing (OLTP)PythonGitUnit TestingHadoopHDFSHive

Почему рекомендуем

Возможность получение и применение уникального опыта в части построения ETL-пайплайнов на основе Open-Source технологий (Spark, Hadoop, NiFi, Airflow, Kafka, GreenPlum).

Какие задачи будут в работе

Витрины данных — проектирование, развитие и поддержка (Data Lake на Hadoop):

Подключение к Data Lake новых источников данных.
Создание витрин данных по бизнес домену Retail.
Настройка регламентной загрузки данных в витрины.

Внешние интеграции:

Настройка процессов передачи данных из Data Lake в другие системы-потребители.
Поддержка регламентных процессов.

Работа над созданием аналитического ХД на базе GreenPlum:

Участие в проектировании аналитического ХД (Core, витрины).
Реализация процессов загрузки и трансформации данных (Core, витрины).

Развитие экосистемы Data Lake:

Проектирование инструментов, облегчающих работу других продуктовых команд с Data Lake.
Помощь платформенной команде в развитии Data Lake (настройка CI/CD, автоматизация работы с метаданными, пилотирование нового функционала и т.д.).

Кого ищут

Опыт работы с SQL на уровне написания сложных запросов: знаешь, что такое оконные функции, функции ранжирования, CTE.
Знакомство с различными типами СУБД (SQL, NoSQL) и профилями их использования (OLAP, OLTP) и умение аргументированно выбрать оптимальный тип СУБД под задачу.
Опыт работы с Airflow или любым другим оркестратором.
Умение писать код на Python, пользоваться GIT, знание что такое Unit-тесты.
Опыт использования Hadoop, знание как работает YARN, как эффективно хранить данные на HDFS, умение писать запросы в Hive.
Умение писать прозрачный читающийся код, разделять его на классы, применять паттерны.
Как плюс: умение писать код на Spark и считать данные сервиса, используя его API, отсортировать, отфильтровать их и сохранить результат на HDFS.
Как плюс: опыт работы с Kafka или другим Message Broker'ом и знание основных концепций потоковой обработки данных.

Опыт работы:

Минимум 2-3 года в области создания/обогащения витрин данных.
Хорошее знание SQL — критично.

Будет плюсом:

Знание банковской предметной области (особенно в части Retail).
Опыт разработки/внедрения систем класса DWH.
Умение разбираться в CI/CD практиках и инструментах.
Возможность продемонстрировать один из своих проектов на GitHub.

Что предлагают

Эффективную среду для самореализации, профессионального роста и плодотворной работы.
Культуру гибкого мышления, высокий уровень свободы и ответственности.
Командную работу и поддержку.
Регулярное посещение тренингов, митапов и конференций (в том числе как спикер) за счет компании.
Гибкий график.
Возможность удалённой работы.
Отличный социальный пакет (ДМС со стоматологией, скидки на корпоративные продукты).
Отсутствие формализма и позитивный настрой.