Команда DWH агрегирует в себе накопленную экспертизу и лучшие практики компании в области построения хранилищ данных и аналитических приложений. Мы превращаем информационный хаос в четко организованную систему, которая собирает, обрабатывает и анализирует любые объёмы данных. 

В нашей команде убеждены, что системы хранилищ данных должны упрощать работу людей — автоматизировать рутинные задачи, собирать и анализировать сырые данные, подготавливать почву для удобного и аргументированного принятия решений.

Мы ищем специалистов, которые готовы активно участвовать в разработке одного из крупнейших хранилищ группы компании: объемы данных скоро превысят 4.5 петабайт, количество узлов кластера более 150, ежедневный прирост информации составляет 1.5 – 2 тб. В хранилище собрана информация большинства ключевых бизнес-юнитов компании. Она описывает поведение пользователей рунета: события посещений сайтов, клики\показы рекламы, использование мобильных приложений, профили и действия пользователей в соц.сетях, их публичные сообщения и т.д. Все это позволяет составлять полную картину поведения пользователя во всех сервисах Mail.Ru Group и строить на полученных данных сложные математические модели.

Наш стек технологий включает, но не ограничивается:

Database Systems: MySQL, Tarantool, ClickHouse
Hadoop: Hive, Spark, MapReduce, Kafka, HBase
DataFlow / ETL: Luigi, Airflow, Jenkins
Business Inteligence: Tableau, QlikView, Redash, SuperSet
Continuous Integration: Jenkins, GitLab CI
IssueTracking / KnwoledgeBase : Jira, Confluence
Monitoring: Sentry, Graphite, Grafana, Prometheus, Telegraf