Аналитик данных, Москва
Мы находимся в поисках Full Stack аналитика данных, который поможет сделать лучше самый масштабный рекомендательный сервис Рунета — Пульс. Мы работаем со всем контентом интернета, стараясь найти в нем лучшее, что идеально подойдет пользователю. Работаем с самыми современными технологиями, используем Kubernetes, Kafka, ClickHouse, Aerospike, Hadoop, Spark, Airflow. Наши сервисы используют миллионы пользователей в сутки, поэтому нам приходится работать с большими объемами данных и на их основании принимать решения.
Задачи
- разработка аналитических дашбордов;
- ведение и анализ A/B-тестов;
- разработка аналитических моделей;
- оптимизация запросов, витрин и пайплайнов обработки данных в ClickHouse;
- написание ad-hoc задач по аналитике и моделированию на Python и Spark (готовы обучить);
- поддержка и развитие кода заливки из Kafka и HDFS в ClickHouse на Python/Go.
Требования
- знание базовых алгоритмов и структур хранения данных, понимание принципов работы распределенных систем;
- знание Python и его инструментов для аналитики;
- уверенное знание SQL на уровне написания сложных запросов;
- опыт работы с базами данных и понимание их устройства (Clickhouse, Postgres, MongoDB, Vertica, Greenplum, Redis);
- опыт продуктовой аналитики;
- понимание основ теории вероятности и статистики.
Будет плюсом
- знание Linux / Bash / Go / Kubernetes / Airflow;
- опыт и понимание принципов работы с большими объемами данных, с применением любой из технологий, например: Spark, Hive, SQL (RDBMS) и т.д.;
- опыт построения сложных ETL-процессов;
- опыт работы с Hadoop-стеком, Spark, Java, Scala.
Мы предлагаем
Mail.ru Group

Мы делаем современные и быстрые интернет-сервисы, которые помогают миллионам пользователей. С нами люди работают, решают бытовые задачи, учатся и развлекаются. Мы делаем их жизнь радостней и удобней. Более 90% пользователей Рунета выбирают продукты Mail.ru Group.