Data Scientist, Москва
myTracker — это маркетинговая платформа с предиктивной аналитикой для мобильных приложений, разработанная в Mail.ru Group.
Она представляет собой бесплатный инструмент для сбора и обработки данных об источниках трафика и активности пользователей в приложении. Система myTracker помогает мобильным проектам анализировать пользователей и их поведение, чтобы оперативно принимать решения относительно продукта или рекламной кампании.
Ежедневно данные о десятках миллиардов событий с 700 млн мобильных устройств поступают в систему myTracker, а затем хранятся в нескольких дата-центрах в разных странах мира. В своем технологическом стеке мы используем несколько языков разработки (Python, Go, PHP) и широкий набор систем хранения и обработки информации — как традиционные СУБД (такие как MySQL), in-memory хранилища (Tarantool), так и колоночные базы данных. Кроме того, мы используем ряд решений для работы с большим количеством данных, включая Hadoop, Kafka и другие.
Благодаря расширенной функциональности, понятному интерфейсу и отсутствию ограничений по объемам и срокам хранения данных myTracker подходит широкому кругу клиентов. Поэтому у myTracker уже сотни партнеров и тысячи клиентов по всему миру, а также амбициозные планы на рост и развитие.
Задачи
- анализ огромного объема данных (с 600 млн устройств) о пользователях в мобильных приложениях (первичный анализ, корреляции, зависимости и пр.);
- построение различных предиктивных моделей на основе машинного обучения ― начиная от регрессии и заканчивая бустингом и нейронными сетями с огромным признаковым пространством;
- анализ поведения пользователей в приложениях ― необходимо уметь находить паттерны по их действиям, чтобы строить детекции аномалий;
- выделение значимых игровых признаков на всем пуле записей внутриигровых событий. Это выполняется автоматически, без участия человека ― изучаются и исследуются гигабайты данных. Полученные результаты используются в дальнейшем в различных моделях.
Требования
- опыт решения реальных задач с применением алгоритмов машинного обучения (коммерческий опыт);
- математика, теория вероятностей, матстатистика;
- высокие навыки программирования на Python;
- научный стек Python (numpy/scipy/matplotlib/pandas);
- Linux, Bash.
Мы предлагаем
Проект myTracker

myTracker – это мультиплатформенная система аналитики и атрибуции для мобильных приложений и веб-сайтов. Это продвинутый и эффективный инструмент для сбора и обработки данных о маркетинговой активности и активности пользователей в приложении и на сайте.