ML-инженер, удаленно
Успешность игры во многом зависит от качества ее рекламы. Мы хотим создать свою рекламу для новых и уже успешных игр, где учтем опыт рекламы других наших игр и научимся использовать внутриигровую информацию оптимально с учетом наших особенностей.
Наши особенности:
адский highload. Нам нужны очень маленькие задержки перед ответом о нашей ставке в рекламном аукционе, ведь все это происходит, пока грузится страница пользователя! В перспективе нас ждут тысячи / десятки тысяч серверов, где нужно думать не только об оптимальных стратегиях, но и о том, как соптимизировать процесс, чтобы отвечать еще быстрее и тратить еще меньше серверного времени. AdTech — область, где стоимость процессорного времени на запрос сопоставима с матожиданием прибыли с него, а не отличается в тысячи раз, что ставило бы оптимальность кода на второй план;
куча R&D. Есть множество различных задач, где, вообще говоря, неизвестны оптимальные подходы. Как оптимально расходовать бюджет внутри дня/месяца? Как детектировать мошеннический трафик, который выглядит привлекательно для наших моделей, но гарантированно не ведет к конечным покупкам? Как предсказать вероятность конечного «денежного» события при том, что нам доступна для обучения лишь часть трафика (мы ведь знаем данные только там, где получили показ) и ошибка выжившего встает во весь рост? Как показывать рекламу горячим пользователям, у которых уже есть опыт в наших играх, чтобы не переманивать игроков из своих игр или подкреплять рекламой и так «денежных» пользователей, а добиваться прироста активных игроков для всех игр в совокупности? При этом AdTech — одна из самых конкурентных областей, где, решая какую-то из задач значимо лучше конкурента, можно иметь кратно разную прибыльность;
крайне редкая возможность построения подобных систем с нуля. Зачастую вас ждут уже давно существующие системы, где суть работы сводится к поднятию целевой метрики на полпроцента, и идеи ограничены уже существующей архитектурой. Здесь, в режиме стартапа (без присущих ему рисков), у вас есть возможность напрямую контролировать архитектурные решения продукта с самого начала его создания;
- быстрый карьерный рост. C развитием продукта команда будет расти кратно, а первые инженеры — органически расти вверх в комфортных зонах ответственности.
Задачи
- разработка высоконагруженных real-time сервисов;
- подготовка, анализ внутриигровых и рекламных данных;
- построение ML-моделей для предсказаний «денежных» событий, нахождение компромисса между производительностью (как обучения, так и предсказания) и точностью;
- разработка стратегий / распределенных (у нас ведь тысячи серверов, а бюджет один) систем для оптимальной траты бюджета;
- построение моделей для отсекания мошеннического трафика;
- проведение A/B-тестов для версий моделей.
Требования
- хорошая алгоритмическая подготовка: знание базовых алгоритмов и структур данных, а также того, как они реализованы в стандартных библиотеках;
- уверенное владение Java или С++ или Python, умение писать тестируемый код;
- английский язык: pre-intermediate;
- знание теории вероятностей, статистики, алгебры, численных методов и байесовских методов;
- опыт поддержки полного жизненного цикла моделей, включающий анализ сырых данных, формулирование гипотез, создание моделей, проведение экспериментов, внедрение результатов в продакшен;
- понимание и опыт практического применения алгоритмов машинного обучения: линейные алгоритмы (линейная и логистическая регрессии и т.д.), композиционные алгоритмы (случайный лес, градиентный бустинг и т.д.), нейронные сети;
- знание базовых data science Python библиотек;
- знание SQL.
Будет плюсом
- профиль на kaggle/codeforces/topcoder;опыт работы в adtech;
- опыт A/B-тестирования моделей в high-load системах и сервисах;
- опыт работы с MapReduce;
- опыт работы с базами данных под высокой нагрузкой;
- опыт разработки и отладки распределенных высоконагруженных приложений.
Мы предлагаем
MY.GAMES

Международный игровой бренд (входит в состав Mail.ru Group), лидер рынка онлайн-развлечений. Компания объединяет 11 региональных офисов в России, Европе, США и Азиатских странах, более 1800 сотрудников и 12 внутренних студий разработки.