Программист-исследователь, Москва
Мы ищем Программиста-исследователя в команду ранжирования Поиска.
Ранжирование - это самый важный и сложный этап обработки поискового запроса, когда из миллиардов доступных в базе документов надо выбрать ровно те несколько самых релевантных, которые будут показаны пользователю. Само собой, в современных поисковых системах такая задача решается с помощью машинного обучения. У нас в Поиске@Mail.Ru уже сейчас "в бою" работает множество моделей: как простые линейные, так и самые суперсовременные нейросети. Но, как показывает практика, обучить хорошую модель - это только полдела. Очень часто самое сложное и интересное начинается потом, когда надо заставить работать эту модель в условиях по-настоящему больших данных и настоящего higload.
Задачи
- улучшение качества поисковой системы;
- разработка моделей и алгоритмов ранжирования;
- внедрение решений на основе машинного обучения.
Требования
- владение Python и C++ на рабочем уровне;
- понимание основных алгоритмов машинного обучения;
- уверенное знание основ теории вероятностей и математической статистики;
- опыт работы с классическим ML-стэком (scikit-learn, pandas, numpy, scipy) и Deep Learning фреймворками (pytorch / tensorflow);
- хорошее знание базовых алгоритмов и структур данных.
Будет плюсом
- знание Java;
- опыт обучения и внедрения современных NLP моделей (BERT / RoBERTa / GPT/ ...);
- опыт самостоятельной реализации алгоритмов машинного обучения;
- знакомство с алгоритмами обработки больших данных и парадигмой MapReduce;
- владение Linux на уровне продвинутого пользователя.
Мы предлагаем
Поиск

Поиск Mail.ru – это третья поисковая система на интернет-рынке России. Поиск понимает смысл поисковых запросов при помощи нейросетей, мы используем обширный граф знаний и компьютерное зрение, развиваем рекомендательную систему, детектируем спам и другой вредоносный контент.