Разработка модели по определению пола владельца HTTP cookie по истории активности пользователя в интернете
Аннотация
РАЗРАБОТКА МОДЕЛИ ПО ОПРЕДЕЛЕНИЮ ПОЛА ВЛАДЕЛЬЦА HTTP COOKIE ПО ИСТОРИИ АКТИВНОСТИ ПОЛЬЗОВАТЕЛЯ В ИНТЕРНЕТЕ
Выпускная квалификационная работа содержит 64 стр., 8 табл., 19 рис., 20 источника, 2 прил.
NLP, КЛАССИФИКАЦИЯ, COOKIE, НЕЙРОННЫЕ СЕТИ, БУСТИНГ
Целью данной работы является построение модели по определению пола владельца HTTP cookie по истории активности пользователя в интернете с учетом технических ограничений. С использованием современных подходов обработки естественного языка, была реализована архитектура модели, основанная на деревьях решений, позволяющая достичь Gini 0,747. Модель была спроектирована на размеченной выборке из 206799994 строк, включающей в себя 264296 уникальных пользователей и 170823 уникальных URL хостов.
Спроектированная архитектура решения позволяет достичь требуемой скорости в 200 тыс. Запросов в секунду, когда одна модель на одной машине может обрабатывать 2.5 тыс запросов в секунду.
Выпускная квалификационная работа содержит 64 стр., 8 табл., 19 рис., 20 источника, 2 прил.
NLP, КЛАССИФИКАЦИЯ, COOKIE, НЕЙРОННЫЕ СЕТИ, БУСТИНГ
Целью данной работы является построение модели по определению пола владельца HTTP cookie по истории активности пользователя в интернете с учетом технических ограничений. С использованием современных подходов обработки естественного языка, была реализована архитектура модели, основанная на деревьях решений, позволяющая достичь Gini 0,747. Модель была спроектирована на размеченной выборке из 206799994 строк, включающей в себя 264296 уникальных пользователей и 170823 уникальных URL хостов.
Спроектированная архитектура решения позволяет достичь требуемой скорости в 200 тыс. Запросов в секунду, когда одна модель на одной машине может обрабатывать 2.5 тыс запросов в секунду.