Анализ и кластеризация клиентских данных для выявления целевой аудитории продукта
Аннотация
Пояснительная записка 58 страниц, 18 рисунков, 25 источников.
GREENPLUM, POSTGRESQL, PYTHON, КЛАСТЕРИЗАЦИЯ, K-MEANS, АНАЛИТИКА, АНАЛИЗ.
Цель работы – выявления общих и наиболее частых признаков, отличающих целевую аудиторию конкретного продукта на примере банковского сектора в рамках работы с большими данными, путем проведения аналитики данных о клиентах-пользователях продуктов и их платежах.
Объект исследования – данные клиентов, которые заключили сделки по продукту без предложений банка.
В работе рассмотрен бизнес-процесс кампаний продаж, архитектура Greenplum, экосистема Hadoop, некоторые библиотеки на языке Python, разработан класс для взаимодействия с PostgreSQL и преобразования результатов запроса в pandas.dataframe, осуществлена предобработка данных, реализована кластеризация данных с использованием машинного обучения и проанализированы полученные кластера для выделения характерных BI признаков целевой аудитории продукта.
Выпускная квалификационная работа выполнена в текстовом редакторе Microsoft Word и представлена в электронном виде.
GREENPLUM, POSTGRESQL, PYTHON, КЛАСТЕРИЗАЦИЯ, K-MEANS, АНАЛИТИКА, АНАЛИЗ.
Цель работы – выявления общих и наиболее частых признаков, отличающих целевую аудиторию конкретного продукта на примере банковского сектора в рамках работы с большими данными, путем проведения аналитики данных о клиентах-пользователях продуктов и их платежах.
Объект исследования – данные клиентов, которые заключили сделки по продукту без предложений банка.
В работе рассмотрен бизнес-процесс кампаний продаж, архитектура Greenplum, экосистема Hadoop, некоторые библиотеки на языке Python, разработан класс для взаимодействия с PostgreSQL и преобразования результатов запроса в pandas.dataframe, осуществлена предобработка данных, реализована кластеризация данных с использованием машинного обучения и проанализированы полученные кластера для выделения характерных BI признаков целевой аудитории продукта.
Выпускная квалификационная работа выполнена в текстовом редакторе Microsoft Word и представлена в электронном виде.