Кластеризация пользователей на основе анализа данных о поведении в интерфейсе интернет-банка

Черепанова Анна Евгеньевна

Аннотация


Целью данной работы является анализ поведения пользователей в разделе интернет-банка на основе кластеризации и выявление различных паттернов поведения, привычек при создании рублевого платежа.
В ходе работы были решены следующие задачи:
1. изучены возможные методы кластеризации. Определен наиболее оптимальный алгоритм для данной работы - метод ближайшего соседа
2. освоена организация данных. Определены данные, необходимые для анализа, изучены особенности работы с ними
3. подготовлены данные для кластеризации. Написан запрос, составляющий цепочки поведения пользователей в рамках одной сессии
4. реализован алгоритм кластеризации с метрикой расстояния Левенштейна и алгоритмом метода ближайшего соседа
5. проанализированы кластеризованные данные, выявлены поведенческие паттерны при работе с формой рублевого платежа
6. проверены гипотезы. Большинство из них были подтверждены, но часть опровергается, что говорит о текущей недостаточной изученности поведения пользователей

Сделаны выводы:
1. пользователи чаще всего при заполнении платежа меняют только суму или назначение
2. пользователи не редактируют поля по несколько раз
3. пользователи чаще подписывают платежи сразу при создании, чем сохраняют их
4. большинство платежей для ЮЛ, то есть расчетов с контрагентами
5. пользователи не очищают поля, а редактируют их