Предсказание кредитных рисков с помощью машинного обучения

Чераева Олеся Руслановна

Аннотация


Выпускная квалификационная работа 64 с., 20 рис., 8 табл., 46 источников.
КРЕДИТНЫЙ РИСК, ФИНАНСОВЫЙ ДЕФОЛТ, МЕТОДЫ МАШИННОГО ОБУЧЕНИЯ, НЕСБАЛАНСИРОВАННОСТЬ КЛАССОВ
Данная дипломная работа состоит из трех глав и посвящена предсказанию кредитных рисков с помощью методов машинного обучения, в частности, поиску наиболее эффективной для предсказания кредитного риска модели.
Был проведен анализ научной литературы в целях выявления наиболее популярных в данной сфере моделей, а также наборов данных, которые могут быть использованы для их последующего обучения.
Найденные наборы, содержащие в себе данные о кредитном риске, были проанализированы, преобразованы, нормализованы и отправлены на обучение нескольких моделей: логистическая регрессия, дерево решений, случайный лес, метод опорных векторов, метод k-ближайших соседей, XGBoost и CatBoost.
При обучении упомянутых ранее моделей учитывался дисбаланс между классами кредитного риска – рассмотрены методы борьбы с несбалансированными классами.
Полученные в ходе работы результаты представили в виде таблиц со значениями метрик.
Работу некоторых рассмотренных моделей машинного обучения удалось интерпретировать с помощью библиотеки SHAP.
В заключении данного исследования был сделан вывод о том, какие из рассматриваемых моделей показали наивысшие результаты при определении кредитного риска.