Выбор моделей машинного обучения для внедрения системы оценки кредитоспособности клиентов банка
Аннотация
Выпускная квалификационная работа магистра 70 с., 36 рис., 5 табл., 22 источника.
КРЕДИТНЫЙ СКОРИНГ, КРЕДИТНЫЕ РИСКИ, ДЕФОЛТ ЗАЁМЩИКА, МАШИННОЕ ОБУЧЕНИЕ, БИНАРНАЯ КЛАССИФИКАЦИЯ, ЛОГИСТИЧЕСКАЯ РЕГЕРССИЯ, СЛУЧАЙНЫЙ ЛЕС, ГРАДИЕНТНЫЙ БУСТИНГ, LIME, SHAP
Цель данной магистерской работы заключается в исследовании возможностей применения ансамблевых методов машинного обучения для оптимизации процесса и повышения точности кредитного скоринга с учетом сохранения интерпретируемости предсказания модели.
Объект исследования: информационная система оценки кредитного риска и скоринга заявок на предоставление кредита клиентам банка.
Предмет исследования: применение моделей машинного обучения и методов интерпретации результатов оценки вероятности дефолта заёмщика.
Методы исследования: логистическая регрессия, случайный лес, градиентный бустинг, SHAP, LIME, feature importance.
Результаты работы:
- Удалось построить ансамблевые модели классификации превосходящие по метрикам логистическую регрессию;
- Удалось добиться детализации локальных предсказаний для ансамблевых моделей;
- Перспектива внедрения в LIME и SHAP в качестве рекомендательного инструмента при вынесении решения по выдаче кредита заемщику
Выпускная квалификационная работа выполнена в текстовом редакторе Microsoft Word.
КРЕДИТНЫЙ СКОРИНГ, КРЕДИТНЫЕ РИСКИ, ДЕФОЛТ ЗАЁМЩИКА, МАШИННОЕ ОБУЧЕНИЕ, БИНАРНАЯ КЛАССИФИКАЦИЯ, ЛОГИСТИЧЕСКАЯ РЕГЕРССИЯ, СЛУЧАЙНЫЙ ЛЕС, ГРАДИЕНТНЫЙ БУСТИНГ, LIME, SHAP
Цель данной магистерской работы заключается в исследовании возможностей применения ансамблевых методов машинного обучения для оптимизации процесса и повышения точности кредитного скоринга с учетом сохранения интерпретируемости предсказания модели.
Объект исследования: информационная система оценки кредитного риска и скоринга заявок на предоставление кредита клиентам банка.
Предмет исследования: применение моделей машинного обучения и методов интерпретации результатов оценки вероятности дефолта заёмщика.
Методы исследования: логистическая регрессия, случайный лес, градиентный бустинг, SHAP, LIME, feature importance.
Результаты работы:
- Удалось построить ансамблевые модели классификации превосходящие по метрикам логистическую регрессию;
- Удалось добиться детализации локальных предсказаний для ансамблевых моделей;
- Перспектива внедрения в LIME и SHAP в качестве рекомендательного инструмента при вынесении решения по выдаче кредита заемщику
Выпускная квалификационная работа выполнена в текстовом редакторе Microsoft Word.