Построение модели классификации онкологических новообразований молочной железы на основе числовых данных

Мошков Александр Андреевич

Аннотация


Цель работы – построение классификационной модели для определения точности постановки диагноза.
Анализ исходных признаков обучающей подвыборки проводился и помощью корреляционного анализа.
Анализ исходных признаков показал, что ряд признаков (radius, perimeter, area, compactness, concavity, concavepoint) имеют функциональную взаимосвязь.
Бинарные модели классификаторов (логистическая регрессия, случайный лес, чрезвычайно случайны деревья, поддержка опорных векторов, градиентный бустинг, адаптивный бустинг) были построены для обработанного набора данных.
Результатом работы классификаторов является оценка качества работы каждого классификатора.
На тестовом наборе данных проведен анализ качества классификации для построенных моделей (логистическая регрессия, случайный лес, чрезвычайно случайны деревья, поддержка опорных векторов, градиентный бустинг, адаптивный бустинг).
Для определения качества классификации построенных моделей использовалась график ROC-кривой с параметром AUC для каждого классификатора.