Исследование модели нейронной сети с пространственным вниманием для классификации фракции щебня
Аннотация
Выпускная квалификационная работа магистра 54 стр., 31 рис., 5 таблиц, 41 источник.
КОМПЬЮТЕРНОЕ ЗРЕНИЕ, ФРАКЦИЯ ЩЕБНЯ, EFFICIENTNET, ПРОСТРАНСТВЕННОЕ ВНИМАНИЕ, LDAM, КЛАССИФИКАЦИЯ ИЗОБРАЖЕНИЙ
Цель данной работы заключается в исследовании моделей нейронных сетей для классификации фракций щебня в кузове грузовика, а также в улучшении точности прогнозирования по сравнению с существующими моделями.
Объект исследования: цифровые изображения щебня различных фракций в кузове грузовика.
Предмет исследования: метод классификации изображений, основанный на сверточной нейронной сети, предназначенный для автоматического определения фракции щебня.
В процессе исследования проводились: рассмотрение основных подходов классификации изображений горных пород и методов улучшения точности, таких как механизмы внимания, реализация экспериментов для оценки эффективности выбранных моделей.
По результатам проведенных экспериментов предлагается метод классификации фракции щебня на изображении с помощью архитектуры EfficientNet-B1 с использованием пространственного внимания (Spatial Attention), совмещенный с функцией потерь LDAM. Для обучения и тестирования модели использовался набор, предоставленный предприятием изготовителем щебня, из 635 изображений, разделенный на 7 фракций. Полученная модель показала высокую точность, достигнув уровня 97%.
Разработанный подход может быть адаптирован и применен в других областях, где требуется точная классификация объектов на основе изображений, таких как анализ геологических образований или распознавание различных материалов.
КОМПЬЮТЕРНОЕ ЗРЕНИЕ, ФРАКЦИЯ ЩЕБНЯ, EFFICIENTNET, ПРОСТРАНСТВЕННОЕ ВНИМАНИЕ, LDAM, КЛАССИФИКАЦИЯ ИЗОБРАЖЕНИЙ
Цель данной работы заключается в исследовании моделей нейронных сетей для классификации фракций щебня в кузове грузовика, а также в улучшении точности прогнозирования по сравнению с существующими моделями.
Объект исследования: цифровые изображения щебня различных фракций в кузове грузовика.
Предмет исследования: метод классификации изображений, основанный на сверточной нейронной сети, предназначенный для автоматического определения фракции щебня.
В процессе исследования проводились: рассмотрение основных подходов классификации изображений горных пород и методов улучшения точности, таких как механизмы внимания, реализация экспериментов для оценки эффективности выбранных моделей.
По результатам проведенных экспериментов предлагается метод классификации фракции щебня на изображении с помощью архитектуры EfficientNet-B1 с использованием пространственного внимания (Spatial Attention), совмещенный с функцией потерь LDAM. Для обучения и тестирования модели использовался набор, предоставленный предприятием изготовителем щебня, из 635 изображений, разделенный на 7 фракций. Полученная модель показала высокую точность, достигнув уровня 97%.
Разработанный подход может быть адаптирован и применен в других областях, где требуется точная классификация объектов на основе изображений, таких как анализ геологических образований или распознавание различных материалов.