Использование диффузионных моделей для аугментации данных и улучшения качества сегментации изображений (на примере модели Stable Diffusion и наборе данных Caltech-UCSD Birds-200-2011)

Морий София Михайловна

Аннотация


Выпускная квалификационная работа 61 с., 39 рис., 1 табл., 38 источников.
Ключевые слова: компьютерное зрение, семантическая сегментация, аугментация данных, сверточные нейронные сети, диффузионные модели.
Объект исследования: процесс аугментации изображений для решения задачи сегментации.
Предмет исследования: методы аугментации и машинного обучения, с помощью которых осуществляется сегментация изображений.
Цель работы: исследование эффективности генеративной аугментации изображений, выполненной с помощью диффузионной модели Stable Diffusion на примере задачи семантической сегментации.
В процессе исследования проводились: рассмотрение основных подходов сегментации изображений и методов аугментации данных, разработка и реализация экспериментов для оценки эффективности генеративной аугментации изображений.
В работе продемонстрирована эффективность подхода аугментации изображений, реализованного за счет расширения части исходного датасета путем генерирования новых данных с помощью диффузионной модели.
Область практического применения: предложенный подход может быть использован для улучшения качества работы моделей семантической сегментации изображений в условиях ограниченного количества исходных данных, дефицита размеченных данных или дисбаланса данных.