Детекция движущегося объекта по сигналу от нескольких камер
Аннотация
Рябцев Никита Валерьевич, “Детекция движущегося объекта по сигналу от нескольких камер”: работа содержит: страниц 33, рисунков 5, таблиц 6, использованных источников 17.
Ключевые слова: компьютерное зрение, машинное обучение, нейронные сети, сверточные сети, сиамские сети, отслеживание множества объектов, обнаружение объектов, простое отслеживание в реальном времени
Целью работы является исследование задачи мультикамерного отслеживания множества объектов и создание решения данной задачи.
В рамках данной работы было проведено исследование задачи мультикамерного отслеживания множества объектов, реализованы модели машинного обучения и алгоритмы для решения данной задачи, осуществлены поиск и обработка наборов данных. Также была подготовлена кодовая база для проведения обучения моделей машинного обучения, решающих задачу определения степени сходства двух изображений. Были проведены эксперименты по использованию в итоговом алгоритме моделей, обученных на различных наборах данных, имеющих разную архитектуру и параметры. В работе использованы следующие технологии:
- язык программирования Python;
- библиотека компьютерного зрения OpenCV;
- библиотека для работы с глубокими нейронными сетями PyTorch;
- библиотека для визуализации графиков Matplotlib;
- библиотека для работы с числовыми данными Numpy;
- библиотека для работы с табличными данными Pandas.
Исходный код работы представлен в удаленном репозитории на платформе Github: https://github.com/BlackKingWhitePawn/reidentification.
Ключевые слова: компьютерное зрение, машинное обучение, нейронные сети, сверточные сети, сиамские сети, отслеживание множества объектов, обнаружение объектов, простое отслеживание в реальном времени
Целью работы является исследование задачи мультикамерного отслеживания множества объектов и создание решения данной задачи.
В рамках данной работы было проведено исследование задачи мультикамерного отслеживания множества объектов, реализованы модели машинного обучения и алгоритмы для решения данной задачи, осуществлены поиск и обработка наборов данных. Также была подготовлена кодовая база для проведения обучения моделей машинного обучения, решающих задачу определения степени сходства двух изображений. Были проведены эксперименты по использованию в итоговом алгоритме моделей, обученных на различных наборах данных, имеющих разную архитектуру и параметры. В работе использованы следующие технологии:
- язык программирования Python;
- библиотека компьютерного зрения OpenCV;
- библиотека для работы с глубокими нейронными сетями PyTorch;
- библиотека для визуализации графиков Matplotlib;
- библиотека для работы с числовыми данными Numpy;
- библиотека для работы с табличными данными Pandas.
Исходный код работы представлен в удаленном репозитории на платформе Github: https://github.com/BlackKingWhitePawn/reidentification.