Распознавание рукопечатных слов с помощью нейронных сетей
Аннотация
Объект исследования – рукопечатные слова.
Предмет исследования – методы и алгоритмы распознавания рукопечатных слов с помощью искусственных нейронных сетей.
Цель работы – разработать программное средство для распознавания рукопечатных слов с высокой точностью с помощью нейронных сетей.
Новизной данной работы являются исследованные алгоритмы, используемые для распознавания. А именно: сокращение весов (Weight Decay), оптимальное усечение сети (OBD) и объединение нескольких нейронных сетей с помощью усреднения их выходов (Weighted Average). Также был разработан алгоритм сегментации слова. Находятся все вертикальные линии, где есть хотя бы один черный пиксель. В результате слово делится на «полоски» с буквами. У каждой такой «полоски» находятся крайние верхние и нижние линии. В результате получаем изображения всех букв слова, которые приводятся к одному размеру.
Было обучено три нейронных сети. Первая классическим алгоритмом обратного распространения ошибки, вторая методом сокращения весов, третья методом сокращения весов и оптимальным усечением сети. Затем было сделано объединение первой и второй нейронной сети, а также объединение всех трех нейронных сетей. Также для исправления ошибок в распознанных словах были использованы словари Microsoft Office Word. В результате было разработано программное средство, которое может распознавать рукописные буквы с вероятностью от 80% до 90%.В дальнейшем разработанные алгоритмы можно использовать для исследований искусственных нейронных сетей и распознавания с помощью них образов. Данные методы и алгоритмы можно применить в тех сферах деятельности, где необходимо обрабатывать большое количество рукописных документов
Предмет исследования – методы и алгоритмы распознавания рукопечатных слов с помощью искусственных нейронных сетей.
Цель работы – разработать программное средство для распознавания рукопечатных слов с высокой точностью с помощью нейронных сетей.
Новизной данной работы являются исследованные алгоритмы, используемые для распознавания. А именно: сокращение весов (Weight Decay), оптимальное усечение сети (OBD) и объединение нескольких нейронных сетей с помощью усреднения их выходов (Weighted Average). Также был разработан алгоритм сегментации слова. Находятся все вертикальные линии, где есть хотя бы один черный пиксель. В результате слово делится на «полоски» с буквами. У каждой такой «полоски» находятся крайние верхние и нижние линии. В результате получаем изображения всех букв слова, которые приводятся к одному размеру.
Было обучено три нейронных сети. Первая классическим алгоритмом обратного распространения ошибки, вторая методом сокращения весов, третья методом сокращения весов и оптимальным усечением сети. Затем было сделано объединение первой и второй нейронной сети, а также объединение всех трех нейронных сетей. Также для исправления ошибок в распознанных словах были использованы словари Microsoft Office Word. В результате было разработано программное средство, которое может распознавать рукописные буквы с вероятностью от 80% до 90%.В дальнейшем разработанные алгоритмы можно использовать для исследований искусственных нейронных сетей и распознавания с помощью них образов. Данные методы и алгоритмы можно применить в тех сферах деятельности, где необходимо обрабатывать большое количество рукописных документов