Разработка сервиса многоаспектного анализа документов (на материале внутренних документов ПАО «Сбербанк»)
Аннотация
В работе описан процесс создания программного обеспечения для обработки и анализа внутренней документации ПАО «Сбербанк». Особенность подхода к анализу заключена в рассмотрении документа как единства информации и носителя. Поэтому в программе предусмотрена двухэтапная обработка: на основе признаков алгоритм осуществляет анализ визуальной структуры и анализ текста. Найденные характеристики в доработанной версии программы послужат основой тренировки модели машинного обучения для классификации документов.
Теоретической базой разработки является исследование документа как объекта документной лингвистики, основ делопроизводства и особенностей документной системы Сбербанка. В работе проведен обзор исторической траектории развития формуляров, показавший сильную зависимость между развитием сфер хозяйствования и совершенствованием формы делового документа.
Теоретической базой разработки является исследование документа как объекта документной лингвистики, основ делопроизводства и особенностей документной системы Сбербанка. В работе проведен обзор исторической траектории развития формуляров, показавший сильную зависимость между развитием сфер хозяйствования и совершенствованием формы делового документа.