Определение жанровой принадлежности текстов при помощи информационных параметров
Аннотация
Настоящая работа ставит целью построение методики машинной классификации русскоязычных текстов. В настоящей работе представлены результаты оценки применимости информационных параметров для распознания жанровой принадлежности текстов. В исследовании использованы результаты, опубликованные в работах, связанных с оценкой соотношения порядка и хаоса в дискретных системах. Работа выполнена в департаменте информационных технологий ИРИТ-РтФ УрФУ.
Ключевые слова: русскоязычные тексты, информация, энтропия, синтропия, классификация.
The aim of the study is to develop a methodology for the classification of Russian-language texts. This article presents the results of assessing the applicability of information parameters for the recognition of text genres. In this work we used the results published in articles devoted to the study of the relationship of order and chaos in discrete systems. The work is performed in the department of information technologies, IRIT, UrFU.
Key words: Russian-language texts, information, entropy, syntropy, classification.
Ключевые слова: русскоязычные тексты, информация, энтропия, синтропия, классификация.
The aim of the study is to develop a methodology for the classification of Russian-language texts. This article presents the results of assessing the applicability of information parameters for the recognition of text genres. In this work we used the results published in articles devoted to the study of the relationship of order and chaos in discrete systems. The work is performed in the department of information technologies, IRIT, UrFU.
Key words: Russian-language texts, information, entropy, syntropy, classification.