Особенности языка дари на фоне персидского: опыт компьютерно-лингвистического исследования
Аннотация
В Иране, Афганистане и Таджикистане говорят на трех близкородственных идиомах – современном персидском в Иране, дари в Афганистане, таджикском в Таджикистане. Письменные варианты этих норм очень похожи, но различия присутствуют, однако изучены они недостаточно. Особенно это касается дари Афганистана, который исследован в наименьшей степени.
В рамках данного исследования разработаны алгоритмы для автоматизированного выявления характерных черт дари по интересующим нас параметрам (лексика, глагольные формы) с помощью Python; выявлены специфические лексические единицы, встречающиеся в текстах на дари; выявлены некоторые глагольные формы, характерные для языка дари, и предложена предварительная интерпретация полученных данных.
В рамках данного исследования разработаны алгоритмы для автоматизированного выявления характерных черт дари по интересующим нас параметрам (лексика, глагольные формы) с помощью Python; выявлены специфические лексические единицы, встречающиеся в текстах на дари; выявлены некоторые глагольные формы, характерные для языка дари, и предложена предварительная интерпретация полученных данных.