Членение устного текста англоязычных выступлений TED на основе дискурсивных маркеров

Сибгатуллина Юлия Ринатовна

Аннотация


Работа посвящена анализу дискурсивных маркеров, способствующих членению устных текстов на абзацы, на примере транскриптов англоязычных выступлений TED. Материал исследования составили 50 фрагментированных и 2 нефрагментированных текстов самых просматриваемых англоязычных выступлений на конференции TED в период с 2003 по 2023 год.
В первой части работы рассматриваются семантические характеристики текста, вводится понятие эпизода как дискурсивной единицы и определяется важность дискурсивных маркеров как элементов организации текста. Особое внимание уделяется структурным и лексическим особенностям выступлений TED.
Во второй части работы проводится анализ уже поделенных на абзацы текстов с целью выявления дискурсивных маркеров, используемых для перехода к новой теме, а затем значимость данных маркеров доказывается при самостоятельном разделении неструктурированных текстов. Анализируемые тексты поделены на три категории: с абзацами средней длины, с короткими абзацами и с длинными абзацами. Такое разделение позволяет показать роль визуальной гармоничности транскриптов, а также отделить первичные дискурсивные маркеры от вторичных.
Результаты исследования могут быть использованы для создания алгоритмов автоматического разделения транскриптов TED.
В приложении приводится список использованных для анализа выступлений и фрагментированные нами тексты.