Решение задачи QA для низкоресурсных языков тюркской языковой группы

Медовиков Александр Андреевич

Аннотация


Цель работы состоит в том, чтобы провести комплексное исследование решения задачи QA для низкоресурсных языков в виде казахского и узбекского языка, создав модели и датасеты на соответствующих языках, при помощи машинного перевода датасетов на высокоресурсных языках с использованием специальных маркеров. Также исследуется гипотеза о важности близости языков при выборе языка источника для перевода. Созданы QA-модели, демонстрирующие лучшие результаты для казахского и узбекского языков, чем все другие публично доступные модели.