Разработка системы исправления опечаток в пользовательских запросах

Толстов Антон Евгеньевич

Аннотация


Толстов Антон Евгеньевич, разработка системы исправления опечаток в пользовательских запросах, выпускная квалификационная работа: стр. 43, рис. 5, источ. 11.
Ключевые слова: контекстно-зависимое исправление опечаток, исправление опечаток в поисковых запросах, расстояние Левенштейна, обработка естественного языка.
Цель работы: разработать контекстно-зависимую систему исправления опечаток для сервиса подбора и проверки контрагентов “Контур.Фокус”.
Разработана система исправления опечаток в пользовательских запросах, учитывающая контекст фразы. Для исправления опечаток система использует пользовательский словарь, который может быть обновлен в процессе работы системы (без необходимости перезапуска). Показана сводимость задачи поиска ближайшего (по расстоянию Левенштейна) слова в словаре к задаче поиска кратчайшего пути в подходящем взвешенном орграфе.
Результаты данного исследования могут быть использованы при разработке систем обнаружения и исправления опечаток, систем нечеткого поиска, а также систем автодополнения пользовательского ввода.