Оптимизация процесса построения филогенетических деревьев.

Ходаков Олег Александрович

Аннотация


Выпускная квалификационная работа состоит из следующих разделов: введение, обзор литературы, глава с описанием объектов и методов исследования, анализ полученных результатов и их обсуждение, выводы, список использованных источников и литературы. Материал изложен на 33 страницах. Работа содержит 2 таблицы, 7 рисунков и 6 приложений. Список источников и литературы включает 40 источников, из которых 2 отечественных и 38 иностранного происхождения.
Объектом исследования являются нуклеотидные последовательности гена pol ВИЧ-1, полученные в ходе молекулярно-генетических исследований биологического материала (кровь) от пациентов с ВИЧ/СПИД на территории Уральского Федерального округа. В экспериментальной работе изучены различные модели замен нуклеотидов и алгоритмы кластеризации.
Целью работы являлась выработка оптимального алгоритма по подбору метода кластеризации для имеющегося массива материала.
Для выполнения работы использовались программы: jModelTest2, Mega X, Dendroscope, PhyML, язык программирования python и модуль biopython. Для выравнивания нуклеотидных последовательностей ВИЧ-1 был использован онлайн-сервис [1]. Построение деревьев методами кластеризации проводилось с помощью программ Mega X и PhyML. Для оценки качества построенных деревьев использовались данные генотипирования. Для поиска сходных последовательностей в базе данных использовался онлайн-сервис HIV-BLAST [2]. Затем новые последовательности были добавлены в выравнивание и построено новое филогенетическое дерево с помощью наиболее оптимального алгоритма кластеризации.
Были получены следующие основные результаты: 1) исследуемые последовательности содержали 4 генотипа: А, В, CRF63_02AG и CRF03_AB; 2) на основании данных генотипирования наиболее оптимальным для кластеризации оказался метод присоединения ближайшего соседа (NJ); 3) с помощью сервиса HIV-BLAST были найдены родственные последовательности по всему миру; 4) новые последовательности были добавлены в исходное выравнивание и из нового выравнивания было построено филогенетическое дерево методом присоединения ближайшего соседа.
Таким образом, для подбора наиболее оптимального алгоритма кластеризации нуклеотидных последовательностей ВИЧ-1 необходимо провести генотипирование и кластеризацию всеми имеющимися алгоритмами. Затем, основываясь на данных генотипирования, нужно выбрать алгоритм, совершивший наименьшее количество ошибок.