Глубокое обучение в моделировании антигенной эволюции
Аннотация
В данной работе проводится антигенное моделирование гриппа при помощи методов машинного и глубокого обучения. В ходе эксперимента проведено сравнение эффективности моделей, обученных на поверхностных белках гриппа — гемагглютинине и нейраминидазе. Для
проведения эксперимента была составлена база данных, содержащая анализы и последовательности обоих белков. Белковые последовательности были вложены в пространство векторов при помощи унитарного кодирования и методов семейства Word2Vec. Объединив модели, обученные на обоих белках, было получено множество мета-признаков, которое было использовано для построения стекинг ансамбля. Для оценки обеспечения разнообразия в ансамбле были использованы метрика двойной ошибки и Q-статистика.
проведения эксперимента была составлена база данных, содержащая анализы и последовательности обоих белков. Белковые последовательности были вложены в пространство векторов при помощи унитарного кодирования и методов семейства Word2Vec. Объединив модели, обученные на обоих белках, было получено множество мета-признаков, которое было использовано для построения стекинг ансамбля. Для оценки обеспечения разнообразия в ансамбле были использованы метрика двойной ошибки и Q-статистика.