Анонимизация больших банковских данных

Татарченков Андрей Павлович

Аннотация


Дипломный проект посвящен разработки алгоритма анонимизации банковских данных, способного определять и обезличивать персональные данные в описаниях операций.
Выполняя работу по дипломному проекту, производилось изучение предметной области задачи и методы обработки текста.
Первая глава содержит в себе описания библиотек, методов и моделей, рассматриваемых для использования в разрабатываемом алгоритме. Вторая глава рассказывает о процессе разработки алгоритма обезличивания данных, описывает все этапы с примерами кода на языке Python.
В результате выполнения работы был разработан алгоритм, который смог успешно скрывать информацию, которая могла послужить источником идентификации клиентов банка для реидентификации.
Алгоритм успешно прошел тестирование и готов к внедрению в другие организации, с целью сохранения конфиденциальности информации.