Разработка алгоритмов и программного обеспечения для поиска блоков текста в произвольных двоичных массивах данных

Гандзюк Татьяна Максимовна

Аннотация


Пояснительная записка 51 с., 1 ч., 0 рис., 17 табл., 13 источников, 1 прил.
КОДИРОВКА, РЕГУЛЯРНЫЕ ВЫРАЖЕНИЯ, РУССКИЙ ТЕКСТ
Объект исследования или разработки: алгоритм выделения блоков текста заданных кодировок из произвольного массива байт
Цель работы: создание программного обеспечения, которое находит и выделяет блоки текста кодировки СР-1251, k018-R, СР-866, UTF-8, UTF-16LE, из произвольного массива байт
Результаты работы: создано программное обеспечение, которое находит и выделяет блоки текста кодировки СР-1251, k018-R, СР-866, UTF-8, UTF-16LE из произвольного двоичного массива, а так же вычисляет адреса и длину подобных блоков текста
Основные конструктивные, технологические и техникоэксплуатационные характеристики: операционная система Windows 8.1, среда разработки Microsoft Visual studio 2016, язык разработки С++, необходимая память 72 МБ
Степень внедрения: используется для анализа съемных носителей
Область применения: компьютерная криминалистика
Экономическая эффективность или значимость работы: разработанный алгоритм является первым работающим алгоритмом для выделения блоков текста заданных кодировок из произвольного массива байт, который использует подобные средства анализа
Прогнозные предположения о развитии объекта исследования: возможно добавление кодировок и языков для поиска текста.