КЛАСТЕРИЗАЦИЯ ДАННЫХ

Персидский Алексей Андреевич

Аннотация


Часто в жизни приходится сталкиваться с огромным количеством задач. Нет неразрешимых задач, потому любая проблема в моём понимании имеет решение. Моя дипломная работа как раз расскажет о том, как решить одну из проблем, возникающей в процессе работы с огромным объёмом данных, а именно: как максимально возможно уменьшить время при нулевой потере данных.

Системный анализ явлений изначально подразумевает огромный объём данных на входе. Возникает сложность в многомерности описания этих данных. Это типичная проблема для статистической обработки информации во многих задачах, встречающихся в самых разных областях – начиная от естественных наук (психология) и заканчивая узкой профессиональной деятельностью (сегментирование рынка, разбиение клиентов по их интересам). На помощь приходит многомерный анализ и его методы. Это наиболее продуктивный количественный инструмент исследования социально-экономических явлений, которые описываются значительным числом характеристик. К этим методам относятся: метод ранжирования многомерных величин, факторный анализ (дисперсионный анализ не входит формально в этот список, однако имеет схожую идеологию). К этим методам относится и кластерный анализ, о котором пойдёт речь в моей работе.