СТАТИСТИКИ КЛАСТЕРНОГО АНАЛИЗА - Многомерный статистический анализ

С кластерным анализом связаны следующие статистики и понятия:

    - План агломерации (объединения). Он дает информацию об объектах, событиях, случаях, которые должны быть объединены на каждой стадии процесса иерархической кластеризации; - Кластерный центроид - это среднее значение переменных для всех случаев или объектов в конкретном кластере; - Кластерные центры - это исходные начальные точки в иерархической кластеризации. Кластеры строят вокруг этих центров (Зерен кластеризации); - Принадлежность кластеру. Эта принадлежность указывает кластер, которому принадлежит каждый случай или объект; - Древовидная диаграмма (дендрограмма). Эту диаграмму называют также Древовидным графом (графическое средство для показа результатов кластеризации). Она показана на рис.3. вертикальные линии представаляют объединяемые кластеры. Положение вертикальной линии на шкале расстояния (горизонтальная ось) показывает расстояние, при которых объединяли кластеры. Дендрограмму читают слева направо.
    - Расстояния между кластерными центрами - указывают насколько разнесены отдельные пары кластеров; - Сосульчатая диаграмма - это графическое отображение результатов кластеризации. Она названа так потому, что имеет сходство с рядом сосулек, свисающих с крыши дома. Эту диаграмму читают сверху вниз; - Матрица сходства (матрица расстояний между объединяемыми объектами). Матрица сходства - это нижняя треугольная матрица, которая содержит значение расстояний между парами объектов (случаев).

Похожие статьи




СТАТИСТИКИ КЛАСТЕРНОГО АНАЛИЗА - Многомерный статистический анализ

Предыдущая | Следующая