Проверка качества кластеризации, Алгоритм PAM ( partitioning around Medoids) - Кластерный анализ

После получений результатов кластерного анализа методом k-средних следует проверить правильность кластеризации (т. е. оценить, насколько кластеры отличаются друг от друга). Для этого рассчитываются средние значения для каждого кластера. При хорошей кластеризации должны быть получены сильно отличающиеся средние для всех измерений или хотя бы большей их части.

Достоинства алгоритма k-средних:

    - простота использования; - быстрота использования; - понятность и прозрачность алгоритма.

Недостатки алгоритма k-средних:

    - алгоритм слишком чувствителен к выбросам, которые могут искажать среднее. Возможным решением этой проблемы является использование модификации алгоритма - алгоритм k-медианы; - алгоритм может медленно работать на больших базах данных. Возможным решением данной проблемы является использование выборки данных.
Алгоритм PAM ( partitioning around Medoids)

PAM является модификацией алгоритма k-средних, алгоритмом k-медианы (k-medoids).

Алгоритм менее чувствителен к шумам и выбросам данных, чем алгоритм k-means, поскольку медиана меньше подвержена влияниям выбросов.

PAM эффективен для небольших баз данных, но его не следует использовать для больших наборов данных.

Похожие статьи




Проверка качества кластеризации, Алгоритм PAM ( partitioning around Medoids) - Кластерный анализ

Предыдущая | Следующая