Кластерний аналіз


Для того щоб виконати завдання з використанням кластерного аналізу ми скористаємося статистичним пакетом обробки даних SPSS та файлом з результатами щодо використання людьми захисних механізмів та копінг-стратегій.

Наша вибірка становить 20 осіб.

Ми обрали 4 фактори:

Захисні механізми:

    Ш Витіснення; Ш Заміщення;

Копінг-стратегії:

Ь Активний відпочинок.

Ь Духовність;

Кластер

1

2

3

4

5

6

Вытеснение

8,00

2,50

4,50

4,00

6,00

4,00

Замещение

8,00

8,00

4,25

3,50

5,67

3,25

14. Духовность

50,00

67,50

80,00

60,00

60,00

68,75

18. Активный отдых

49,00

84,00

57,75

63,00

39,67

54,25

Кластерний аналіз алгоритм дендрограма

Перша таблиця - Кінцеві центри кластерів, дає нам змогу дізнатися який фактор є центральним для виділення кожного кластеру:

    1 кластер - - кожен фактор є досить значним для досліджуваних, 2 кластер - фактори "Активний відпочинок" та "Заміщення "є центральними і "Духовність"; 3 кластер - "Духовність", "Активний відпочинок"; 4 кластер - фактор "Духовність", "Активний відпочинок" та ; 5 фактор - фактор "Духовність" і "Витіснення" "Заміщення" . 6 фактор - фактори "Духовність" та "Активний відпочинок".

Число наблюдений в каждом кластере

Кластер

1

1,000

2

2,000

3

4,000

4

6,000

5

3,000

6

4,000

Валидные

20,000

Пропущенные значения

,000

Таблиця "Число наблюдений в каждом кластере" допомагає нам дізнатись яка кількість досліджуваних увійшла до кожного кластеру:

    1ий кластер - 1особа; 2ий кластер - 2 особи; 3ій кластер - 4 особи; 4ий кластер - 6 осіб; 5иій кластер - 3 особи. 6иій кластер - 4 особи.

Після використання кластеризації К-середніми ми скористаємося Ієрархічним кластерним аналізом для порівняння результатів.

Метод кластеризації - Міжгрупові зв'язки - порівнює відстань між об'єктами різних кластерів.

Этап

Кластер объединен с

Коэффициенты

Этап первого появления кластера

Следующий этап

Кластер 1

Кластер 2

Кластер 1

Кластер 2

1

3

15

,000

0

0

6

2

2

20

1,000

0

0

12

3

18

19

1,000

0

0

6

4

1

12

1,000

0

0

14

5

4

9

1,000

0

0

10

6

3

18

1,500

1

3

13

7

7

16

2,000

0

0

12

8

11

14

2,000

0

0

9

9

10

11

3,000

0

8

11

10

4

6

3,500

5

0

15

11

8

10

4,667

0

9

16

12

2

7

5,000

2

7

17

13

3

5

5,750

6

0

15

14

1

13

6,500

4

0

17

15

3

4

8,667

13

10

16

16

3

8

14,250

15

11

19

17

1

2

16,417

14

12

18

18

1

17

27,000

17

0

19

19

1

3

41,729

18

16

0

З таблиці "Кроки агломерації" ми можемо зрозуміти на якому етапі які досліджувані об'єдналися у кластер. Наприклад, на 5му етапі досліджувані 4 і 9 об'єдналися у кластер.

Також в цій таблиці ми можемо прослідкувати Евклідову відстань між кожним кластером і завдяки визначенню "скачка" ми дізнаємося яку кількість кластерів ми отримуємо.

Перший найбільший відрив ми спостерігаємо на 14 кроці. Скористаємося формулою на визначимо кількість кластерів.

Формула:

Загальна кількість досліджуваних відняти номер етапу, на якому відбувся скачок.

20 - 14 (15) = 6(5)

Визначити скільки саме(6 чи 5) ми маємо кластерів нам допоможе дендограма

Дана дендограма допомагає побачити на якій відстані один від одного знаходяться кластери та на якому рівні вони утворюються. Ми розуміємо, що чим раніше утворюється кластер, тим більш схожі між собою його члени. Ми приймаємо рішення про загальну кількість кластерів - 6. Ці 6 кластерів утворюються приблизно на одному рівні, а отже їх члени достатньо схожі між собою за своїми характерами, звичками чи іншим.

Принадлежность к кластерам

Наблюдение

6 кластеров

5 кластеров

1

1

1

2

2

2

3

3

3

4

4

3

5

3

3

6

4

3

7

2

2

8

5

4

9

4

3

10

5

4

11

5

4

12

1

1

13

1

1

14

5

4

15

3

3

16

2

2

17

6

5

18

3

3

19

3

3

20

2

2

Таблиця "Приналежність до кластерів" допомагає нам побачити в якому кластері був би кожен досліджуваний, якби кластерів була інша кількість, ніж ми визначили. Наприклад, якщо ми маємо 6 кластерів, то досліджуваний №11 входить до 5го кластеру, але якщо ми зменшимо кількість кластерів до 5ти, то цей досліджуваний буде входити до 4го кластеру.

Далі завдяки функції SPSS "середні значення" ми маємо змогу визначити, які фактори є найбільш впливовими для кожного кластеру.

Отчет

Average Linkage (Between Groups)

Вытеснение

Замещение

18. Активный отдых

14. Духовность

1

Среднее

4,0000

2,5000

61,2500

63,1250

N

8

8

8

8

Стд. Отклонение

1,69031

1,92725

3,24037

7,03943

2

Среднее

3,5000

10,0000

73,5000

67,5000

N

2

2

2

2

Стд. Отклонение

2,12132

2,82843

4,94975

3,53553

3

Среднее

4,3333

4,6667

56,0000

81,6667

N

3

3

3

3

Стд. Отклонение

1,52753

2,08167

,00000

2,88675

4

Среднее

4,0000

2,5000

49,0000

70,0000

N

2

2

2

2

Стд. Отклонение

,00000

3,53553

,00000

,00000

5

Среднее

6,5000

6,2500

42,0000

57,5000

N

4

4

4

4

Стд. Отклонение

1,29099

2,36291

5,71548

6,45497

6

Среднее

3,0000

8,0000

91,0000

65,0000

N

1

1

1

1

Стд. Отклонение

.

.

.

.

Итого

Среднее

4,4500

4,6000

58,1000

66,0000

N

20

20

20

20

Стд. Отклонение

1,73129

3,21837

12,66533

9,26226

До першого кластеру входить досліджуваний для якого є властивими захисні механізми - витіснення та копінг-стратегії - духовність і активний відпочинок.

Другий кластер складають особи, для яких притаманна копінг-стратегія "Духовність" та "Активний відпочинок"та захисний механізм "Заміщення"

Третій кластер - це люди, для яких притаманні всі фактори окрім "Активного відпочинку"

До Четвертого кластеру "Духовність"

П'ятий кластер: "Витіснення" і "Заміщення"

Шостий кластер: "Заміщення", "Активний відпочинок", "Духовність"

Висновок

В ході виконання роботи ми використали кластерний аналіз, здійснено це було двома шляхами - Ієрархічним кластерним аналізом та кластеризацією К-середніх. Для того щоб виконувати роботу ефективно варто застосовувати обидва способи.

Похожие статьи




Кластерний аналіз

Предыдущая | Следующая