Кластерный анализ

Эвклид+Дальн.сосед

Таблица расстояний

(1) (2) (3) (4) (5) (6) (7) (8) (9) (10)

( 2) 22,13

( 3) 19,52 5,889

( 4) 52,35 30,44 33,39

( 5) 43,22 21,39 24,68 9,461

( 6) 48,53 26,65 29,67 3,921 5,554

( 7) 35,03 13,35 16,03 17,42 8,869 13,69

( 8) 25,92 5,49 7,185 26,53 17,61 22,74 9,236

К л а с т е р ы:

(список объектов) -> расстояние

(6,4) --> 3,921

(8,2) --> 5,49

(8,3,2) --> 7,185

(7,5) --> 8,869

(7,6,4,5) --> 17,42

(8,1,3,2) --> 25,92

(8,7,6,4,5,1,3,2) --> 52,35

Рис. 1.5.

Дендрограмма (стратегия дальнего соседа): по оси Y – расстояние объединения, по оси Х – номера групп

Как видно из рис. 1.5. стратегия дальнего соседа достаточно отчетливо выделяет три кластера исследуемых групп: (4, 6), (5, 7) и (1, 2, 3, 8). При этом группу 1 можно выделить в четвертый кластер. В связи с этим применим дивизивную стратегию в попытке получить группировку на четыре кластера.

Эвклид+Дивизивная

Таблица расстояний

(1) (2) (3) (4) (5) (6) (7) (8) (9) (10)

( 2) 22,13

( 3) 19,52 5,889

( 4) 52,35 30,44 33,39

( 5) 43,22 21,39 24,68 9,461

( 6) 48,53 26,65 29,67 3,921 5,554

( 7) 35,03 13,35 16,03 17,42 8,869 13,69

( 8) 25,92 5,49 7,185 26,53 17,61 22,74 9,236

К л а с т е р ы:

Среднее внутрикластерное расстояние=5,673

1= (1,2,3*,8)

2= (4*,6)

3= (5*,7)

Рис. 1.6.

Дендрограмма трех кластеров

В результате получаем разделение на три кластера. Для проверки гипотезы об адекватности получаемых классификаций применяем дискриминантный метод.