Кластерный анализ
Эвклид+Дальн.сосед
Таблица расстояний
(1) (2) (3) (4) (5) (6) (7) (8) (9) (10)
( 2) 22,13
( 3) 19,52 5,889
( 4) 52,35 30,44 33,39
( 5) 43,22 21,39 24,68 9,461
( 6) 48,53 26,65 29,67 3,921 5,554
( 7) 35,03 13,35 16,03 17,42 8,869 13,69
( 8) 25,92 5,49 7,185 26,53 17,61 22,74 9,236
К л а с т е р ы:
(список объектов) -> расстояние
(6,4) --> 3,921
(8,2) --> 5,49
(8,3,2) --> 7,185
(7,5) --> 8,869
(7,6,4,5) --> 17,42
(8,1,3,2) --> 25,92
(8,7,6,4,5,1,3,2) --> 52,35
Рис. 1.5.
Дендрограмма (стратегия дальнего соседа): по оси Y – расстояние объединения, по оси Х – номера групп
Как видно из рис. 1.5. стратегия дальнего соседа достаточно отчетливо выделяет три кластера исследуемых групп: (4, 6), (5, 7) и (1, 2, 3, 8). При этом группу 1 можно выделить в четвертый кластер. В связи с этим применим дивизивную стратегию в попытке получить группировку на четыре кластера.
Эвклид+Дивизивная
Таблица расстояний
(1) (2) (3) (4) (5) (6) (7) (8) (9) (10)
( 2) 22,13
( 3) 19,52 5,889
( 4) 52,35 30,44 33,39
( 5) 43,22 21,39 24,68 9,461
( 6) 48,53 26,65 29,67 3,921 5,554
( 7) 35,03 13,35 16,03 17,42 8,869 13,69
( 8) 25,92 5,49 7,185 26,53 17,61 22,74 9,236
К л а с т е р ы:
Среднее внутрикластерное расстояние=5,673
1= (1,2,3*,8)
2= (4*,6)
3= (5*,7)
Рис. 1.6.
Дендрограмма трех кластеров
В результате получаем разделение на три кластера. Для проверки гипотезы об адекватности получаемых классификаций применяем дискриминантный метод.