Методы объединения или связи - Кластерный анализ
Когда каждый объект представляет собой отдельный кластер, расстояния между этими объектами определяются выбранной мерой. Возникает следующий вопрос - как определить расстояния между кластерами? Существуют различные правила, называемые методами объединения или связи для двух кластеров.
Метод ближнего соседа или одиночная связь. Здесь расстояние между двумя кластерами определяется расстоянием между двумя наиболее близкими объектами (ближайшими соседями) в различных кластерах. Этот метод позволяет выделять кластеры сколь угодно сложной формы при условии, что различные части таких кластеров соединены цепочками близких друг к другу элементов. В результате работы этого метода кластеры представляются длинными "цепочками" или "волокнистыми" кластерами, "сцепленными вместе" только отдельными элементами, которые случайно оказались ближе остальных друг к другу.
Метод наиболее удаленных соседей или полная связь. Здесь расстояния между кластерами определяются наибольшим расстоянием между любыми двумя объектами в различных кластерах (т. е. "наиболее удаленными соседями"). Метод хорошо использовать, когда объекты действительно происходят из различных "рощ". Если же кластеры имеют в некотором роде удлиненную форму или их естественный тип является "цепочечным", то этот метод не следует использовать.
Метод Варда (Ward's method). В качестве расстояния между кластерами берется прирост суммы квадратов расстояний объектов до центров кластеров, получаемый в результате их объединения (Ward, 1963). В отличие от других методов кластерного анализа для оценки расстояний между кластерами, здесь используются методы дисперсионного анализа. На каждом шаге алгоритма объединяются такие два кластера, которые приводят к минимальному увеличению целевой функции, т. е. внутригрупповой суммы квадратов. Этот метод направлен на объединение близко расположенных кластеров и "стремится" создавать кластеры малого размера.
Метод невзвешенного попарного среднего (метод невзвешенного попарного арифметического среднего - unweighted pair-group method using arithmetic averages, UPGMA (Sneath, Sokal, 1973)).
В качестве расстояния между двумя кластерами берется среднее расстояние между всеми парами объектов в них. Этот метод следует использовать, если объекты действительно происходят из различных "рощ", в случаях присутствия кластеров "цепочного" типа, при предположении неравных размеров кластеров.
Метод взвешенного попарного среднего (метод взвешенного попарного арифметического среднего - weighted pair-group method using arithmetic averages, WPGM A (Sneath, Sokal, 1973)). Этот метод похож на метод невзвешенного попарного среднего, разница состоит лишь в том, что здесь в качестве весового коэффициента используется размер кластера (число объектов, содержащихся в кластере).
Этот метод рекомендуется использовать именно при наличии предположения о кластерах разных размеров.
Невзвешенный центроидный метод (метод невзвешенного попарного центроидного усреднения - unweighted pair-group method using the centroid average (Sneath and Sokal, 1973)).
В качестве расстояния между двумя кластерами в этом методе берется расстояние между их центрами тяжести.
Взвешенный центроидный метод (метод взвешенного попарного центроидного усреднения - weighted pair-group method using the centroid average, WPGMC (Sneath, Sokal 1973)). Этот метод похож на предыдущий, разница состоит в том, что для учета разницы между размерами кластеров (числе объектов в них), используются веса. Этот метод предпочтительно использовать в случаях, если имеются предположения относительно существенных отличий в размерах кластеров.
Похожие статьи
-
Методы кластерного анализа, Иерархические методы кластерного анализа - Кластерный анализ
Методы кластерного анализа можно разделить на две группы: - иерархические; - неиерархические. Каждая из групп включает множество подходов и алгоритмов....
-
Меры сходства - Кластерный анализ
Для вычисления расстояния между объектами используются различные меры сходства (меры подобия), называемые также метриками или функциями расстояний. В...
-
Методы Кластерного Анализа, Иерархические методы - Кластерный анализ
Иерархические методы С понятием кластеризации мы познакомились в первом разделе курса. В этом мы опишем понятие "кластер" с математической точки зрения,...
-
МЕТОДЫ СРАВНИТЕЛЬНОГО ШКАЛИРОВАНИЯ - Многомерный статистический анализ
Шкалирование методом попарного сравнения - Это метод сравнительного шкалирования, при котором респонденту дается два объекта для выбора по определенному...
-
Методы анализа - Свойства флавоноидов
Качественное определение. Для обнаружения флавоноидов в ЛРС используют химические реакции и хроматографию. Химические реакции подразделяются на цветные и...
-
Важной задачей статистики является разработка методики статистической оценки социально-экономических явлений, которая осложняется тем, что многие...
-
Метод сравнения является универсальным методом и применяется во всех разделах статистики (метод сравнения средних, оценивания неизвестных параметров и...
-
Введение - Анализ методов прогнозирования
Процесс прогнозирования достаточно актуален в настоящее время. Широка сфера его применения. Прогнозирование широко используется в экономике, а именно в...
-
Знаменитая теория полимолекулярной адсорбции Брунауэра, Эммета и Теллера, получившая название теории БЭТ (по первым буквам фамилий ученых), основана на...
-
Фотоэлектроколориметрические методы относятся к объективным методам, так как интенсивность окраски растворов оценивают с помощью специальных устройств -...
-
Кластерный анализ - Кластерный анализ
Кластерный анализ -- способ группировки многомерных объектов, основанных на представлении результатов отдельных наблюдений точками подходящего...
-
Классификация регионов РФ по степени инновационной развитости методами кластерного анализа и расщепления смесей Российская Федерация состоит из 85...
-
Гедонистический подход Гедонистический подход используется при анализе ценообразования и заключается в моделировании цены объекта как функции от его...
-
Экспериментальная установка В работе используется прибор для текстурных измерений "Термосорб" серии М, фирмы "КАТАКОН" Серийный №017 Дата выпуска...
-
Методы колебательной спектроскопии - Основы качественного анализа
Инфракрасные спектры поглощения возникают в результате возбуждения в веществе колебаний, энергия которых специфична для определенных атомных групп. По...
-
Наиболее представительные ионы и соответствующие им структуры помещены в таблицы, их используют при интерпретации масс-спектров. Кроме того сравнивают...
-
Неравенство Бонферрони часто используется при множественном тестировании на значимость, главная идея состоит в установке верхней границы FWER. Пусть -,...
-
СОПОСТАВЛЕНИЕ МЕТОДОВ ШКАЛИРОВАНИЯ - Многомерный статистический анализ
Все методы шкалирования можно условно разделить на Сравнительные и Несравнительные . Сравнительные шкалы - Это метод шкалирования, заключающийся в прямом...
-
В основу классификаций хроматографических методов положены принципы, учитывающие следующие различные особенности процесса разделения: * различия в...
-
Общая схема метода Монте-Карло Сущность метода Монте-Карло состоит в следующем: требуется найти значение а некоторой изучаемой величины. Для этого...
-
1. Ознакомиться с методами регрессионного анализа и планирования эксперимента; 2. Определить коэффициенты статистической характеристики объекта...
-
Регрессия -- зависимость среднего значения какой-либо величины от некоторой другой величины или от нескольких величин. Задача регрессионного анализа...
-
Частным случаем недетерминированной связи является связь случайная - стохастическая (вероятностная). Реализация вероятностного подхода к описанию...
-
Химические и физические методы анализа, Условность классификации - Основы качественного анализа
Условность классификации Природа не знает деления на физику и химию, поэтому классификация методов довольно условна. Обычно к химическим методам относят...
-
Методы определения корреляционной связи - Корреляционно-регрессионный анализ
Корреляцию и регрессию принято рассматривать как совокупный процесс статистического исследования, поэтому их использование в статистике часто именуют...
-
Адсорбционные явления чрезвычайно широко распространены в живой и неживой природе. Толщи горных пород и почвы являются огромными колоннами с...
-
Описание процессов, происходящих на поверхности, изобилует специальными терминами, и при рассмотрении адсорбционных явлений приходится говорить на языке,...
-
Попытаемся дать общее представление о свойствах и применении адсорбентов на примере весьма распространенных углеродных материалов. Углеродные адсорбенты...
-
Пусть к примеру необходимо стабилизировать ПИ-регулятором объект с передаточной функцией (9) Составляем структурную схему моделирования в среде Simulink...
-
Адсорбционные методы исследования свойств поверхности позволяют количественно охарактеризовать происходящие при адсорбции межмолекулярные взаимодействия,...
-
Химическая связь - это взаимное сцепление атомов в молекуле и кристаллической решетке в результате действия между атомами электрических сил притяжения....
-
Методы непараметрической статистики - Основы теории систем и системного анализа
Использование классических распределений случайных величин обычно называют "параметрической статистикой" - мы делаем предположение о том, что...
-
1. Сушильный шкаф 2. Весы 3. Колонка сит 4. Ступки и пестики 5. Нож, ножницы 6. Металлические или картонные противни 7. Набор счетных геометрий:...
-
В результате первой стадии статистического исследования (статистического наблюдения) получают статистическую информацию, представляющую собой большое...
-
Численный сравнительный анализ - Ранговый метод оценивания параметров регрессионной модели
Итак, в рамках данной работы рассматриваются такие распределения случайных величин, как распределения Гаусса и Лапласа, треугольное распределение...
-
Введение - Сравнительный анализ методов обессеривания
С развитием техники повышаются требования к ассортименту и качеству нефти и нефтепродуктов, что, в свою очередь, требует совершенствования процессов их...
-
Реагентный метод обессеривания - Сравнительный анализ методов обессеривания
Нефтеперерабатывающая промышленность в настоящее время использует химические и физико-химические методы очистки дизельного топлива от серасодержащих...
-
Можно выделить и сопоставить преимущества и недостатки обоих методов (таблица 1.10) [17, стр. 65 - 66] . Применение технологии с оксидным катализатором...
-
Метод дихотомии требует менее всего итераций цикла для получения корней уравнения с заданной точностью. Если расчет ведется без помощи ЭВМ, то это...
-
ОПРЕДЕЛЕНИЕ МЕТОДА ФАКТОРНОГО АНАЛИЗА И ЧИСЛА ФАКТОРОВ - Многомерный статистический анализ
Определение метода факторного анализа. Различные методы факторного анализа различаются в зависимости от подходов, которые используются для выделения...
Методы объединения или связи - Кластерный анализ