Предварительное сокращение размерности, Факторный анализ - Кластерный анализ
Рассмотрим пример. Есть база данных клиентов фирмы, которых следует разбить на однородные группы. Каждый клиент описывается при помощи 25 переменных. Использование такого большого числа переменных приводит к выделению кластеров нечеткой структуры. В результате аналитику достаточно сложно интерпретировать полученные кластеры.
Более понятные и прозрачные результаты кластеризации могут быть получены, если вместо множества исходных переменных использовать некие обобщенные переменные или критерии, содержащие в сжатом виде информацию о связях между переменными. Т. е. возникает задача понижения размерности данных. Она может решаться при помощи различных методов; один из наиболее распространенных - факторный анализ. Остановимся на нем более подробно.
Факторный анализ
Факторный анализ - это метод, применяемый для изучения взаимосвязей между значениями переменных.
Вообще, факторный анализ преследует две цели:
- - сокращение числа переменных; - классификацию переменных - определение структуры взаимосвязей между переменными.
Соответственно, факторный анализ может использоваться для решения задач сокращения размерности данных или для решения задач классификации.
Критерии или главные факторы, выделенные в результате факторного анализа, содержат в сжатом виде информацию о существующих связях между переменными. Эта информация позволяет получить лучшие результаты кластеризации и лучше объяснить семантику кластеров. Самим факторам может быть сообщен определенный смысл.
При помощи факторного анализа большое число переменных сводится к меньшему числу независимых влияющих величин, которые называются факторами.
Фактор в "сжатом" виде содержит информацию о нескольких переменных. В один фактор объединяются переменные, которые сильно коррелируют между собой. В результате факторного анализа отыскиваются такие комплексные факторы, которые как можно более полно объясняют связи между рассматриваемыми переменными.
На первом шаге факторного анализа осуществляется стандартизация значений переменных, необходимость которой была рассмотрена в предыдущей лекции.
Факторный анализ опирается на гипотезу о том, что анализируемые переменные являются косвенными проявлениями сравнительно небольшого числа неких скрытых факторов.
Факторный анализ - это совокупность методов, ориентированных на выявление и анализ скрытых зависимостей между наблюдаемыми переменными. Скрытые зависимости также называют латентными.
Один из методов факторного анализа - метод главных компонент - основан на предположении о независимости факторов друг от друга.
Похожие статьи
-
ДОПУЩЕНИЯ МОДЕЛИ РЕГРЕССИОННОГО АНАЛИЗА, ФАКТОРНЫЙ АНАЛИЗ - Многомерный статистический анализ
Регрессионная модель при оценке параметров и проверке значимости исходит из ряда допущений: 1. Ошибочный член уравнения регрессии (остаточный компонент)...
-
Дробный факторный эксперимент - Выполнение регрессионного и дисперсионного анализа
В полном факторном эксперименте число опытов соответствует N= 2N. Поэтому при большом числе факторов n реализация ПФЭ становится практически невозможной....
-
Методы Кластерного Анализа, Иерархические методы - Кластерный анализ
Иерархические методы С понятием кластеризации мы познакомились в первом разделе курса. В этом мы опишем понятие "кластер" с математической точки зрения,...
-
Итеративные методы, Алгоритм k-средних (k-means) - Кластерный анализ
При большом количестве наблюдений иерархические методы кластерного анализа не пригодны. В таких случаях используют неиерархические методы, основанные на...
-
Общие вопросы Привести объекты судебно-химического (химико-токсикологического) анализа. Дать понятие "вещественным доказательствам". Значение наружного...
-
Полный факторный эксперимент - Выполнение регрессионного и дисперсионного анализа
В факторных экспериментах, в отличие от классических, происходит одновременное варьирование всеми независимыми переменными. Эксперимент, в результате...
-
Методы кластерного анализа, Иерархические методы кластерного анализа - Кластерный анализ
Методы кластерного анализа можно разделить на две группы: - иерархические; - неиерархические. Каждая из групп включает множество подходов и алгоритмов....
-
Методы анализа взаимосвязи - Статистическое изучение взаимосвязи социально-экономических явлений
Первым и обязательным этапом изучения взаимосвязи социально-экономических явлений является качественный анализ природы явления методами экономической...
-
Принципы декомпозиционного анализа экономической системы
Принципы декомпозиции Декомпозиция исходной системы или глобальной задачи производится путем применения принципов декомпозиции и координации. Первые...
-
Явления общественной жизни складываются под воздействием целого ряда факторов, то есть являются многофакторными. Между факторами существуют сложные...
-
Сущность и основные условия применения корреляционного анализа В соответствии с сущностью корреляционной связи ее изучение имеет две цели: 1) измерение...
-
Иерархический кластерный анализ в SPSS - Кластерный анализ
Рассмотрим процедуру иерархического кластерного анализа в пакете SPSS (SPSS). Процедура иерархического кластерного анализа в SPSS предусматривает...
-
Кластерный анализ - Кластерный анализ
Кластерный анализ -- способ группировки многомерных объектов, основанных на представлении результатов отдельных наблюдений точками подходящего...
-
КОВАРИАЦИОННЫЙ АНАЛИЗ, ПАРНАЯ КОРРЕЛЯЦИЯ - Многомерный статистический анализ
По сути дела эта дисперсионный анализ, который включает, по крайней мере, одну категориальную независимую переменную и одну интервальную или метрическую...
-
СУЩНОСТЬ КЛАСТЕРНОГО АНАЛИЗА - Многомерный статистический анализ
С помощью кластерного анализа, как и рассмотренного нами факторного анализа, можно проверить весь набор взаимозависимых связей. В кластерном анализе не...
-
Основные понятия корреляционно-регрессионного анализа Теория и методы корреляционного анализа используются для выявления связи между случайными...
-
ОПРЕДЕЛЕНИЕ МЕТОДА ФАКТОРНОГО АНАЛИЗА И ЧИСЛА ФАКТОРОВ - Многомерный статистический анализ
Определение метода факторного анализа. Различные методы факторного анализа различаются в зависимости от подходов, которые используются для выделения...
-
ПОНЯТИЕ ДИСПЕРСИОННОГО АНАЛИЗА - Многомерный статистический анализ
Дисперсионный анализ - Это статистический метод изучения различий между выборочными средними двух или больше совокупностей. Как правило, Нулевая гипотеза...
-
Определение количества кластеров - Кластерный анализ
Существует проблема определения числа кластеров. Иногда можно априорно определить это число. Однако в большинстве случаев число кластеров определяется в...
-
Предварительная обработка исходного числового ряда направлена на решение следующих задач (всех или части из них): снизить влияние случайной составляющей...
-
Парный регрессионный анализ - Практические аспекты эконометрического анализа
Парный регрессионный анализ рассматривает проблему для случая однофакторного признака. Пусть имеется набор значений двух переменных: yi и хi Между этими...
-
Задачи и методы качественного анализа - Основы аналитической химии
Обнаружение или, как иногда говорят, "открытие" отдельных элементов или ионов, входящих в состав веществ - это задачи качественного анализа. Качественный...
-
ОДНОФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ - Многомерный статистический анализ
Довольно часто у маркетологов возникает необходимость установить различия в средних значениях зависимой переменной для нескольких категорий одной...
-
Типы зависимостей - Корреляционно-регрессионный анализ
Зависимость одной случайной величины от значений, которые принимает другая случайная величина (физическая характеристика), в статистике называется...
-
Корреляционно-регрессионный метод Прежде чем приступить к анализу статистических методов прогнозирования, рассмотрим некоторые общие понятия и...
-
Дисперсионный анализ - Выполнение регрессионного и дисперсионного анализа
Дисперсионный анализ - первый статистический метод отсеивания факторов в активном эксперименте. Он основан на представлении о том, что значимость фактора...
-
Моделирование. Детерминизм. Требования к моделированию В процессе исследования объекта часто бывает нецелесообразно или даже невозможно иметь дело...
-
Введение - Регрессионный анализ в экономических исследованиях
Актуальность выбранной темы определяется тем, что в эконометрике широко используются методы статистики. Во многих практических задачах прогнозирования,...
-
Следует отметить, что не существует особых сил, вызывающих адсорбцию. Адсорбция молекул на поверхности твердого тела происходит за счет сил притяжения со...
-
Анализ - метод научного исследования явлений и процессов, в основе которого лежит изучение составных частей, элементов изучаемой системы. На современном...
-
В современных условиях повышается самостоятельность предприятий в принятии и реализации управленческих решений, их экономическая и юридическая...
-
В результате первой стадии статистического исследования (статистического наблюдения) получают статистическую информацию, представляющую собой большое...
-
Основные задачи анализа временных рядов - Динамические ряды
Принципиальные отличия временного ряда от последовательности наблюдений, образующих случайную выборку, заключаются в следующем: Во-первых, в отличие от...
-
Анализ накладных расходов -2. По данным, представленным в табл. 1, исследуется зависимость между величиной накладных расходов 40 строительных организаций...
-
Датой рождения метода Монте-Карло принято считать 1949 г., когда появилась статья под названием "The Monte Carlo method". Создателями этого метода...
-
Проверка качества кластеризации, Алгоритм PAM ( partitioning around Medoids) - Кластерный анализ
После получений результатов кластерного анализа методом k-средних следует проверить правильность кластеризации (т. е. оценить, насколько кластеры...
-
Методы объединения или связи - Кластерный анализ
Когда каждый объект представляет собой отдельный кластер, расстояния между этими объектами определяются выбранной мерой. Возникает следующий вопрос - как...
-
Меры сходства - Кластерный анализ
Для вычисления расстояния между объектами используются различные меры сходства (меры подобия), называемые также метриками или функциями расстояний. В...
-
ВРАЩЕНИЕ И ИНТЕРПРЕТАЦИЯ ФАКТОРОВ - Многомерный статистический анализ
Вращение факторов. Матрицу факторных нагрузок называют также матрицей факторного отображения. Она содержит коэффициенты, используемые для выражения...
-
Корреляционный статистический регрессионный Исходные данные: N 1 2 3 4 5 6 7 8 9 10 XI 15 16 19 23 25 26 29 34 38 49 YI 4 15 10 13 18 20 19 17 26 33 На...
Предварительное сокращение размерности, Факторный анализ - Кластерный анализ