Многофакторный корреляционно-регрессионный анализ - Статистическое изучение взаимосвязи социально-экономических явлений
Явления общественной жизни складываются под воздействием целого ряда факторов, то есть являются многофакторными. Между факторами существуют сложные взаимосвязи, поэтому их нельзя рассматривать как простую сумму изолированных влияний. Изучение связи между тремя и более связанными между собой признаками носит название многофакторного корреляционно-регрессионного анализа.
Впервые это понятие было введено Пирсоном в 1908 году.
Многофакторный корреляционно-регрессионный анализ включает в себя следующие этапы:
- - теоретический анализ, направленный на выбор факторных признаков, существенных для поставленной задачи; - выбор формы связи (уравнения регрессии); - отбор существенных факторных признаков, удаление из модели несущественных, объединение нескольких факторных признаков в один (этот признак не всегда имеет содержательную интерпретацию); - вычисление параметров уравнения регрессии и коэффициентов корреляции; - проверка адекватности полученной модели; - интерпретация полученных результатов.
На этапе отбора факторных признаков необходимо учитывать, что даже если числовые данные свидетельствуют о наличии связи между двумя величинами, это может быть лишь отражением того факта, что они обе зависят от одной или нескольких величин (например, длина волос - рост - пол; синдром пингвина).
Для любой формы зависимости, особенно в условиях малого объема исследуемой совокупности можно выбрать целый ряд уравнений, которые в той или иной степени будут описывать эти связи. Практика построения многофакторных моделей взаимосвязи показывает, что обычно для описания зависимостей между социально-экономическими явлениями используют линейные, полиномиальные, степенные, гиперболические функции. При выборе модели пользуются опытом предшествующих исследований или исследований в смежных областях.
Преимуществом линейных моделей является простота расчета параметров и экономической интерпретации. Зависимости, нелинейные по переменным (квазилинейные) могут быть приведены к линейной форме путем замены переменных. Параметры уравнения множественной регрессии находятся по методу наименьших квадратов из системы нормальных уравнений. В условиях использования ЭВМ определение параметров, как для линейных, так и для нелинейных зависимостей может быть осуществлено численными методами.
Важным этапом построения уже выбранного уравнения множественной регрессии является отбор факторных признаков. Для адекватного отражения моделируемого процесса в модель необходимо включить максимальное количество факторов, но, с другой стороны, избыточное количество параметров затрудняет работу с моделью. Кроме того, для того, чтобы полученные результаты были достаточно надежными и воспроизводимыми на каждый факторный признак должно приходиться 10-20 наблюдений. Поэтому необходим отбор факторов на основе анализа их значимости.
Отбор факторов может быть проведен на основании:
Метода пошагового исключения;
Метода пошаговой регрессии.
Сущность метода пошагового исключения заключается в последовательном исключении из уравнения регрессии тех факторов, чьи параметры оказались незначимыми при проверке по критерию Стьюдента.
Использование метода пошаговой регрессии заключается в том, что факторы вводятся в уравнение регрессии поочередно, и при этом оценивается изменение суммы квадратов остатков и множественного коэффициента корреляции. Фактор считается незначимым и исключается из рассмотрения, если при его включении в уравнение регрессии не изменилась сумма квадратов остатков, даже если при этом изменились коэффициенты регрессии. Фактор считается значимым и включается в модель, если при этом увеличился коэффициент множественной корреляции и уменьшилась сумма квадратов остатков, даже если при этом коэффициенты регрессии изменились несущественно.
При построении моделей регрессии может возникнуть проблема, связанная с мультиколлинеарностью. Сущность этой проблемы заключается в том, что между факторными признаками существует значительная линейная связь. Мультиколлинеарность возникает в том случае, когда факторы выражают одну и ту же сторону явления или один является составным элементом другого. Это приводит к искажению рассчитываемых параметров регрессии, осложняет выделение существенных факторов и изменяет смысл экономической интерпретации коэффициентов регрессии. Индикатором мультиколлинеарности служат выборочные коэффициенты корреляции () характеризующие тесноту связи между факторами и :
.
Устранение мультиколлинеарности может реализовываться путем исключения из корреляционной модели одного или нескольких линейно-связанных признаков или преобразование исходных факторных признаков в новые, укрупненные факторы.
После построения уравнения регрессии проводится проверка адекватности модели, включающая в себя проверку значимости уравнения регрессии и коэффициентов регрессии.
Вклад каждого фактора в изменение результативного признака оценивают по коэффициентам регрессии, по частным коэффициентам эластичности каждого фактора и по стандартизированным частным - коэффициентам регрессии.
Коэффициент регрессии показывает абсолютный уровень влияния фактора на результативный показатель при среднем уровне всех прочих входящих в модель факторов. Однако тот факт, что коэффициенты измеряются (в общем случае) в разных единицах измерения, не позволяет сравнить степени влияния признаков. Пример. Сменная добыча угля (т) зависит от мощности пласта (м) и уровня механизации (%):
.
Частные коэффициенты эластичности показывают, на сколько процентов в среднем изменяется анализируемый показатель с изменением на 1% каждого фактора при фиксированном положении других:
,
Где - коэффициент регрессии при - том факторе, - среднее значение - того фактора, - среднее значение результативного признака.
- коэффициенты показывают, на какую часть среднего квадратического отклонения изменяется результативный признак с изменением - того факторного признака на величину его среднего квадратического отклонения.
,
Где - среднее квадратическое отклонение - того фактора, - среднее квадратическое отклонение результативного признака.
Таким образом, по перечисленным показателям выявляют факторы, в которых заложены наибольшие резервы изменения результативного признака.
Кроме того, для выявления экстремальных наблюдений может быть проведен анализ остатков.
В рамках многомерного корреляционного анализа рассматривают две типовые задачи:
- - оценка тесноты связи двух переменных при фиксировании или исключении влияния всех остальных; - оценка тесноты связи одной переменной со всеми остальными.
В рамках решения первой задачи определяются частные коэффициенты корреляции - показатели, характеризующие тесноту связи между тым и тым признаками при элиминации всех остальных признаков.
В многомерном корреляционном анализе рассматриваются две типовые задачи:
Определение тесноты связи одной переменной (результативного признака) с совокупностью всех остальных переменных (факторных признаков), включенных в анализ.
Определение тесноты связи между двумя переменными при фиксировании или исключении влияния остальных переменных.
Эти задачи решаются при помощи множественных и частных коэффициентов корреляции.
Для их определения может быть использована матрица выборочных коэффициентов корреляции:
,
Где - количество признаков, - выборочный парный коэффициент корреляции.
Тогда теснота взаимосвязи результативного признака с совокупностью факторных признаков в целом может быть измерена при помощи множественного (совокупного) коэффициента корреляции. Оценкой этого показателя является выборочный множественный коэффициент корреляции:
,
Где - определитель матрицы
С помощью множественного коэффициента корреляции может быть сделан вывод о тесноте взаимосвязи, но не о ее направлении.
Если факторные признаки коррелируют друг с другом, то на величине парного коэффициента корреляции частично сказывается влияние других переменных. В связи с этим возникает задача исследовать частную корреляцию между переменными при исключении (элиминировании) влияния одной или нескольких других переменных. Выборочный частный коэффициент корреляции между переменными может быть рассчитан по формуле:
,
Где - алгебраическое дополнение соответствующего элемента корреляционной матрицы
Частный коэффициент корреляции может принимать значения от -1 до 1.
Похожие статьи
-
Экономический корреляционный регрессионный Парная линейная регрессия Парная регрессия характеризует связь между двумя признаками: результативным и...
-
Причинность, регрессия, корреляция Исследование объективно существующих зависимостей и взаимосвязей между явлениями и процессами - важнейшая задача...
-
Частным случаем недетерминированной связи является связь случайная - стохастическая (вероятностная). Реализация вероятностного подхода к описанию...
-
Методы анализа взаимосвязи - Статистическое изучение взаимосвязи социально-экономических явлений
Первым и обязательным этапом изучения взаимосвязи социально-экономических явлений является качественный анализ природы явления методами экономической...
-
Для определения тесноты связи при числе показателей, большем двух используется коэффициент конкордации: , Где - количество факторов (показателей); -...
-
Важнейшей задачей науки является исследование объективно существующих связей между явлениями. Знание их характера и величины может помочь управлять...
-
Важной задачей статистики является разработка методики статистической оценки социально-экономических явлений, которая осложняется тем, что многие...
-
Парная нелинейная регрессия - Статистическое изучение взаимосвязи социально-экономических явлений
Наиболее часто при описании взаимосвязи социально-экономических явлений, кроме линейной модели, используют следующие виды зависимостей: Гиперболическая ;...
-
Сущность и основные условия применения корреляционного анализа В соответствии с сущностью корреляционной связи ее изучение имеет две цели: 1) измерение...
-
КОВАРИАЦИОННЫЙ АНАЛИЗ, ПАРНАЯ КОРРЕЛЯЦИЯ - Многомерный статистический анализ
По сути дела эта дисперсионный анализ, который включает, по крайней мере, одну категориальную независимую переменную и одну интервальную или метрическую...
-
После проведения регрессионного анализа получается модель объекта исследований в виде некоторой функции. В простейшем случае линейной регрессии она имеет...
-
Собственно-корреляционные параметрические методы изучения связи - Основы эконометрики
Измерение тесноты и направления связи является важной задачей изучения и количественного измерения взаимосвязи социально-экономических явлений. Оценка...
-
МНОГОФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ - Многомерный статистический анализ
Часто при исследованиях приходится иметь дело с одновременным влиянием нескольких факторов. Например - влияет ли на выбор потребителем конкретной...
-
Подсчитаем функцию эластичности по формуле В нашем случае или Значение эластичности в средней точке Показывает, что при изменении X на 1% Y меняется на...
-
Анализ накладных расходов -2. По данным, представленным в табл. 1, исследуется зависимость между величиной накладных расходов 40 строительных организаций...
-
Понятие рядов динамики и их классификация Среди основных задач статистики важное место занимает описание изменений показателей во времени, изучение...
-
Анализ временных рядов - Статистическое исследование инвестиционной деятельности в регионе
Временной ряд - Это последовательность чисел; его элементы - это значения некоторого протекающего во времени процесса. Проведем анализ временных рядов....
-
ТОЧНОСТЬ ПРЕДСКАЗАНИЙ - Многомерный статистический анализ
Чтобы оценить точность предсказанных (теоретических) значений Y, полезно вычислить стандартную ошибку оценки уравнения регрессии SEE . Эта статистика...
-
ПАРНАЯ РЕГРЕССИЯ - Многомерный статистический анализ
Это метод установления математической зависимости между одной метрической зависимой (критериальной) переменной и одной метрической независимой переменной...
-
Регрессионный анализ данных - Статистическое исследование инвестиционной деятельности в регионе
Если расчет корреляции характеризует силу связи между переменными, то регрессионный анализ служит для определения вида этой связи и дает возможность для...
-
Парный регрессионный анализ - Практические аспекты эконометрического анализа
Парный регрессионный анализ рассматривает проблему для случая однофакторного признака. Пусть имеется набор значений двух переменных: yi и хi Между этими...
-
ФАКТОРНАЯ МОДЕЛЬ ПРИ НОРМИРОВАННЫХ ПЕРЕМЕННЫХ - Многомерный статистический анализ
С математической точки зрения факторный анализ аналогичен множественному регрессионному анализу в том смысле, что каждая переменная выражена как линейная...
-
ДОПУЩЕНИЯ МОДЕЛИ РЕГРЕССИОННОГО АНАЛИЗА, ФАКТОРНЫЙ АНАЛИЗ - Многомерный статистический анализ
Регрессионная модель при оценке параметров и проверке значимости исходит из ряда допущений: 1. Ошибочный член уравнения регрессии (остаточный компонент)...
-
Понятие вариации Вариация - это многообразие, колеблемость, изменяемость величины признака у единиц статистической совокупности. Вариация порождается...
-
Тадии парного регрессионного анализа можно представить на следующем рисунке ПОЛЕ КОРРЕЛЯЦИИ Это графическое изображение точек с координатами, которые...
-
Применим аппарат. Результаты приведены ниже Таблица 6. индексный анализ Рисунок 4. График сглаженного признака Полиномиальная регрессия Приведем массив...
-
Помимо технических характеристик здания, анализируемых выше, объекты офисной недвижимости характеризуются факторами удобства для арендаторов. К таким...
-
Доверительные интервалы для оцененных параметров Уровень доверия Количество степеней свободы 17 Критическое значение статистики Стьюдента Доверительный...
-
ДОПУЩЕНИЯ В ДИСПЕРСИОННОМ АНАЛИЗЕ - Многомерный статистический анализ
Все допущения дисперсионного анализа можно обобщить в следующем виде. 1. Обычно считается, что уровни независимой переменной фиксированные....
-
ПОНЯТИЕ ДИСПЕРСИОННОГО АНАЛИЗА - Многомерный статистический анализ
Дисперсионный анализ - Это статистический метод изучения различий между выборочными средними двух или больше совокупностей. Как правило, Нулевая гипотеза...
-
Принятие решений на основе уравнений регрессии - Основы эконометрики
Интерпретация Моделей регрессии осуществляется методами той отрасли знаний, к которой относится исследуемое явление. Но всякая интерпретация начинается...
-
Подсчитаем функцию эластичности по формуле В нашем случае Или Значение эластичности в средней точке Показывает, что при изменении X на 1% Y меняется на...
-
Парная регрессия на основе метода наименьших квадратов и метода группировок - Основы эконометрики
Парная регрессия Характеризует связь между двумя признаками: результативным и факторным. Аналитически связь между ними описывается уравнениями: Прямой...
-
ВРАЩЕНИЕ И ИНТЕРПРЕТАЦИЯ ФАКТОРОВ - Многомерный статистический анализ
Вращение факторов. Матрицу факторных нагрузок называют также матрицей факторного отображения. Она содержит коэффициенты, используемые для выражения...
-
Можно выделить девять этапов факторного анализа. Для наглядности представим эти этапы на схеме, а затем дадим им краткую характеристику. Этапы выполнения...
-
СТАТИСТИКИ ФАКТОРНОГО АНАЛИЗА - Многомерный статистический анализ
Критерий сферичности Бартлетта. Статистика, проверяющая гипотезу о том, что переменные в генеральной совокупности не коррелируют между собой. Другими...
-
Моделирование числа предприятий в РФ - Статистический анализ предпринимательства
Приведем данные (взяты из справочника Регионы России), характеризующие число предприятий в РФ. Год 1995 1996 1997 1998 1999 2000 2001 2002 2003 Число...
-
СПОСОБЫ ОПИСАНИЯ СТРУКТУР. МОРФОЛОГИЯ СОЦИАЛЬНО-ПОЛИТИЧЕСКОЙ И ЭКОНОМИЧЕСКОЙ СФЕР Структурное моделирование. Структурный анализ Основная цель...
-
ТЕСНОТА И ЗНАЧИМОСТЬ СВЯЗИ - Многомерный статистический анализ
Соответствующий статистический вывод включает определение тесноты и значимости связи между Х и Y. Тесноту связи измеряют коэффициентом детерминации R 2 ....
-
После получения матриц спектра плана, проведем 70 опытов в каждой точке. По полученным параметрам построим регрессионную модель второго порядка,...
Многофакторный корреляционно-регрессионный анализ - Статистическое изучение взаимосвязи социально-экономических явлений