Основы корреляционно-регрессионного анализа - Сущность статистики и ее применение в экономике

Термин "корреляция" впервые применил французский палеонтолог Ж. Кювье, который вывел "закон корреляции частей и органов животных" (этот закон позволяет восстанавливать по найденным частям тела облик всего животного). В статистику указанный термин ввел в 1886 году английский биолог и статистик Френсис Гальтон (не просто связь - relation, а "как бы связь" - co-relation).

Однако точную формулу для подсчета коэффициента корреляции разработал его ученик - математик и биолог - Карл Пирсон (1857 - 1936).

Связи и зависимости между явлениями могут быть:

Функциональными

Корреляционными

Функциональной называется связь, при которой определенному значению одного признака всегда соответствует одно или несколько значений другого. Примером функциональной связи могут служить зависимости между давлением и объемом газа.

Корреляционной называется связь, при которой каждому значению факторного признака соответствует несколько значений результативных признаков. Корреляционная связь проявляется при большом числе наблюдений.

Большое значение в исследовании связи имеют статистически - математические методы:

Корреляционные анализы

Дисперсионные анализы

При статистическом изучении связи решают следующие задачи:

Определенные формы связи

Измерение тесноты связи

Выявление влияния факторов на общий результат

Различают следующие формы связи:

Прямая

Обратная

Прямой называется связь, при которой с увеличением факторного признака результативный так же возрастает

Обратной называется связь, при которой с увеличением факторного признака результативный признак уменьшается.

Простейшим видом корреляционной связи является связь между двумя признаками (факторным и результативным) такая связь называется парной корреляционной связью или простой корреляцией. Эту связь можно выразить уравнением прямой линии

Ух= а+вх

Статистический индексный корреляция

Виды корреляций. Виды корреляционной связи между измеренными переменными могут быть различны: так корреляция бывает линейной и нелинейной, положительной и отрицательной. Она линейна, если с увеличением или уменьшением одной переменной, вторая переменная также растет, либо убывает. Она не линейна, если при увеличении одной величины характер изменения второй не линеен, а описывается другими законами (полиномиальная, гиперболическая).

Если повышение уровня одной переменной сопровождается повышением уровня другой, то речь идет о положительной корреляции. Чем выше личностная тревожность, тем больше риск заболеть язвой желудка. Возрастание громкости звука сопровождается ощущением повышения его тона.

Если рост уровня одной переменной сопровождается снижением уровня другой, то мы имеем дело с отрицательной корреляцией.

Корреляционный анализ. Корреляционный анализ (от лат. "соотношение", "связь") применяется для проверки гипотезы о статистической зависимости значений двух или нескольких переменных в том случае, если исследователь может их регистрировать (измерять), но не контролировать. Задача корреляционного анализа сводится к установлению направления (положительное или отрицательное) и формы (линейная, нелинейная) связи между варьирующими признаками, измерению ее тесноты, и, наконец, к проверке уровня значимости полученных коэффициентов корреляции.

Коэффициент корреляции Пирсона. Формула расчета коэффициента корреляции построена таким образом, что, если связь между признаками имеет линейный характер, коэффициент Пирсона точно устанавливает тесноту этой связи. Поэтому он называется также коэффициентом линейной корреляции Пирсона. Если же связь между переменными X и Y не линейна, то Пирсон предложил для оценки тесноты этой связи так называемое корреляционное отношение.

Величина коэффициента линейной корреляции Пирсона не может превышать +1 и быть меньше чем -1. Эти два числа +1 и -1 -- являются границами для коэффициента корреляции. Когда при расчете получается величина большая +1 или меньшая -1 -- следовательно произошла ошибка в вычислениях.

Если коэффициент корреляции по модулю оказывается близким к 1, то это соответствует высокому уровню связи между переменными. Так, в частности, при корреляции переменной величины с самой собой величина коэффициента корреляции будет равна +1. Подобная связь характеризует прямо пропорциональную зависимость. Если же значения переменной Х будут распложены в порядке возрастания, а те же значения (обозначенные теперь уже как переменная Y) будут располагаться в порядке убывания, то в этом случае корреляция между переменными X и Y будет равна точно -1. Такая величина коэффициента корреляции характеризует обратно пропорциональную зависимость.

Знак коэффициента корреляции очень важен для интерпретации полученной связи. Подчеркнем еще раз, что если знак коэффициента линейной корреляции -- плюс, то связь между коррелирующими признаками такова, что большей величине одного признака (переменной) соответствует большая величина другого признака (другой переменной). Иными словами, если один показатель (переменная) увеличивается, то соответственно увеличивается и другой показатель (переменная). Такая зависимость носит название прямо пропорциональной зависимости.

Если же получен знак минус, то большей величине одного признака соответствует меньшая величина другого. Иначе говоря, при наличии знака минус, увеличению одной переменной (признака, значения) соответствует уменьшение другой переменной. Такая зависимость носит название обратно пропорциональной зависимости. При этом выбор переменной, которой приписывается характер (тенденция) возрастания -- произволен. Это может быть как переменная X так и переменная Y. Однако если психолог будет считать, что увеличивается переменная X, то переменная Y будет соответственно уменьшаться, и наоборот. Эти положения очень важно четко усвоить для правильной интерпретации полученной корреляционной зависимости.

Расчет коэффициента корреляции Пирсона предполагает, что переменные X и Y распределены нормально.

Для применения коэффициента корреляции Пирсона, необходимо соблюдать следующие условия:

    1. Сравниваемые переменные должны быть получены в интервальной шкале или шкале отношений. 2. Распределения переменных X и Y должны быть близки к нормальному. 3. Число варьирующих признаков в сравниваемых переменных X и Y должно быть одинаковым. 4. Таблицы уровней значимости для коэффициента корреляции Пирсона рассчитаны от n = 5 до n = 1000.

Похожие статьи




Основы корреляционно-регрессионного анализа - Сущность статистики и ее применение в экономике

Предыдущая | Следующая