Метод наименьших квадратов, Построение регрессионной прямой по сгруппированным данным - Моделирование в эконометрике

Вычисляют выборочную дисперсию, характеризующую меру разброса опытных данных (xI; YI) вокруг значений регрессии, то есть дисперсию остатков

.

Знаменатель показывает число степеней свободы. Оно определяется как разность между объемом выборки и числом параметров регрессии, подлежащих оценке. Стандартной ошибкой регрессии называется

.

Стандартная ошибка должна быть минимальна, это равносильно условию:

. (1)

Геометрическая интерпретация формулы (1) следующая: сумма площадей заштрихованных квадратов должна быть наименьшей.

Пусть yI = B0 + B1X1; i = 1, 2, ..., n; тогда

и надо найти B0 и B1.

Для наличия экстремума S(b0; B1) необходимо выполнение равенств:

(2)

Для вторых частных производных функции S(b0; B1) справедливы соотношения:

Существование минимума обеспечивается выполнением условия:

После преобразований уравнений (2) получаем систему двух уравнений первой степени (систему нормальных уравнений) относительно неизвестных B0 и B1:

(3)

Применяя к ней правило Крамера, получаем:

Получить B0 и B1 из уравнений (3) можно по-другому. Первое из уравнений системы почленно разделим на N. Тогда

; или

, откуда ;

; .

Коэффициент регрессии B1 можно представить следующим образом:

, где

- ковариация между переменными X и Y, - дисперсия переменной X.

Вычислим коэффициенты регрессии общей суммы налогового сбора (переменная y) на сумму поступлений налога на добавленную стоимость по несгруппированным данным:

Время наблюдения

№ наблюдения

Y (общая сумма налогов и платежей в консолидированный бюджет РФ), млрд. руб.

X (общая сумма поступлений в консолидированный бюджет РФ по НДС), млрд. руб.

XI2

YI2

XIYI

Январь

1

38,9

13,4

179,56

1513,21

521,26

Февраль

2

45,3

15,4

237,16

2052,09

697,62

Март

3

61,1

16,7

278,89

3733,21

1020,37

Апрель

4

70,4

16,2

262,44

4956,16

1140,48

Май

5

63,8

13,0

169

4070,44

829,4

Июнь

6

67,7

15,0

225

4583,29

1015,5

Июль

7

70,6

20,8

432,64

4984,36

1468,48

Август

8

78,9

16,4

268,96

6225,21

1293,96

Сентябрь

9

73,2

17,4

302,76

5358,24

1273,68

Октябрь

10

78,1

23,6

556,96

6099,61

1843,16

Ноябрь

11

103,0

23,9

571,21

10609

2461,7

Декабрь

12

133,4

34,4

1183,36

17795,56

4588,96

У

884,4

226,1

4667,94

71980,4

18154,6

График уравнения регрессии y на x выглядит следующим образом:

Экономические явления обычно находятся во взаимодействии, то есть переменная Y зависит от переменной X, и наоборот, переменная X зависит от переменной Y. В этом случае говорят о логически обратимой регрессии. При переходе от одной зависимости к другой нельзя из уравнения

Выразить X выразить через Y, так как эмпирические точки лежат не на прямой, а подвержены рассеянию и фиксированному значению X может соответствовать несколько значений Y и наоборот.

Уравнения регрессии и не выводимы друг из друга. Они задают сопряженные регрессионные прямые.

Построим регрессию X на Y для рассматриваемого нами примера.

;

График регрессии X на Y будет выглядеть следующим образом:

Совместим графики регрессии X на Y и Y На X:

Регрессионные прямые образуют "ножницы". По величине раствора ножниц можно судить приблизительно о степени зависимости обеих переменных. Чем более раскрыты ножницы, тем слабее связь. Если обе прямые регрессии пересекаются под прямым углом, то эмпирические данные не позволяют подтвердить гипотезу о существовании зависимости между переменными. Если отсутствует регрессия X на Y, то не существует также регрессии Y На X, и наоборот. При B1 = 0 обязательно B1* = 0 и обратно.

Построение регрессионной прямой по сгруппированным данным

При большом числе наблюдений обычно производят группировку данных по одной или нескольким переменным. Для исследования зависимостей желательно использовать равные по ширине интервалы группировок. Неравные интервалы могут привести к искажению регрессии и ошибочным выводам. При большом объеме изучаемой совокупности наиболее целесообразно образовывать 9 - 10 интервалов, равномерно заполненных частотами. При небольших объемах совокупности нет смысла производить группировку данных. Оценки, вычисленные по сгруппированному материалу, отличаются от оценок, вычисленных по несгруппированному материалу. Причина этого - в переходе при расчетах к серединам интервалов и условно принятому равномерному распределению частот по ширине этих интервалов. При большом объеме данных считается, что неточности в результатах за счет группировки вполне искупаются упрощением процедуры вычисления.

Похожие статьи




Метод наименьших квадратов, Построение регрессионной прямой по сгруппированным данным - Моделирование в эконометрике

Предыдущая | Следующая