Регрессионный анализ данных - Статистическое исследование инвестиционной деятельности в регионе

Если расчет корреляции характеризует силу связи между переменными, то регрессионный анализ служит для определения вида этой связи и дает возможность для прогнозирования значения одной (зависимой) переменной, отталкиваясь от значения другой независимой переменной.

Целью регрессионного анализа является подбор наиболее подходящей под данный вид связи линии регрессии. Можно выбрать одну из следующих различных моделей, которым соответствуют формулы

Модель

Формула

Линейная

Логарифмическая

Обратная

Квадратичная

Кубическая

Степенная

Показательная (комбинированная)

Логистическая

Экспоненциальная

С помощью регрессионного анализа мы можем определить вид связи, а также выразить ее с помощью уравнения регрессии.

Таблица 11. Сначала исследуем зависимость между "всего" и "республиканский бюджет"

Сводка модели и оценки параметров

Зависимая переменная:Всего

Уравнение

Сводка для модели

Оценки параметра

R-квадрат

F

Ст. св.1

Ст. св.2

Знч.

Константа

B1

B2

B3

Линейный

,560

12,702

1

10

,005

389054,703

7,326

Логарифмическая

,586

14,155

1

10

,004

-1130798,594

201945,684

Обратная

,222

2,859

1

10

,122

811397,482

-1,816E8

Квадратичный

,655

8,539

2

9

,008

237648,100

34,836

,000

Кубический

,667

5,338

3

8

,026

293264,158

22,136

5,623E-5

-1,161E-9

Составная

,456

8,379

1

10

,016

280152,305

1,000

Степенная

,593

14,573

1

10

,003

18014,468

,358

S

,343

5,212

1

10

,046

13,299

-397,052

Роста

,456

8,379

1

10

,016

12,543

1,165E-5

Экспоненциальная

,456

8,379

1

10

,016

280152,305

1,165E-5

Логистическая

,456

8,379

1

10

,016

3,569E-6

1,000

Независимой переменной является Республиканский_бюджет.

подбор линии регрессии для переменных

Рис.8. Подбор линии регрессии для переменных "всего" и "республиканский бюджет"

На графике (рис.8) изображены различные виды линий регрессии для связи общего числа инвестиций и за счет республиканского бюджета. Необходимо определить, какая из них наиболее точно описывает вид связи между переменными. Качество подобранной линии регрессии оценивается с помощью коэффициента детерминации (R-квадрат). Эта величина характеризует степень соответствия между регрессионной моделью и исходными данными. Мера определенности всегда лежит в диапазоне от 0 до 1. По максимальному значению коэффициента детерминации определим вид нашего уравнения.

R-квадрат максимальный равен 0,667 и соответствует кубическому виду связи и уравнению. Коэффициенты b0,b1,b2,b3Выведены в соответствующей строке и равны 0 , 22.136,5,623E-5,-1,161E-9 соответственно.

Уравнение регрессии имеет вид:

Всего=22,136*(Республиканский бюджет)+5,623E-5*(Республиканский бюджет)2-1,161E-9(Республиканский бюджет)3

Теперь исследуем зависимость между "Всего" и "Местный Бюджет"

Таблица регрессионного анализа 12

Сводка модели и оценки параметров

Зависимая переменная:Всего

Уравнение

Сводка для модели

Оценки параметра

R-квадрат

F

Ст. св.1

Ст. св.2

Знч.

Константа

B1

B2

B3

Линейный

,722

25,921

1

10

,000

25166,166

47,727

ЛогарифмическаяA

.

.

.

.

.

,000

,000

ОбратнаяB

.

.

.

.

.

,000

,000

Квадратичный

,725

11,889

2

9

,003

-26603,203

58,034

,000

Кубический

,748

7,936

3

8

,009

60617,978

1,283

,005

-1,057E-7

Составная

,780

35,472

1

10

,000

134452,223

1,000

СтепеннаяA

.

.

.

.

.

,000

,000

SB

.

.

.

.

.

,000

,000

Роста

,780

35,472

1

10

,000

11,809

8,741E-5

Экспоненциальная

,780

35,472

1

10

,000

134452,223

8,741E-5

Логистическая

,780

35,472

1

10

,000

7,438E-6

1,000

Независимой переменной является Местный_бюджет.

A. Независимая переменная (Местный_бюджет) содержит неположительные значения. Минимальное значение равно 0. Логарифмическая и Степенная модели не могут быть оценены.

B. Независимая переменная (Местный_бюджет) содержит нулевые значения. Обратная и S модели не могут быть оценены.

подбор линии регрессии для переменных

Рис.9. Подбор линии регрессии для переменных "всего" и "местный бюджет"

На графике (рис.9) изображены различные виды линий регрессии для связи общего числа инвестиций и за счет местного бюджета. Необходимо определить, какая из них наиболее точно описывает вид связи между переменными. Качество подобранной линии регрессии оценивается с помощью коэффициента детерминации (R-квадрат). Эта величина характеризует степень соответствия между регрессионной моделью и исходными данными. Мера определенности всегда лежит в диапазоне от 0 до 1. По максимальному значению коэффициента детерминации определим вид нашего уравнения.

R-квадрат максимальный равен 0,748 и соответствует кубическому виду связи и уравнению. Коэффициентывыведены в соответствующей строке и равны 0, 1.283, 0.005,-1.057E-7.

Уравнение регрессии имеет вид:

Всего = 1,283*(Местный Бюджет)+0,005*(Местный Бюджет)2-1,057E-7*(Местный Бюджет)3.

Теперь исследуем связь между "всего" и "собственных средств организаций".

Таблица регрессионного анализа 13

Сводка модели и оценки параметров

Зависимая переменная:Всего

Уравнение

Сводка для модели

Оценки параметра

R-квадрат

F

Ст. св.1

Ст. св.2

Знч.

Константа

B1

B2

B3

Линейный

,996

2606,100

1

10

,000

-4644,786

1,119

Логарифмическая

,909

100,241

1

10

,000

-6359130,320

545297,370

Обратная

,697

23,051

1

10

,001

1227893,345

-1,451E11

Квадратичный

,996

1201,547

2

9

,000

4313,708

1,074

3,067E-8

Кубический

,997

803,445

3

8

,000

-35755,452

1,397

-4,876E-7

2,186E-13

Составная

,916

108,444

1

10

,000

140169,005

1,000

Степенная

,998

4638,423

1

10

,000

1,020

1,006

S

,910

101,447

1

10

,000

14,113

-291994,375

Роста

,916

108,444

1

10

,000

11,851

1,890E-6

Экспоненциальная

,916

108,444

1

10

,000

140169,005

1,890E-6

Логистическая

,916

108,444

1

10

,000

7,134E-6

1,000

Независимой переменной является Собственных_средств_организаций.

подбор линии регрессии для переменных

Рис.10. Подбор линии регрессии для переменных "всего" и "собственных средств организаций"

На графике (рис.10) изображены различные виды линий регрессии для связи общей площади лесонасаждений и площади, непокрытой лесом. Необходимо определить, какая из них наиболее точно описывает вид связи между переменными. Качество подобранной линии регрессии оценивается с помощью коэффициента детерминации (R-квадрат). Эта величина характеризует степень соответствия между регрессионной моделью и исходными данными. Мера определенности всегда лежит в диапазоне от 0 до 1. По максимальному значению коэффициента детерминации определим вид нашего уравнения.

R-квадрат максимальный равен 0,998 и соответствует степенному виду связи и уравнению. Коэффициенты и выведены в соответствующей строке и равны 0 и 1.

Уравнение регрессии имеет вид:

Всего = 1.006(Собственных средств организаций)

Теперь исследуем связь между "всего" и "прочих источников".

Таблица регрессионного анализа 14.

Сводка модели и оценки параметров

Зависимая переменная: Всего

Уравнение

Сводка для модели

Оценки параметра

R-квадрат

F

Ст. св.1

Ст. св.2

Знч.

Константа

B1

B2

B3

Линейный

,507

10,266

1

10

,009

243055,374

27,319

Логарифмическая

,427

7,452

1

10

,021

-1387123,876

231454,182

Обратная

,181

2,214

1

10

,168

792243,518

-2,200E8

Квадратичный

,508

4,639

2

9

,041

262688,579

23,100

,000

Кубический

,599

3,981

3

8

,052

46013,544

111,789

-,005

7,915E-8

Составная

,480

9,226

1

10

,013

210637,236

1,000

Степенная

,447

8,082

1

10

,017

10750,057

,417

S

,218

2,782

1

10

,126

13,226

-424,675

Роста

,480

9,226

1

10

,013

12,258

4,684E-5

Экспоненциальная

,480

9,226

1

10

,013

210637,236

4,684E-5

Логистическая

,480

9,226

1

10

,013

4,747E-6

1,000

Независимой переменной является Прочих_источников.

линии регрессии для переменных

Рис.11.Подбор линии регрессии для переменных "всего" и "прочих источников"

На графике (рис.11) изображены различные виды линий регрессии для связи общей площади лесонасаждений и площади, непокрытой лесом. Необходимо определить, какая из них наиболее точно описывает вид связи между переменными. Качество подобранной линии регрессии оценивается с помощью коэффициента детерминации (R-квадрат). Эта величина характеризует степень соответствия между регрессионной моделью и исходными данными. Мера определенности всегда лежит в диапазоне от 0 до 1. По максимальному значению коэффициента детерминации определим вид нашего уравнения.

R-квадрат максимальный равен 0,599 и соответствует кубическому виду связи и уравнению. Коэффициенты выведены в соответствующей строке и равны 0,111.789,-0.005,7,915E-8 .

Уравнение регрессии имеет вид:

Всего = 111.789*(Прочих источников)-0,005*(Прочих источников)2+7,915E-8*(Прочих источников)3

Похожие статьи




Регрессионный анализ данных - Статистическое исследование инвестиционной деятельности в регионе

Предыдущая | Следующая