Регрессионный анализ влияния качества окружающей среды на население - Анализ влияния качества окружающей среды на здоровье населения

В данном параграфе будет анализироваться взаимосвязь переменных, характеризующих смертность и продолжительность жизни, и факторов, отражающих степень загрязненности водных ресурсов и воздуха в регионах РФ.

Первым этапом анализа воздействия экологии на население России будет построение регрессии для смертности от злокачественных новообразований (переменная Y1).

Сначала было построено уравнение регрессии методом включения переменных (процедура Forward stepwise). Суть его заключается в том, что в уравнение поочередно включаются переменные, наиболее коррелируемые с объясняемой переменной. Однако данный способ не дал результатов, так как на первом шаге ни одна из переменных не оказалась значима, и, следовательно, уравнение регрессии невозможно построить (см. Приложение 13).

Следующим способом построения регрессии является процедура исключения переменных (Backward stepwise). В изначальное уравнение включим все выбранные объясняющие переменные. Следом на каждом шаге будем исключать те переменные, t-статистика которых по модулю наименьшая. Процедура продолжается до тех пор, пока все коэффициенты регрессии не станут значимыми. Результаты метода представлены в Приложении 14-15, а оценки параметров и итоговая регрессия выглядят следующим образом:

(3,45463) (0,00794) (0,00001)

R2 = 0,14331

Полученное уравнение регрессии является значимым на основании F-критерия Фишера. Коэффициент детерминации R2 говорит о том, что полученное уравнение регрессии объясняет 14% переменной Y1. Остатки регрессии распределены по нормальному закону (Приложение 16). Можно сказать, что полученная модель хорошо подходит для данных. Таким образом, можно сказать, что существует взаимосвязь смертности от злокачественных новообразований и качеством атмосферного воздуха: при увеличении объема выбросов загрязняющих воздух веществ на одного человека на одну тонну стандартизированный коэффициент смертности от злокачественных новообразований увеличивается на 0,01748 пункта. Полученное отношение подтверждает предположение о негативном влиянии загрязнения окружающей среды на здоровье.

Следующим этапом регрессионного анализа будет построение регрессии для переменной Y2 (стандартизованный коэффициент смертности от болезней органов дыхания).

Метод включения переменных также не дал результатов: ни одна из переменных не оказалась значимой на первом шаге (см. Приложение 17). А метод исключения переменных, показал, что на смертность от болезней органов дыхания положительно влияет объем выбросов загрязняющих веществ в атмосферу и плотность загрязнения воздуха. Полученная регрессия выглядит следующим образом:

(3,04038) (0,00895) (0,69825) (0,00001)

R2 = 0,26662

Данное уравнение является статистически значимым (на основании F-критерия Фишера), объясняющая сила равна 26,6%, остатки распределены нормально (см. Приложение 18-20). Полученные результаты говорят о том, что с ростом объема загрязняющих атмосферный воздух выбросов на одного человека и единицу территории региона, стандартизированный коэффициент смертности от респираторных заболеваний увеличивается. При этом, в сравнении с предыдущим уравнением регрессии, влияние факторов окружающей среду здесь более существенно (коэффициенты при x1 И x2).

Третьим этапом анализа является построение уравнения регрессии для ожидаемой продолжительности жизни при рождении (переменная Y3).

Процедура Forward stepwise (Приложение 21-22) показала, что продолжительность жизни отрицательно зависит от загрязнения воды:

(0,44925) (0,00237) (0,00000)

R2 = 0,16698

Уравнение регрессии значимо на основании критерия Фишера, остатки распределены нормально (Приложение 23). Исходя из полученных коэффициентов при независимых переменных, модно сделать вывод о том, что качество водных ресурсов оказывает влияние на продолжительность жизни населения России. Так, с сокращением объема сброшенной загрязненной воды на одну тонну, продолжительность жизни увеличится на 0,00528 лет.

Обратная процедура Backward stepwise дала следующий результат:

(0,372080) (0,000855) (0,000001)

R2 = 0,182817

Все коэффициенты, а также само уравнение регрессии являются значимыми (Приложение 24-25). Данное уравнение регрессии говорит о негативном влиянии загрязненности атмосферного воздуха на продолжительность жизни. С увеличением объема выбросов в атмосферу загрязняющих веществ продолжительность жизни сокращается на 0,002095 лет.

Выбирая из двух уравнений регрессий, предпочтение отдадим последней, так как ее объясняющая сила на 2 процентных пунктов выше, а, следовательно, большая доля зависимого признака объясняется изменениями независимыми переменными.

нормальный вероятностный график остатков для регрессии y(методом backward stepwise)

Рис. 22 Нормальный вероятностный график остатков для регрессии Y3 (методом Backward stepwise)

Однако, график остатков полученной регрессии для Y3 (Рис. 22) ставит под сомнение адекватность выбранной модели, так как остатки на графике не лежат на прямой линии. Поэтому дополнительно проверим остатки на нормальность с помощью теста Харки-Бера [12].

Таблица 3

Тест Харки-Бера

КОЭФФИЦИЕНТ ЭКСЦЕССА

КОЭФФИЦИЕНТ АСИММЕТРИИ

JARQUE-BERA

P-VALUE

2,956539

-0,43383058

1,603790023

0,448478287

Так как значение статистики p-value больше 0,05, нулевая гипотеза о нормальности распределения остатков не отвергается, и, следовательно, имеет место быть нормальное распределение остатков регрессии. Также был выполнен тест Уайта [12] на наличие зависимости остатков от переменных x1 и x6. Гипотеза об отсутствии гетероскедастичности подтвердилась, таким образом, остатки регрессии гомоскедастичны (Таблица 4).

Таблица 4

Тест Уайта

CHI-SQ.

CHI-SQ. CR.

P-VALUE

1,5718

5,9915

0,4557

На основании проделанного выше анализа, можно утверждать, что регрессионная модель для Y3 адекватна.

Таким образом, негативное влияние факторов окружающей среды, таких как загрязненность воды и воздуха имеет место быть, хотя экологическое воздействие не является ключевым показателем, определяющим продолжительность жизни.

В данной главе были построены уравнения регрессий, демонстрирующие взаимосвязь между загрязнением и продолжительностью жизни и смертностью от респираторных и злокачественных новообразований. Ввиду наличия линейной зависимости между независимыми переменными, регрессионные модели строились методами включения и исключения переменных. В итоге, мы получили четыре модели, объясняющие зависимость переменных Y1, Y2 и Y3 от переменных, характеризующих качество отгружающей среды, x1-3 И от контрольных переменных x4-8.

Таким образом, можно сделать следующие выводы:

    - Из уравнения Y1 было получено, что росту смертности от злокачественных новообразований способствует увеличение объема загрязняющих атмосферу выбросов; - Уравнение Y2 говорит о влиянии объема выбросов загрязняющих веществ в атмосферу и плотности загрязнения воздуха на рост смертности от болезней органов дыхания; - Из уравнений для Y3 Можно заключить о негативном влиянии на продолжительность жизни загрязненности воды и воздуха.

Похожие статьи




Регрессионный анализ влияния качества окружающей среды на население - Анализ влияния качества окружающей среды на здоровье населения

Предыдущая | Следующая