Спецификация ошибок регрессионной модели - Статистика тарифообразования в страховании

Ошибки регрессии - это разности между наблюдаемыми значениями и значениями, предсказанными изучаемой регрессионной моделью. В данной работе ошибки регрессии были протестированы на соответствие различным критериям.

В первую очередь ошибки требуется проверить на нормальное распределение. Обычно в расчет берется предположение, что ошибки распределены нормально, т. е. проверяется гипотеза: Н: е~N(0, у2I). Для проверки гипотеза используется критерий Жарка-Бера:

Результаты расчетов представлены в таблице (П.2.Рис.3):

JB

2,007

Ч2кр

5,991

Таким образом, гипотеза о нормальности остатков не отвергается с вероятностью ошибки 5%.

После этого была проведена проверка данных на гетероскедастичность. С помощью теста Бреуша-Пагана-Готфрида была проверена гипотеза о наличии гетероскедастичности ошибок в полученной регрессионной модели. В данном тесте проверяется линейная зависимость дисперсии случайных ошибок от некоторого набора переменных и сравнивается со статистикой Хи-квадрат:

Для построенной модели были получены следующие результаты:

Ч2набл(1)

3,356

Ч2набл(2)

4,038

Ч2кр

6,635

Так как наблюдаемые значения меньше критического, гипотеза об отсутствии гетероскедастичности не отвергается с вероятностью ошибки 1%.

Кроме этого, ошибки регрессионной модели были проверены на наличие автокорреляции. Для проверки были выведены значения автокорреляционной и частной автокорреляционной функции остатков (П.2.Рис.4). По графику видно, что все значения находятся в пределах доверительного интервала, что означает, что автокорреляции в остатках не наблюдается.

Таким образом, в данной главе было рассмотрено влияние различных экономических и социально-экономических факторов на объемы страховых поступлений в различных регионах РФ. Методом пошагового исключения переменных была выбрана модель, которая представляет собой зависимость объемов страховых поступлений на душу населения от следующих факторов: вклады физических лиц на рублевых счетах в Сберегательном Банке РФ на душу населения, ожидаемая продолжительность жизни при рождении и коэффициент демографической нагрузки. Модель объясняет около 29,1% вариации исследуемого признака.

Последующее изучение построенной модели показало, что линейная форма является наиболее оптимальной и лучше других описывает исследуемую зависимость. Кроме того, ошибки регрессии соответствуют всем требованиям: автокорреляции и гетероскедастичности не обнаружено, распределение ошибок является нормальным.

Похожие статьи




Спецификация ошибок регрессионной модели - Статистика тарифообразования в страховании

Предыдущая | Следующая