Регрессионный анализ эффективности администрирования НДС по странам мира, Построение и анализ регрессионных моделей - Анализ факторов, влияющих на эффективность администрирования налога на добавленную стоимость

Построение и анализ регрессионных моделей

Регрессии (1) и (2) являются обычными сквозными, а (3) и (4) регрессиями с фиксированными эффектами. Регрессии со случайным эффектом автором даже не рассматриваются, в связи с тем, что случайности в определении качестве администрирования налога быть не может, а индивидуальные эффекты, заключающиеся в особенном дизайне налога, методе его сбора или в специфическом законодательстве той или иной страны имеют место быть. Модели (2) и (4) не содержат индекса коррупции, в связи с тем, что он сильно коррелирует с величиной ВВП на душу населения. По причине того, что в выборке участвуют в основном достаточно развитые страны Европы и Россия, ожидается, что влияние макроэкономических показателей будет примерно одинаковое, поэтому нет смысла строить общую модель.

На первом этапе, каждая переменная была протестирована на нормальность распределения для безопасной дальнейшей работы. Было сгенерировано несколько новых переменных для устранения гетероскедастичности: ln_age, ln_imp_cons.

Общая тенденция изменений показателя эффективности администрирования НДС представлена в Приложении 2. Карта сгруппирована по странам и отражает основные тренды. Следует отметить, что России больше чем другим странам свойственна нестабильность показателя эффективности НДС.

пул-регрессия

Рис. 3.1. Пул-регрессия

В целом, можно отметить, что практически все показатели оказались статистически значимыми и обычная сквозная регрессия получилась довольно успешной. Значение Фишера также указывает на значимость модели в целом. Незначимым оказался показатель сельского хозяйства, остальные переменные значимы на 5% уровне. Не будем останавливаться на интерпретации знаков при коэффициентах, отметим только то, что константа положительна - а, значит, у стран хорошие стартовые позиции по администрированию НДС. Не стоит забывать, что придавая значение 0 всем остальным регрессорам мы лишаем смысла данную модель.

Команда robust, умышленно была не использована: для проверки данных модели на гетероскедастичность проведем тест Бреуша-Пагана:

тест бреуша-пагана на гетероскедастичность

Рис. 3.2. Тест Бреуша-Пагана на гетероскедастичность

Значения полученные нами гетероскедастичны, а значит требуют робастную поправку.

Прежде чем построить исправленную модель (1), проверим данные на мультиколлинеарность:

расчет vif. проверка на мультиколлинеарность

Рис. 3.3. Расчет VIF. Проверка на мультиколлинеарность.

Среднее значение VIF меньше 5, а следовательно полной мультиколлинеарности в регрессии не наблюдается.

Оценим распределение остатков регрессии для этого, чтобы элиминировать возможные последствия - построение неправильных доверительных интервалов, неэффективная оценка МНК - не соблюдение условий Гаусса-Маркова.

График распределения остатков отражает нормальность распределения последних. Следовательно, условия Гаусса-Маркова выполняются и можно считать модель самой оптимальной в классе всех несмещенных и эффективных оценок.

Построим аналогичную регрессию с учетом индивидуальных фиксированных оценок (3) и исправим регрессию (1) с учетом робастности:

распределение остатков

Рис. 3.4. Распределение остатков.

сравнением пул-регрессии с fe-регрессией

Рис. 3.5. Сравнением пул-регрессии с FE-регрессией.

Регрессия с индивидуальным фиксированным эффектом исключило две переменные из регрессии в силу коллинеарности. На основе сравнения моделей, без дополнительных корректировок модели (3), можно сделать вывод, что обычная сквозная регрессия лучше чем с фиксированным эффектами. Однако, значимость коэффициентов FE гораздо выше, чем у пул-регрессии, хоть эти данные и не отражены в таблице.

Построим соответственно регрессии для моделей (2) и (4). Для этого необходимо исключить переменную коррупция, которая сильнее остальных факторов проявляет корреляцию и приводит к проблемам при построении модели с фиксированными индивидуальными эффектами (3).

В модели (2) все регрессоры получились значимыми на 1% уровне, модель достаточно качественно отражает реальные связи.

сквозная регрессия, модель 2

Рис. 3.6. Сквозная регрессия, модель 2

При относительно не высоком показателе R, модель получилась значима в целом.

Модель (4) с индивидуальным фиксированным эффектом оказалась значима в целом, все регрессоры значимы на 5% уровне, кроме ВВП на душу населения. Пропущена переменная rate. Наличие корреляции между ошибкой и регрессорами = -0.73, вполне естественное явление и не представляет никакой угрозы, в отличие от случая корреляции с остатками.

Все четыре модели оказались на удивление качественными и значимыми. Этому свидетельствует хорошее значение статистики Фишера, значение R2, значимость полученных регрессоров на 1% и 5 % уровнях. Более подробно сравнение моделей представлено на рис. 3.8.

индивидуальные фиксированные эффекты. модель 4

Рис. 3.7. Индивидуальные фиксированные эффекты. Модель 4.

Автором также проводилась попытка оценивания регрессии "between", однако, модель оказалось в целом не значима, так же как и регрессоры.

сравнение моделей 1-2-3-4

Рис. 3.8. Сравнение моделей 1-2-3-4.

Похожие статьи




Регрессионный анализ эффективности администрирования НДС по странам мира, Построение и анализ регрессионных моделей - Анализ факторов, влияющих на эффективность администрирования налога на добавленную стоимость

Предыдущая | Следующая