Построение модели бинарного выбора несколькими методами - Уровень конкурентоспособности строительных компаний
Итак, модели, которые будут дальше анализироваться, и получены с помощью Первого метода - проведения теста для выделения наиболее дескриптивных переменных и с учетом значений парных корреляций, выглядят следующим образом (табл. 7):
Таблица 7. Коэффициенты моделей, построенных первым методом
№ |
Выбранные финансовые показатели (парные корреляции и ANOVA-тест) |
AIC | |||||||||||
ROA |
ROE |
Goldrule |
Ln_Netassets |
Ln_rev |
Rev_cur_assets |
Turn_assets |
Turn_ac_rec |
Turn_ac_pay |
Turn_reserv |
Property_status |
Liab_assets |
Capital_product |
Prevent_bank |
1 |
|
|
|
|
|
|
|
|
|
|
|
2202 | |
Adj. |
|
|
|
|
|
|
|
2199.4 | |||||
2 |
|
|
|
|
|
|
|
|
|
|
|
2189.5 | |
Adj. |
|
|
|
|
|
|
|
2187.9 | |||||
3 |
|
|
|
|
|
|
|
|
|
|
|
2298.4 | |
Adj. |
|
|
|
|
|
|
2298.5 | ||||||
4 |
|
|
|
|
|
|
|
|
|
|
|
2316.2 | |
Adj. |
|
|
|
|
|
|
|
|
2315.5 | ||||
5 |
|
|
|
|
|
|
|
|
|
|
|
2284.3 | |
Adj. |
|
|
|
|
|
|
2284.1 | ||||||
6 |
|
|
|
|
|
|
|
|
|
|
|
2278.8 | |
Adj. |
|
|
|
|
|
|
2280.6 |
Таким образом, лучшей моделью, полученной при анализе парных корреляций финансовых показателей и их разделяющей способности (ANOVA-тест), является Модель 2 adj.: Вероятность дефолта (Default) ~ Рентабельность активов (ROA) + Чистые активы (Ln_Netassets) + Коэффициент оборачиваемости капитала (Turn_assets) + Коэффициент оборачиваемости запасов (Turn_reserv) + Имущественное положение (Property_status) + Фондоотдача (Capital_product) + Коэффициент предотвращения банкротства строительных организаций (Prevent_bank) (табл. 8). Отбор моделей в этом случае и далее производился на основе информационного критерия Акаике, причем его абсолютного значение в данном случае не важно, важен только относительный порядок сравнения моделей. Необходимой предпосылкой к использованию данного критерия является настройка модели по методу максимального правдоподобия, что справедливо для проводимого исследования. Критерий вознаграждает за качество приближения и наказывает за включение лишних переменных в модель. В этой связи наилучшей моделью признается та, у которой наименьшее значение критерия Акаике (AIC) (Akaike, 1974).
Таблица 8. Коэффициенты наилучшей модели, построенной первым методом
№ |
Выбранные финансовые показатели (парные корреляции и ANOVA-тест) |
Критерий AIC | ||||||
Модель 2.adj. |
ROA |
Ln_Netassets |
Turn_assets |
Turn_reserv |
Property_status |
Capital_product |
Prevent_bank |
2187.9 |
Значение AUC |
0.7878 |
0.7767 |
0.6206 |
0.6742 |
0.4609 |
0.5227 |
0.4039 |
Вторым методом является поэтапное включение финансовых переменных из каждой группы определенной на первоначальном этапе. Отбор финансовых показателей на основе поэтапного включения факторов из каждой группы проводился с учетом значения Area Under Curve (AUC) каждой переменной (ROC-кривых), так как всего существует 660 вариантов поэтапного включения переменных пяти групп с распределением по количеству показателей в них 2-3-2-5-11. Таким образом, будут использоваться только финансовые переменные с наибольшим значением AUC и наилучшими ROC-кривыми. В работе Помазанова М. В. и Петрова Д. А. "Кредитный риск-менеджмент как инструмент борьбы с возникновением проблемной задолженности" качество моделей оценки вероятности дефолта в зависимости от значения коэффициента AUC определяется следующим образом (табл. 9):
Таблица 9. Качество моделей оценки вероятности дефолта
AUC (Area Under Curve) |
Качество модели |
0.8 и более |
Отличное |
0.6 -0.8 |
Хорошее |
0.4 -0.6 |
Среднее |
0.2 -0.4 |
Низкое |
0.2 и ниже |
Неудовлетворительно |
Как мы можем видеть ниже из таблицы 10 наилучшими по значению AUC и ROC-кривым в каждой из групп стали такие показатели, как: чистые активы, рентабельность активов, коэффициент текущей ликвидности, коэффициент оборачиваемости кредиторской задолженности, кэш флоу к заемному капиталу. Начнем с этой модели, а далее, если встретится статистически незначимая переменная в какой-либо группе, заменим ее ближайшей переменной в своей группе по характеристикам ROC-кривых.
Таблица 10. Ранжирование переменных по коэффициент AUC внутри каждой группы
№ |
Финансовый показатель |
Обозначение в модели |
Коэффициент AUC |
Качество |
Группа |
Рейтинг внутри группы по значению AUC |
1 |
Чистые активы |
Ln_Netassets |
0.7767 |
Хорошее |
Размер компании |
1 |
2 |
Выручка |
Ln_rev |
0.7207 |
Хорошее |
Размер компании |
2 |
3 |
Рентабельность активов |
ROA |
0.7878 |
Хорошее |
Рентабельность |
1 |
4 |
Рентабельность продаж |
ROS |
0.7751 |
Хорошее |
Рентабельность |
2 |
5 |
Рентабельность собственного капитала |
ROE |
0.4959 |
Среднее |
Рентабельность |
3 |
6 |
Коэффициент текущей ликвидности |
Cur_liq |
0.7258 |
Хорошее |
Ликвидность |
1 |
7 |
Коэффициент абсолютной ликвидности |
Abs_liq |
0.7226 |
Хорошее |
Ликвидность |
2 |
8 |
Коэффициент оборачиваемости кредиторской задолженности |
Turn_ac_pay |
0.7702 |
Хорошее |
Деловая активность |
1 |
9 |
Коэффициент оборачиваемости оборотных активов |
Rev_cur_assets |
0.677 |
Хорошее |
Деловая активность |
2 |
10 |
Коэффициент оборачиваемости запасов |
Turn_reserv |
0.6742 |
Хорошее |
Деловая активность |
3 |
11 |
Коэффициент оборачиваемости дебиторской задолженности |
Turn_ac_rec |
0.6489 |
Хорошее |
Деловая активность |
4 |
12 |
Коэффициент оборачиваемости капитала |
Turn_assets |
0.6206 |
Хорошее |
Деловая активность |
5 |
13 |
Кэш флоу к заемному капиталу |
CF_liab |
0.7792 |
Хорошее |
Финансовая устойчивость |
1 |
14 |
Коэффициент автономии |
Autonomy |
0.7755 |
Хорошее |
Финансовая устойчивость |
2 |
15 |
Отношение рабочего капитала к активам |
Work_cap_assets |
0.7147 |
Хорошее |
Финансовая устойчивость |
3 |
№ |
Финансовый показатель |
Обозначение в модели |
Коэффициент AUC |
Качество |
Группа |
Рейтинг внутри группы по значению AUC |
16 |
Отношение дебиторской задолженности к кредиторской задолженности |
Ac_recpay |
0.7134 |
Хорошее |
Финансовая устойчивость |
4 |
17 |
Отношение заемного капитала к активам |
Liab_assets |
0.689 |
Хорошее |
Финансовая устойчивость |
5 |
18 |
Золотое правило предприятия |
Goldrule |
0.5396 |
Среднее |
Финансовая устойчивость |
6 |
19 |
Фондоотдача |
Capital_product |
0.5227 |
Среднее |
Финансовая устойчивость |
7 |
20 |
Отношение дебиторской задолженности к активам |
Ac_rec_assets |
0.4609 |
Среднее |
Финансовая устойчивость |
8 |
21 |
Имущественное положение |
Property _status |
0.4609 |
Среднее |
Финансовая устойчивость |
8 |
22 |
Коэффициент предотвращения банкротства строительных организаций |
Prevent_bank |
0.4039 |
Среднее |
Финансовая устойчивость |
9 |
23 |
Доля долгосрочных обязательств |
Portion_fix_liab |
0.3749 |
Низкое |
Финансовая устойчивость |
10 |
№ |
Институциональный показатель |
Обозначение в модели |
Коэффициент AUC |
Качество |
Группа |
Рейтинг внутри группы по значению AUC |
1 |
Задолженность по уплате налогов |
Tax_arrears |
0.6149 |
Хорошее |
- |
1 |
2 |
Реестр недобросовестных поставщиков |
Black_list |
0.5062 |
Среднее |
- |
2 |
3 |
Место нахождения |
Location |
0.462 |
Среднее |
- |
3 |
4 |
Котировка на бирже |
Listing |
0.361 |
Низкое |
- |
4 |
5 |
Совладельцы |
Co-owners |
0.361 |
Низкое |
- |
4 |
Регрессионные модели бинарного выбора строились при помощи пакета R.
В этой связи стоит дать краткую характеристику данного пакета. R -- язык программирования для статистической обработки данных и работы с графикой, а также свободная программная среда вычислений с открытым исходным кодом. (Дружков и др., 2013). R широко используется как статистическое программное обеспечение для анализа данных и фактически стал стандартом для статистических программ (Fox, 2005). Важно отметить, что использование данного языка является бесплатным, а реализация многих пакетов проходит, в том числе, совместно исследователями по всему миру.
По результатам второго метода для дальнейшего анализа выберем две лучшие модели (наименьшее значение критерия Акаике и все переменные значимы на 5% уровне): Модель 17: Чистые активы (Ln_Netassets) + Рентабельность активов (ROA) + Коэффициент текущей ликвидности (Cur_liq) + Коэффициент оборачиваемости кредиторской задолженности (Turn_ac_pay) + Имущественное положение (Property _status) и Модель 2: Чистые активы (Ln_Netassets) + Рентабельность активов (ROA) + Коэффициент текущей ликвидности (Cur_liq) + Коэффициент оборачиваемости кредиторской задолженности (Turn_ac_pay) + Коэффициент автономии (Autonomy). Но первая не может быть использована из-за сильной корреляции между Cur_liq и Turn_ac_pay, а вторая из-за сильной корреляции Autonomy и ROA, Ln_Netassets. Так как коэффициент текущей ликвидности во время построения вышеупомянутых моделей был всегда на грани 5% уровня значимости при совместном включении переменной Turn_ac_pay из группы "Деловой активности", с которой имеется сильная парная корреляция, а при включении других переменных из этой группы коэффициент текущей ликвидности не имеет статистической значимости, то попробуем выбрать наилучшую модель без показателей ликвидности (так как абсолютная ликвидность была вообще статистически незначимой). Выберем одну из моделей с наименьшим значением критерия Акаике, всеми значимыми переменными без учета переменных из группы ликвидность: Модель 20: Чистые активы (Ln_Netassets) + Рентабельность активов (ROA) + Коэффициент оборачиваемости оборотных активов (Rev_cur_assets) + Коэффициент автономии (Autonomy) и Модель 21: Чистые активы (Ln_Netassets) + Рентабельность активов (ROA) + Коэффициент оборачиваемости капитала (Turn_assets) + Коэффициент автономии (Autonomy). Т. к. Ln_Netassets и ROA показали статистическую значимость во всех построенных моделях и не имеют сильной парной корреляции между собой, то их фиксируем в модели, как представителей группы "Размер компании" и "Рентабельность" соответственно. В таком случае все переменные из группы "Деловая активность" могут быть включены в модель, так как не имеют сильных корреляций (выше уровня 0.3) с упомянутыми выше показателями. Что касается переменных из группы "Финансовая устойчивость", то выбор в ней коэффициент автономии (Autonomy) имеют сильную корреляцию с ROA и Ln_Netassets, а другие показатели из групп этих показателей не являются статистически значимыми для модели, значит, не включаем именно коэффициент автономии. Переменная CF_liab оказалась статистически незначимой для модели. Далее по качеству ROC-кривых в группе "Финансовая устойчивость" идет Work_cap_assets, который сильно коррелирует с ROA и не может быть включен в модель. Проверяем возможность включение Ac_recpay. Видим, что отсутствует зависимость с уже включенными в модель ROA и Ln_Netassets, но есть ограничение на совместное включение с Turn_ac_pay из группы "Деловая активность". Проверяем объясняющую переменную Liab_assets и видим, что есть сильная корреляция с Ln_Netassets. Переменную Goldrule можно попробовать, так как нет сильных парных корреляций, но она в модели 14 оказалась статистически незначимой. Переменная Capital_product может быть включена в модель - отсутствуют сильные парные корреляции с другими переменными. По схожим рассуждениям могут быть проверены переменные Ac_rec_assets, Property_status и Prevent_bank. А переменная Portion_fix_liab не может быть включена в модель, так как имеет сильную корреляцию с Ln_Netassets и слабое качество ROC-кривой. Дополнительное ограничение на модель оказывает проведенный для каждой переменной ANOVA-тест. Так, по его результатам, в модель не могут быть включены Ac_rec_assets и Ac_recpay. Таким образом, можем протестировать модели со следующими переменными из группы "Финансовая устойчивость": Goldrule, Capital_product, Property_status, Prevent_bank. Все четыре показателя не имеют ограничений на включение переменных из группы "Деловая активность". Переменная Goldrule как и в модели 14 осталась незначимой для всех возможных спецификаций модели.
Подытожим полученную модель вторым методом на основе поочередного включения переменных из каждой группы и с учетом качества ROC-кривых, парных корреляций и ANOVA-теста (табл. 11):
Таблица 11. Коэффициенты наилучшей модели, построенной вторым методом
№ |
Размер компании |
Рентабельность |
Ликвид. |
Деловая активность |
Финансовая устойчивость |
Критерий AIC |
Модель 29 |
Ln_Netassets |
ROA |
Turn_assets |
Property _status |
2262.4 |
Еще одним вариантом модели является включение коэффициента текущей ликвидности и не включение переменных из группы "Деловая активность". Можем проверить еще четыре модели (38-41 в табл. 11) с переменными из группы "Финансовой устойчивости": Goldrule, Capital_product, Property_status, Prevent_bank. Как мы видим, ни одна из таких моделей не может быть использована, так как в них Cur_liq не является статистически значимым на любом уровне, а информационный критерий Акаике выше, чем в модели полученной без включения переменных из группы "Ликвидность". Как итог, для дальнейшего анализа оставляем модель 29 (табл. 11).
Похожие статьи
-
Отбор и классификация объясняющих переменных Для всесторонней оценки строительной компании в ходе анализа будут использоваться финансовые,...
-
Интерпретация финальной модели - Уровень конкурентоспособности строительных компаний
Перейдем к интерпретации построенной модели для непубличных строительных компаний, так как она представляет не меньший интерес, чем прогнозное качество...
-
Для анализа был выбран временной диапазон с 2004 года по 2014 год. В целях построения прогнозной модели собранные годовые данные были разделены на две...
-
Существует целый ряд классификаций моделей используемых для прогнозирования финансовой несостоятельности заемщиков. В своей работе Григорьева Т. И....
-
Тест на переобучаемость финальной модели - Уровень конкурентоспособности строительных компаний
Как отмечалось в ходе исследования, logit-модель может характеризоваться сильной зависимостью от обучающей выборки. Поэтому чтобы быть уверенным в...
-
Заключение - Уровень конкурентоспособности строительных компаний
В ходе проведенного исследования была построена logit-модель вероятности дефолта для непубличных компаний строительного комплекса. Данная модель поможет...
-
Теперь, когда в рамках данного исследования была получена модель с наилучшими характеристиками для непубличных строительных компаний, полученные...
-
Проверим значимость квадратичной формы переменных для двух полученных моделей. Сначала рассмотрим значимость данных преобразований для первой модели...
-
При дальнейшем построении модели воспользуемся таким ограничением, как на каждую объясняющую переменную должно приходиться не менее тридцати наблюдений...
-
Предсказательная сила финальной модели - Уровень конкурентоспособности строительных компаний
Итак, будем тестировать модель с наилучшими характеристиками. Прогноз вне выборки проводился на основе тестовой выборки с 805 наблюдениями. В ней...
-
Построение модели с помощью логистической регрессии Прежде чем строить логистическую регрессию, необходимо выбрать конечный набор финансовых и...
-
Переход к порядковым и нормированным шкалам - Уровень конкурентоспособности строительных компаний
Далее предпримем попытки улучшить качество полученных моделей с помощью поочередного перехода к порядковой шкале и нормированной шкале. Полученные...
-
На следующем этапе в модель были добавлены дамми-переменные годов и отраслей. Таблицы соотношения переменных и данных приведены ниже. Кроме дамми...
-
Поэтапное построение индекса - Уровень конкурентоспособности строительных компаний
Как показывает практика, чтобы любой инструмент стал широко используемым, он должен либо пройти через сито мнений экспертов отрасли, для анализа которой...
-
Для целей проверки гипотезы о значимости рассматриваемых нами институциональных показателей (место нахождения, задолженность по уплате налогов), в...
-
Предпосылки построения индекса Строительная отрасль России характеризуется очень большим объемом строительных компаний и объемом работ, выполненных по...
-
Проблема прогнозирования вероятности банкротства существует уже несколько десятков лет - все началось с работ Ramser, Foster (1931), Fitzpatrick (1932) и...
-
Искусственные нейронные сети (ИНС) рассматриваются исследователями как возможная альтернатива статистическим методам. Исследования, использующие ИНС, как...
-
Построение модели с помощью метода деревьев решений - Моделирование вероятности банкротства
В отличие от логистической регрессии, при использовании метода деревьев решений ограничения для независимых переменных отсутствуют, поэтому для...
-
Определение критериев события дефолт Строительная отрасль является одним из главных двигателей экономики. В России количество компаний, работающих на...
-
Построение многофакторной корреляционно-регрессионной модели производительности труда
Построение многофакторной корреляционно-регрессионной модели производительности труда Данная работа направлена на выявление факторов, от которых зависит...
-
Введение - Уровень конкурентоспособности строительных компаний
Актуальность темы исследования. Строительная отрасль характеризуется огромным количеством потенциальных исполнителей. Полный цикл возведения любого...
-
Динамика индекса конкурентоспособности - Уровень конкурентоспособности строительных компаний
Ниже можно ознакомиться с первыми результатами расчета всего "семейства" индексов (см. табл. 33 и рис.7): Таблица 33. Значения ИКСО по федеральным...
-
Для дополнительной наглядности полученных результатов предлагается подготовить рейтинговую шкалу, которая отмечала бы, какие значения вероятности дефолта...
-
Основной целью исследования является сравнение предсказательной силы моделей, построенных на основе различных методов. В условиях несбалансированности...
-
В первоначальном выборе объясняющих переменных существует две стратегии. Часть авторов осуществляют подбор переменных, опираясь на собственные...
-
Построение модели на реальных данных - Ранговый метод оценивания параметров регрессионной модели
Для построения линейной регрессионной модели на основе реальных данных при помощи рангового метода оценивания параметров был выбран достаточно известный...
-
Построение корреляционных моделей исследуемых явлений
Построение корреляционных моделей исследуемых явлений Цель работы: На основе данных статистических наблюдений вывести корреляционные зависимости в виде...
-
Ранговый метод - Ранговый метод оценивания параметров регрессионной модели
Метод наименьших квадратов широко применяется для оценки параметров линейной регрессии, поскольку достаточно прост в вычислении и при предположении о...
-
Методы оценки параметров структурной формы модели - Основы эконометрики
Коэффициенты структурной модели могут быть оценены разными способами в зависимости от вида системы одновременных уравнений. Наибольшее распространение в...
-
Построим формализованную модель оценки суммарных издержек в складском грузообороте. Введем обозначения (все показатели соотнесены к периоду в один год и...
-
На основе данных таблицы 1 приложения А построим предварительную регрессионную модель: Модель 1: МНК, использованы наблюдения 2005:01-2007:12 (T = 36)....
-
Для прогнозирования банкротства, некоторые исследователи создают модели, основанные на использовании искусственных нейронных сетей. Как правило,...
-
Уровень науки и техники Надежность средств, с помощью которых человек достигает космоса высокая, но не идеальна. РН -- сложная конструкция, и даже в...
-
Основные этапы построения эконометрической модели - Моделирование в эконометрике
Построение эконометрической модели является основой эконометрического исследования. Оно основывается на предположении о реально существующей зависимости...
-
Описание используемых методов - Моделирование вероятности банкротства
В данной работе было принято решение использовать логистический анализ с помощью пакета STATA, а также алгоритм CART с помощью SPSS Modeler. Бинарная...
-
Построение и анализ эконометрической модели - Построение экономических моделей
На основе данных таблицы 1 приложения А построим предварительную регрессионную модель: Модель 1: МНК, использованы наблюдения 2005:01-2007:12 (T = 36)...
-
Становление и развитие эконометрического метода на методах вычислительной статистики: - на методах парной и множественной корреляции; - выделение тренда...
-
Использование в экономических исследованиях методов регрессии и корреляции - Эконометрика как наука
Начальным пунктом эконометрического анализа зависимостей обычно является оценка линейной зависимости переменных. Это объясняется простотой исследования...
-
Наличие особых ситуаций на террайне зависит от характеристик его сложности. Ниже приведена возможная классификационная схема характеристик сложности...
Построение модели бинарного выбора несколькими методами - Уровень конкурентоспособности строительных компаний