Сравнение построенных моделей - Влияние значений финансовых коэффициентов на вероятность банкротства компании
Основной целью исследования является сравнение предсказательной силы моделей, построенных на основе различных методов. В условиях несбалансированности выборки, стандартные методы сравнения (общий процент правильно предсказанных исходов, площадь под ROC и др.) не дают удовлетворительного, с точки зрения экономического смысла, результата, так как предполагают равенство весов ошибок. Для итогового сравнения моделей выбран показатель G-mean, расчет которого подробно описан в работе. Фактически, этот показатель является геометрическим средним процента правильных ответов по классам. Поэтому он игнорирует абсолютные значения и не зависит от соотношения числа банкротов и небанкротов в используемой выборке. Первая группа сравниваемых моделей содержит логистическую регрессию №1 и ИНС модели №1 и №2.
Сравнение моделей на несбалансированной выборке
Модель |
Результаты модели | |||||
На тренировочной выборке |
На тестовой выборке | |||||
Предсказано банкротов |
Предсказано небанкротов |
G-mean |
Предсказано банкротов |
Предсказано небанкротов |
G-mean | |
Логит №1 |
79% |
85% |
1.281 |
78% |
85% |
1.277 |
ИНС №1 |
80% |
83% |
1.277 |
82% |
84% |
1.286 |
ИНС №2 |
78% |
85% |
1.277 |
76% |
86% |
1.272 |
Значительной разницы между предсказательной силой логистической модели и моделей на основе искусственных нейронных сетей данная работа не обнаружила. ИНС №1 слегка превосходит логит №1 на тестовой выборке, однако это скорее выглядит как результат стечения обстоятельств, нежели методологического превосходства моделирования при помощи ИНС. Таким образом, Гипотеза №1 Не отвергается на сбалансированной выборке.
Способ отбора переменных для нейросетевого моделирования не оказывает значительного влияния на качество модели. Модель со свободным выбором переменных слегка превосходит модель, ограниченную переменными логистической модели. ИНС №2 предсказывает больший процент небанкротов и меньший процент банкротов по сравнению с ИНС №1.
Сравнение моделей на несбалансированной выборке
Модель |
Результаты модели | |||||
На тренировочной выборке |
На тестовой выборке | |||||
Предсказано банкротов |
Предсказано небанкротов |
G-mean |
Предсказано банкротов |
Предсказано небанкротов |
G-mean | |
Логит №2 |
86% |
81% |
1.298 |
54% |
89% |
1.195 |
ИНС №3 |
70% |
81% |
1.232 |
84% |
87% |
1.309 |
ИНС №4 |
68% |
75% |
1.192 |
87% |
84% |
1.308 |
Результаты моделей на сбалансированной выборке гораздо более неоднозначные. Прежде всего стоит выделить разницу в предсказаниях по тренировочным и тестовым выборкам. И для логистической регрессии, и для искусственных нейронных сетей существует значительная разница в предсказательной силе в рамках модели в зависимости от выборки.
Логистическая регрессия лучше проявляет себя на тренировочной выборке, а модели на основе нейронных сетей - на тестовых. Эта разница может быть объяснена механикой выбора оптимальной модели. Для логистической модели тестовая выборка не доступна при формировании модели. Тестовая выборка также недоступна при обучении нейронных сетей, однако качество предсказания по тестовой выборке является критерием отбора лучшей модели. Таким образом, логистическая регрессия максимизирует качество модели на тренировочной выборке, а моделирование с помощью нейронных сетей - на тестовой.
Выше приведенные выводы позволяют заключить, что, вне зависимости от типа использованной выборки, Гипотеза №1 Не отвергается.
С учетом выше приведенного обоснования, качество предсказания моделей оказывается примерно одинаковым для сбалансированной выборки. Способ отбора переменных для ИНС снова не оказывает существенного влияния на результат.
Сопоставление результатов моделей по сбалансированной и несбалансированной выборкам позволяет заключить, что искусственное уменьшение панели до сбалансированной не оказывает положительного влияния на качество модели, приводя к большей вариации результатов в зависимости от выборки и для нейронных сетей, и для логистической регрессии.
Составленные в работе модели отличались набором объясняющих переменных, которые оказались значимыми.
Объясняющие переменные различных моделей
Модель |
Логит №1 |
Логит №2 |
ИНС №1** |
ИНС №2 |
ИНС №3 |
ИНС №4 |
Финансовые коэффициенты |
Sales2as |
Sales2as |
Sales2as | |||
Debt2as |
Debt2as |
Debt2as |
Debt2as |
Debt2as |
Debt2as | |
Quick2 |
Quick2* |
Quick2 |
Quick2 |
Quick2 | ||
Roa |
Roa |
Roa |
Roa |
Roa | ||
Curas2sales | ||||||
Turnov1 | ||||||
Grossmarg | ||||||
Дамми отраслей |
Ind1 |
Ind5 |
Ind1 |
Ind1 |
Не значимы |
Не значимы |
Ind2 |
Ind3 |
Ind2 | ||||
Ind3 |
Ind4 |
Ind3 | ||||
Ind4* | ||||||
Дамми периодов |
Не значимы |
Не значимы |
Year1 |
Не значимы |
Не значимы |
Не значимы |
Year4 | ||||||
Размер компании |
+ |
+ |
- |
+ |
- |
+ |
Во всех построенных моделях в качестве объясняющей переменной используется отношение совокупных обязательств к совокупным активам (debt2as). Этот показатель из группы коэффициентов устойчивости компании оказался важным фактором для выявления банкротов. В пяти из шести моделей присутствует показатель быстрой ликвидности (quick2) и показатель рентабельности активов (roa). В половине моделей используется коэффициент отношения выручки к совокупным активам (sales2as). По одному разу встречаются коэффициент отношения текущих активов к выручке (curas2sales), коэффициент оборачиваемости (turnov1) и коэффициент валовой маржинальности (grossmarg).
Основной набор коэффициентов (debt2as, quick2, roa, sales2as) аппроксимирует четыре основных параметра предприятия: устойчивость, ликвидность, прибыльность и эффективность соответственно. Это подтверждает предположение о том, что для финансовой устойчивости крупных российских акционерных предприятий значимы все основные финансовые характеристики.
Гипотеза №2 Подтверждается частично: все четыре параметра компаний действительно оказываются значимыми, однако лишь три из них (эффективность, устойчивость и прибыльность) коррелируют с вероятностью банкротства ожидаемым образом.
Этот вывод отличается от похожей работы Людмилы Луговской (Lugovskaya, 2009), которая рассматривает выборку, состоящую из малых и средних предприятий России. Для российского сегмента малых и средних предприятий показатели, относящиеся к общей задолженности, оказались незначимыми. Это является подтверждением предположения о разных условиях доступа к кредитным ресурсам для предприятий, принадлежащих к сегменту малого и среднего бизнеса, и крупных компаний, которое было выдвинуто в данной работе.
Размер компании значим четырех моделях из шести, причем в рамках логистической регрессии он отрицательно влияет на вероятность банкротства, что согласуется с Гипотезой №3.
Переменные периодов времени встречаются лишь в одной модели на основе нейронных сетей, что означает правильность Гипотезы №4 о незначимости переменных годов. Дамми-переменные оказываются значимыми в четырех моделях из шести, что предполагает зависимость вероятности банкротства от отраслевой принадлежности компании. Этот вывод подтверждает Гипотезу №5.
Похожие статьи
-
Искусственные нейронные сети (ИНС) рассматриваются исследователями как возможная альтернатива статистическим методам. Исследования, использующие ИНС, как...
-
На следующем этапе в модель были добавлены дамми-переменные годов и отраслей. Таблицы соотношения переменных и данных приведены ниже. Кроме дамми...
-
Для прогнозирования банкротства, некоторые исследователи создают модели, основанные на использовании искусственных нейронных сетей. Как правило,...
-
Заключение - Влияние значений финансовых коэффициентов на вероятность банкротства компании
В рамках данного исследования были построены и оценены модели предсказания банкротства на базе логистической регрессии и искусственных нейронных сетей...
-
Среди современных исследований на тему предсказания банкротства можно выделить группу работ, которые не ставят своей целью сравнение предсказательной...
-
Данная работа опирается на исследования, посвященные проблематике предсказания банкротства компаний. Наибольший интерес в работах предшественников...
-
Большинство современных исследований, посвященных предсказанию банкротства, используют больше одного метода моделирования и делают выводы о сравнительной...
-
Введение - Влияние значений финансовых коэффициентов на вероятность банкротства компании
Моделирование вероятности банкротства является широко применимой практической процедурой, которая необходима любой крупной кредитной организации....
-
Построение модели с помощью логистической регрессии Прежде чем строить логистическую регрессию, необходимо выбрать конечный набор финансовых и...
-
Постановка гипотез - Влияние значений финансовых коэффициентов на вероятность банкротства компании
Цель данной работы заключается в сравнении предсказательной силы логистической регрессии и искусственных нейронных сетей (ИНС) в рамках моделирования...
-
В первоначальном выборе объясняющих переменных существует две стратегии. Часть авторов осуществляют подбор переменных, опираясь на собственные...
-
Описание данных Данные для исследования получены из базы Руслана, предоставляемой компанией Бюро Ван Дайк. Эта база содержит данные финансовой отчетности...
-
Влияние значений финансовых коэффициентов на вероятность банкротства компании
Детализация расчета точки отсечения через G-mean для модели ИНС №2. Уровень Ошибка по небанкротам Ошибка по банкротам G-mean 0.04 10% 31% 1.262 0.039 10%...
-
Приложения, - Влияние значений финансовых коэффициентов на вероятность банкротства компании
Описательные статистики по финансовым коэффициентам. Переменная Количество наблюдений Среднее Медиана 25 перцентиль 75 перцентиль Стандартное отклонение...
-
Построение модели с помощью метода деревьев решений - Моделирование вероятности банкротства
В отличие от логистической регрессии, при использовании метода деревьев решений ограничения для независимых переменных отсутствуют, поэтому для...
-
Отбор и классификация объясняющих переменных Для всесторонней оценки строительной компании в ходе анализа будут использоваться финансовые,...
-
Проблема прогнозирования вероятности банкротства существует уже несколько десятков лет - все началось с работ Ramser, Foster (1931), Fitzpatrick (1932) и...
-
Описание используемых методов - Моделирование вероятности банкротства
В данной работе было принято решение использовать логистический анализ с помощью пакета STATA, а также алгоритм CART с помощью SPSS Modeler. Бинарная...
-
По итогам проведенного исследования можно прийти к выводу о том, что и логит-регрессия и деревья решений позволили построить модели, которые с...
-
Существует целый ряд классификаций моделей используемых для прогнозирования финансовой несостоятельности заемщиков. В своей работе Григорьева Т. И....
-
Методология исследования, Постановка гипотез - Моделирование вероятности банкротства
Постановка гипотез Целью данного исследования является построение модели вероятности банкротства, которая будет обладать надежностью не менее 80%. По...
-
Теперь, когда в рамках данного исследования была получена модель с наилучшими характеристиками для непубличных строительных компаний, полученные...
-
Итак, модели, которые будут дальше анализироваться, и получены с помощью Первого метода - проведения теста для выделения наиболее дескриптивных...
-
Интерпретация финальной модели - Уровень конкурентоспособности строительных компаний
Перейдем к интерпретации построенной модели для непубличных строительных компаний, так как она представляет не меньший интерес, чем прогнозное качество...
-
Введение - Моделирование вероятности банкротства
В настоящее время в условиях экономической стагнации и ухудшения финансового состояния бизнеса тема кредитоспособности и оценки устойчивости предприятий...
-
Тест на переобучаемость финальной модели - Уровень конкурентоспособности строительных компаний
Как отмечалось в ходе исследования, logit-модель может характеризоваться сильной зависимостью от обучающей выборки. Поэтому чтобы быть уверенным в...
-
Нефинансовые факторы, влияющие на вероятность банкротства - Моделирование вероятности банкротства
Как было отмечено выше, важность финансовых показателей для определения вероятности банкротства фирмы была замечена в самых ранних работах. Однако...
-
Для анализа был выбран временной диапазон с 2004 года по 2014 год. В целях построения прогнозной модели собранные годовые данные были разделены на две...
-
Помимо технических характеристик здания, анализируемых выше, объекты офисной недвижимости характеризуются факторами удобства для арендаторов. К таким...
-
Заключение - Моделирование вероятности банкротства
Целью данного исследования являлось моделирование вероятности банкротства российских нефинансовых компаний на основе наиболее значимых показателей...
-
Описание данных - Моделирование вероятности банкротства
Данные для исследования были взяты из базы Ruslana (Bureau van Dijk), содержащей финансовую и некоторую нефинансовую информацию об организациях из...
-
В основе метода площадей лежит предположение, что объект может быть описан линейным дифференциальным уравнением с постоянными коэффициентами, а его...
-
Построение многофакторной корреляционно-регрессионной модели производительности труда
Построение многофакторной корреляционно-регрессионной модели производительности труда Данная работа направлена на выявление факторов, от которых зависит...
-
Предсказательная сила финальной модели - Уровень конкурентоспособности строительных компаний
Итак, будем тестировать модель с наилучшими характеристиками. Прогноз вне выборки проводился на основе тестовой выборки с 805 наблюдениями. В ней...
-
Определение критериев события дефолт Строительная отрасль является одним из главных двигателей экономики. В России количество компаний, работающих на...
-
Коэффициенты структурной модели могут быть оценены разными способами в зависимости от вида системы одновременных уравнений. Наибольшее распространение...
-
Постоянство механизмов. Одно из условий, на которое опирается эконометрическое моделирование, состоит в том, что функциональное соотношение не меняется в...
-
После проведения регрессионного анализа получается модель объекта исследований в виде некоторой функции. В простейшем случае линейной регрессии она имеет...
-
Выбор переменных - Моделирование вероятности банкротства
Как уже было отмечено выше, единого набора финансовых и нефинансовых показателей, которые необходимо включать в модели, не существует, поэтому было...
-
Заключение - Уровень конкурентоспособности строительных компаний
В ходе проведенного исследования была построена logit-модель вероятности дефолта для непубличных компаний строительного комплекса. Данная модель поможет...
Сравнение построенных моделей - Влияние значений финансовых коэффициентов на вероятность банкротства компании