Сравнение построенных моделей - Влияние значений финансовых коэффициентов на вероятность банкротства компании

Основной целью исследования является сравнение предсказательной силы моделей, построенных на основе различных методов. В условиях несбалансированности выборки, стандартные методы сравнения (общий процент правильно предсказанных исходов, площадь под ROC и др.) не дают удовлетворительного, с точки зрения экономического смысла, результата, так как предполагают равенство весов ошибок. Для итогового сравнения моделей выбран показатель G-mean, расчет которого подробно описан в работе. Фактически, этот показатель является геометрическим средним процента правильных ответов по классам. Поэтому он игнорирует абсолютные значения и не зависит от соотношения числа банкротов и небанкротов в используемой выборке. Первая группа сравниваемых моделей содержит логистическую регрессию №1 и ИНС модели №1 и №2.

Сравнение моделей на несбалансированной выборке

Модель

Результаты модели

На тренировочной выборке

На тестовой выборке

Предсказано банкротов

Предсказано небанкротов

G-mean

Предсказано банкротов

Предсказано небанкротов

G-mean

Логит №1

79%

85%

1.281

78%

85%

1.277

ИНС №1

80%

83%

1.277

82%

84%

1.286

ИНС №2

78%

85%

1.277

76%

86%

1.272

Значительной разницы между предсказательной силой логистической модели и моделей на основе искусственных нейронных сетей данная работа не обнаружила. ИНС №1 слегка превосходит логит №1 на тестовой выборке, однако это скорее выглядит как результат стечения обстоятельств, нежели методологического превосходства моделирования при помощи ИНС. Таким образом, Гипотеза №1 Не отвергается на сбалансированной выборке.

Способ отбора переменных для нейросетевого моделирования не оказывает значительного влияния на качество модели. Модель со свободным выбором переменных слегка превосходит модель, ограниченную переменными логистической модели. ИНС №2 предсказывает больший процент небанкротов и меньший процент банкротов по сравнению с ИНС №1.

Сравнение моделей на несбалансированной выборке

Модель

Результаты модели

На тренировочной выборке

На тестовой выборке

Предсказано банкротов

Предсказано небанкротов

G-mean

Предсказано банкротов

Предсказано небанкротов

G-mean

Логит №2

86%

81%

1.298

54%

89%

1.195

ИНС №3

70%

81%

1.232

84%

87%

1.309

ИНС №4

68%

75%

1.192

87%

84%

1.308

Результаты моделей на сбалансированной выборке гораздо более неоднозначные. Прежде всего стоит выделить разницу в предсказаниях по тренировочным и тестовым выборкам. И для логистической регрессии, и для искусственных нейронных сетей существует значительная разница в предсказательной силе в рамках модели в зависимости от выборки.

Логистическая регрессия лучше проявляет себя на тренировочной выборке, а модели на основе нейронных сетей - на тестовых. Эта разница может быть объяснена механикой выбора оптимальной модели. Для логистической модели тестовая выборка не доступна при формировании модели. Тестовая выборка также недоступна при обучении нейронных сетей, однако качество предсказания по тестовой выборке является критерием отбора лучшей модели. Таким образом, логистическая регрессия максимизирует качество модели на тренировочной выборке, а моделирование с помощью нейронных сетей - на тестовой.

Выше приведенные выводы позволяют заключить, что, вне зависимости от типа использованной выборки, Гипотеза №1 Не отвергается.

С учетом выше приведенного обоснования, качество предсказания моделей оказывается примерно одинаковым для сбалансированной выборки. Способ отбора переменных для ИНС снова не оказывает существенного влияния на результат.

Сопоставление результатов моделей по сбалансированной и несбалансированной выборкам позволяет заключить, что искусственное уменьшение панели до сбалансированной не оказывает положительного влияния на качество модели, приводя к большей вариации результатов в зависимости от выборки и для нейронных сетей, и для логистической регрессии.

Составленные в работе модели отличались набором объясняющих переменных, которые оказались значимыми.

Объясняющие переменные различных моделей

Модель

Логит №1

Логит №2

ИНС №1**

ИНС №2

ИНС №3

ИНС №4

Финансовые коэффициенты

Sales2as

Sales2as

Sales2as

Debt2as

Debt2as

Debt2as

Debt2as

Debt2as

Debt2as

Quick2

Quick2*

Quick2

Quick2

Quick2

Roa

Roa

Roa

Roa

Roa

Curas2sales

Turnov1

Grossmarg

Дамми отраслей

Ind1

Ind5

Ind1

Ind1

Не значимы

Не значимы

Ind2

Ind3

Ind2

Ind3

Ind4

Ind3

Ind4*

Дамми периодов

Не значимы

Не значимы

Year1

Не значимы

Не значимы

Не значимы

Year4

Размер компании

+

+

-

+

-

+

Во всех построенных моделях в качестве объясняющей переменной используется отношение совокупных обязательств к совокупным активам (debt2as). Этот показатель из группы коэффициентов устойчивости компании оказался важным фактором для выявления банкротов. В пяти из шести моделей присутствует показатель быстрой ликвидности (quick2) и показатель рентабельности активов (roa). В половине моделей используется коэффициент отношения выручки к совокупным активам (sales2as). По одному разу встречаются коэффициент отношения текущих активов к выручке (curas2sales), коэффициент оборачиваемости (turnov1) и коэффициент валовой маржинальности (grossmarg).

Основной набор коэффициентов (debt2as, quick2, roa, sales2as) аппроксимирует четыре основных параметра предприятия: устойчивость, ликвидность, прибыльность и эффективность соответственно. Это подтверждает предположение о том, что для финансовой устойчивости крупных российских акционерных предприятий значимы все основные финансовые характеристики.

Гипотеза №2 Подтверждается частично: все четыре параметра компаний действительно оказываются значимыми, однако лишь три из них (эффективность, устойчивость и прибыльность) коррелируют с вероятностью банкротства ожидаемым образом.

Этот вывод отличается от похожей работы Людмилы Луговской (Lugovskaya, 2009), которая рассматривает выборку, состоящую из малых и средних предприятий России. Для российского сегмента малых и средних предприятий показатели, относящиеся к общей задолженности, оказались незначимыми. Это является подтверждением предположения о разных условиях доступа к кредитным ресурсам для предприятий, принадлежащих к сегменту малого и среднего бизнеса, и крупных компаний, которое было выдвинуто в данной работе.

Размер компании значим четырех моделях из шести, причем в рамках логистической регрессии он отрицательно влияет на вероятность банкротства, что согласуется с Гипотезой №3.

Переменные периодов времени встречаются лишь в одной модели на основе нейронных сетей, что означает правильность Гипотезы №4 о незначимости переменных годов. Дамми-переменные оказываются значимыми в четырех моделях из шести, что предполагает зависимость вероятности банкротства от отраслевой принадлежности компании. Этот вывод подтверждает Гипотезу №5.

Похожие статьи




Сравнение построенных моделей - Влияние значений финансовых коэффициентов на вероятность банкротства компании

Предыдущая | Следующая