Построение модели с помощью метода деревьев решений - Моделирование вероятности банкротства

В отличие от логистической регрессии, при использовании метода деревьев решений ограничения для независимых переменных отсутствуют, поэтому для построения модели использовались все первоначально отобранные финансовые и нефинансовые переменные.

Дерево, построенное на основе обучаемой выборки, представлено на Рисунке 1. Значимость каждой из переменных представлена на Рисунке 2. Категория - это статус предприятия (1 - банкрот, 0 - небанкрот).

Одним из самых значимых показателей в модели оказался размер компании, а вслед за ним идет уровень оборачиваемости запасов, оказавшийся незначимым в логит-модели. Значимыми также оказались показатель ликвидности компании cash/cl, а также показатели прибыльности ret/ta и ebit/sales, который отражает процент средств, остающихся в компании, после покрытия операционных расходов. Возраст компании, как и в логит-регрессии, оказался незначимым.

Количество правильно классифицированных компаний на обучающей выборке составило 88, 37%.

Полученная модель также была протестирована на контрольных подвыборках за 2014 и 2013 годы. Прогнозная сила модели составила 66,38% и 80,16%, соответственно.

Таким образом, надежность модели значительно уменьшилась на подвыборке за 2014 год, как и в случае с логит-моделью. При этом доля правильно классифицированных предприятий на контрольной подвыборке 2013 года не опустилась ниже 80%.

классификационное дерево, построенное на обучающей выборке, и важность переменных для его построения

Рисунок 2. Классификационное дерево, построенное на обучающей выборке, и важность переменных для его построения

Похожие статьи




Построение модели с помощью метода деревьев решений - Моделирование вероятности банкротства

Предыдущая | Следующая