Построение модели бинарного выбора несколькими методами - Анализ и прогнозирование уровня конкурентоспособности компаний строительного комплекса

Итак, модели, которые будут дальше анализироваться, и получены с помощью первого метода - проведения теста для выделения наиболее дескриптивных переменных и с учетом значений парных корреляций, выглядят следующим образом (табл. 7):

Таблица 7.

Коэффициенты моделей, построенных первым методом

Выбранные финансовые показатели (парные корреляции и ANOVA-тест)

AIC

ROA

ROE

Goldrule

Ln_Netassets

Ln_rev

Rev_cur_assets

Turn_assets

Turn_ac_rec

Turn_ac_pay

Turn_reserv

Property_status

Liab_assets

Capital_product

Prevent_bank

    -3,29 (0,00)
    3,66 (0,31)
    2,11 (0,21)
    -1,39 (0,00)
    -4,26 (0,00)
    -1,17 (0,32)
    -3,51 (0,79)
    -2,46 (0,00)
    -9,17 (0,02)
    5,40 (0,008)
    3,12 (0,004)

2202

    -3,25 (0,00)
    -1,40 (0,00)
    -4,51 (0,00)
    -2,43 (0,00)
    -9,66 (0,01)
    5,38 (0,008)
    3,12 (0,004)

2199.4

    -3,21 (0,00)
    3,59 (0,31)
    1,94 (0,25)
    -1,44 (0,00)
    -5,73 (0,00)
    -1,68 (0,16)
    -2,86 (0,82)
    -2,50 (0,00)
    -1,89 (0,00)
    6,31 (0,002)
    3,08 (0,004)

2189.5

    -3,17 (0,00)
    -1,45 (0,00)
    -6,16 (0,00)
    -2,48 (0,00)
    -2,06 (0,00)
    6,38 (0,002)
    3,06 (0,004)

2187.9

    -4,38 (0,00)
    4,75 (0,28)
    1,68 (0,32)
    -1,87 (0,58)
    -3,89 (0,00)
    -1,62 (0,18)
    -2,78 (0,16)
    -2,45 (0,00)
    3,60 (0,01)
    5,71 (0,003)
    3,33 (0,008)

2298.4

    -4,44 (0,00)
    -4,67 (0,00)
    -2,43 (0,00)
    4,20 (0,002)
    5,68 (0,003)
    3,33 (0,008)

2298.5

    -4,20 (0,00)
    4,77 (0,26)
    1,35 (0,42)
    -3,49 (0,30)
    -3,76 (0,00)
    -3,90 (0,004)
    -5,21 (0,02)
    -2,66 (0,00)
    3,81 (0,009)
    6,30 (0,001)
    3,45 (0,006)

2316.2

    -4,28 (0,00)
    -3,79 (0,00)
    -3,84 (0,005)
    -5,54 (0,01)
    -2,58 (0,00)
    3,59 (0,01)
    6,27 (0,001)
    3,47 (0,006)

2315.5

    -4,66 (0,00)
    4,48 (0,35)
    1,45 (0,39)
    -9,95 (0,77)
    -3,21 (0,00)
    -1,39 (0,21)
    -3,43 (0,08)
    -2,43 (0,00)
    -1,66 (0,00)
    5,07 (0,01)
    3,17 (0,01)

2284.3

    -4,77 (0,00)
    -3,96 (0,00)
    -2,41 (0,00)
    -1,79 (0,00)
    4,96 (0,01)
    3,18 (0,01)

2284.1

    -4,61 (0,00)
    4,48 (0,35)
    1,23 (0,46)
    -1,10 (0,74)
    -4,23 (0,00)
    -1,77 (0,13)
    -3,48 (0,08)
    -2,49 (0,00)
    -2,40 (0,00)
    5,72 (0,005)
    3,07 (0,01)

2278.8

    -4,72 (0,00)
    -5,22 (0,00)
    -2,50 (0,00)
    -2,76 (0,00)
    5,74 (0,004)
    3,04 (0,02)

2280.6

Таким образом, лучшей моделью, полученной при анализе парных корреляций финансовых показателей и их разделяющей способности (ANOVA-тест), является Модель 2 adj.: Вероятность дефолта (Default) ~ Рентабельность активов (ROA) + Чистые активы (Ln_Netassets) + Коэффициент оборачиваемости капитала (Turn_assets) + Коэффициент оборачиваемости запасов (Turn_reserv) + Имущественное положение (Property_status) + Фондоотдача (Capital_product) + Коэффициент предотвращения банкротства строительных организаций (Prevent_bank) (табл. 8). Отбор моделей в этом случае и далее производился на основе информационного критерия Акаике, причем его абсолютного значение в данном случае не важно, важен только относительный порядок сравнения моделей. Необходимой предпосылкой к использованию данного критерия является настройка модели по методу максимального правдоподобия, что справедливо для проводимого исследования. Критерий вознаграждает за качество приближения и наказывает за включение лишних переменных в модель. В этой связи наилучшей моделью признается та, у которой наименьшее значение критерия Акаике (AIC) (Akaike, 1974).

Таблица 8.

Коэффициенты наилучшей модели, построенной первым методом

Выбранные финансовые показатели (парные корреляции и ANOVA-тест)

Критерий AIC

Модель 2.adj.

ROA

Ln_Netassets

Turn_assets

Turn_reserv

Property_status

Capital_product

Prevent_bank

2187.9

Значение AUC

0.7878

0.7767

0.6206

0.6742

0.4609

0.5227

0.4039

Вторым методом является поэтапное включение финансовых переменных из каждой группы определенной на первоначальном этапе. Отбор финансовых показателей на основе поэтапного включения факторов из каждой группы проводился с учетом значения Area Under Curve (AUC) каждой переменной (ROC-кривых), так как всего существует 660 вариантов поэтапного включения переменных пяти групп с распределением по количеству показателей в них 2-3-2-5-11. Таким образом, будут использоваться только финансовые переменные с наибольшим значением AUC и наилучшими ROC-кривыми (см. приложение 1). В работе Помазанова М. В. и Петрова Д. А. "Кредитный риск-менеджмент как инструмент борьбы с возникновением проблемной задолженности" качество моделей оценки вероятности дефолта в зависимости от значения коэффициента AUC определяется следующим образом (табл. 9):

Таблица 9.

Качество моделей оценки вероятности дефолта

AUC (Area Under Curve)

Качество модели

0.8 и более

Отличное

0.6 -0.8

Хорошее

0.4 -0.6

Среднее

0.2 -0.4

Низкое

0.2 и ниже

Неудовлетворительно

Как мы можем видеть ниже из таблицы 10 наилучшими по значению AUC и ROC-кривым в каждой из групп стали такие показатели, как: чистые активы, рентабельность активов, коэффициент текущей ликвидности, коэффициент оборачиваемости кредиторской задолженности, кэш флоу к заемному капиталу. Начнем с этой модели, а далее, если встретится статистически незначимая переменная в какой-либо группе, заменим ее ближайшей переменной в своей группе по характеристикам ROC-кривых.

Таблица 10.

Ранжирование переменных по коэффициент AUC внутри каждой группы

Финансовый показатель

Обозначение в модели

Коэффициент AUC

Качество

Группа

Рейтинг внутри группы по значению AUC

1

Чистые активы

Ln_Netassets

0.7767

Хорошее

Размер компании

1

2

Выручка

Ln_rev

0.7207

Хорошее

Размер компании

2

3

Рентабельность активов

ROA

0.7878

Хорошее

Рентабельность

1

4

Рентабельность продаж

ROS

0.7751

Хорошее

Рентабельность

2

5

Рентабельность собственного капитала

ROE

0.4959

Среднее

Рентабельность

3

6

Коэффициент текущей ликвидности

Cur_liq

0.7258

Хорошее

Ликвидность

1

7

Коэффициент абсолютной ликвидности

Abs_liq

0.7226

Хорошее

Ликвидность

2

8

Коэффициент оборачиваемости кредиторской задолженности

Turn_ac_pay

0.7702

Хорошее

Деловая активность

1

9

Коэффициент оборачиваемости оборотных активов

Rev_cur_assets

0.677

Хорошее

Деловая активность

2

10

Коэффициент оборачиваемости запасов

Turn_reserv

0.6742

Хорошее

Деловая активность

3

11

Коэффициент оборачиваемости дебиторской задолженности

Turn_ac_rec

0.6489

Хорошее

Деловая активность

4

12

Коэффициент оборачиваемости капитала

Turn_assets

0.6206

Хорошее

Деловая активность

5

13

Кэш флоу к заемному капиталу

CF_liab

0.7792

Хорошее

Финансовая устойчивость

1

14

Коэффициент автономии

Autonomy

0.7755

Хорошее

Финансовая устойчивость

2

15

Отношение рабочего капитала к активам

Work_cap_assets

0.7147

Хорошее

Финансовая устойчивость

3

Финансовый показатель

Обозначение в модели

Коэффициент AUC

Качество

Группа

Рейтинг внутри группы по значению AUC

16

Отношение дебиторской задолженности к кредиторской задолженности

Ac_recpay

0.7134

Хорошее

Финансовая устойчивость

4

17

Отношение заемного капитала к активам

Liab_assets

0.689

Хорошее

Финансовая устойчивость

5

18

Золотое правило предприятия

Goldrule

0.5396

Среднее

Финансовая устойчивость

6

19

Фондоотдача

Capital_product

0.5227

Среднее

Финансовая устойчивость

7

20

Отношение дебиторской задолженности к активам

Ac_rec_assets

0.4609

Среднее

Финансовая устойчивость

8

21

Имущественное положение

Property _status

0.4609

Среднее

Финансовая устойчивость

8

22

Коэффициент предотвращения банкротства строительных организаций

Prevent_bank

0.4039

Среднее

Финансовая устойчивость

9

23

Доля долгосрочных обязательств

Portion_fix_liab

0.3749

Низкое

Финансовая устойчивость

10

Институциональный показатель

Обозначение в модели

Коэффициент AUC

Качество

Группа

Рейтинг внутри группы по значению AUC

1

Задолженность по уплате налогов

Tax_arrears

0.6149

Хорошее

-

1

2

Реестр недобросовестных поставщиков

Black_list

0.5062

Среднее

-

2

3

Место нахождения

Location

0.462

Среднее

-

3

4

Котировка на бирже

Listing

0.361

Низкое

-

4

5

Совладельцы

Co-owners

0.361

Низкое

-

4

Итак, оценку 41 модели, построенной с помощью метода поочередного включения финансовых объясняющих переменных из каждой группы (второй метод), можно найти в таблице 11. В этой таблице представлены значения коэффициентов регрессии и информационный критерий Акаике соответствующих моделей. В скобках представлены значения p-value, характеризующие значимость отобранных показателей. Функциональная форма модели имеет pooled logit вид модели бинарного выбора, согласно формуле (2) (Магнус, Катышев и др., 2007).

Регрессионные модели бинарного выбора строились при помощи пакета R.

В этой связи стоит дать краткую характеристику данного пакета. R -- язык программирования для статистической обработки данных и работы с графикой, а также свободная программная среда вычислений с открытым исходным кодом. (Дружков и др., 2013). R широко используется как статистическое программное обеспечение для анализа данных и фактически стал стандартом для статистических программ (Fox, 2005). Важно отметить, что использование данного языка является бесплатным, а реализация многих пакетов проходит, в том числе, совместно исследователями по всему миру.

Таблица 11.

Коэффициенты моделей, построенных вторым методом

Размер компании

Рентабельность

Ликвидность

Деловая активность

Финансовая устойчивость

AIC

Ln_Netassets

Ln_rev

ROA

ROE

ROS

Cur_liq

Abs_liq

Rev_cur_assets

Turn_assets

Turn_ac_rec

Turn_ac_pay

Turn_reserv

Goldrule

Liab_assets

Portion_fix_liab

CF_liab

Ac_rec_assets

Property _status

Capital_product

Work_cap_assets

Prevent_bank

Ac_recpay

Autonomy

    -1,18 (0,00)
    -3,03 (0,00)
    1,21 (0,04)
    -1,50 (0,00)
    1,54 (0,74)

2406.1

    -9,81 (0,00)
    -2,44 (0,00)
    1,21 (0,04)
    -1,35 (0,00)
    -4,94 (0,00)

2389.6

    -0,09 (0,00)
    -0,02 (0,00)
    0,001 (0,38)
    -0,14 (0,00)
    -0,01 (0,00)

2392

    -1,39 (0,69)
    -2.82 (0,00)
    1,00 (0,09)
    -1,46 (0,00)
    -8,38 (0,00)

2426.8

    -1,15 (0,00)
    4,33 (0,20)
    1,36 (0,01)
    -1,45 (0,00)
    -9,43 (0,00)

2443.4

    -1,17 (0,00)
    6,14 (0,08)
    2,81 (0,00)
    -1,52 (0,00)
    -9,49 (0,00)

2444.4

    -1.18 (0,00)
    -2,41 (0,00)
    -7,85 (0,96)
    -5,28 (0,00)
    -6,50 (0,00)

2254.8

    -1,19 (0,00)
    -2,67 (0,00)
    6,03 (0,64)
    -3.34 (0,00)
    -5,82 (0,00)

2340.4

    -1,11 (0,00)
    -2,68 (0,00)
    1,65 (0,88)
    -8,97 (0,00)
    -5,78 (0,00)

2357.8

    -1,30 (0,00)
    -2,05 (0,00)
    -7,31 (0,99)
    -6,98 (0,00)
    -8,05 (0,00)

2271.8

    -0,13 (0,00)
    -0,03 (0,00)
    0,0001 (0,06)
    -0,16 (0,00)
    0,30 (0,08)

2403.2

    -0,11 (0,00)
    -0,03 (0,00)
    0,0003 (0,03)
    -0,15 (0,00)
    -0,02 (0,16)

2404.6

    -1,34 (0,00)
    -3,21 (0,00)
    1,03 (0,07)
    -1,58 (0,00)
    -3,97 (0,01)

2400

    -1,18 (0,00)
    -2,98 (0,00)
    1,16 (0,04)
    -1,48 (0,00)
    -1,02 (0,54)

2405.8

    -1,18 (0,00)
    -2,99 (0,00)
    1,17 (0,04)
    -1,51 (0,00)
    4,77 (0,01)

2402.1

    -1,23 (0,00)
    -2,95 (0,00)
    1,18 (0,03)
    -1,49 (0,00)
    -4,44 (0,11)

2403.5

    -1.02 (0,00)
    -3,17 (0,00)
    1,21 (0,03)
    -1,25 (0,00)
    -1,96 (0,00)

2378.3

Размер компании

Рентабельность

Ликвидность

Деловая активность

Финансовая устойчивость

AIC

Ln_Netassets

Ln_rev

ROA

ROE

ROS

Cur_liq

Abs_liq

Rev_cur_assets

Turn_assets

Turn_ac_rec

Turn_ac_pay

Turn_reserv

Goldrule

Liab_assets

Portion_fix_liab

CF_liab

Ac_rec_assets

Property _status

Capital_product

Work_cap_assets

Prevent_bank

Ac_recpay

Autonomy

    -1,18 (0,00)
    -3,04 (0,00)
    1,17 (0,04)
    -1,47 (0,00)
    3,41 (0,00)

2399.9

    -1,45 (0,00)
    -2,81 (0,00)
    1,12 (0,05)
    -1,44 (0,00)
    1,49 (0,00)

2385.9

Без учета переменных группы ликвидности

    -0,12 (0,00)
    -0.02 (0,00)
    -0,53 (0,00)
    -0,01 (0,00)

2252.8

    -0,13 (0,00)
    -0,02 (0,00)
    -0,69 (0,00)
    -0,01 (0,00)

2269.8

    -0,14 (0,00)
    -0,03 (0,00)
    -0,53 (0,00)
    0,08 (0,63)

2277.5

    -1,45 (0,00)
    -3,13 (0,00)
    -5,40 (0,00)
    5,72 (0,00)

2272.8

    -1,66 (0,00)
    -2,96 (0,00)
    -6,97 (0,00)
    7,02 (0,00)

2300.1

    -1,39 (0,00)
    -3,29 (0,00)
    -9,41 (0,00)
    3,60 (0,05)

2376.3

    -1,16 (0,00)
    -2,99 (0,00)
    -1,51 (0,00)
    4,75 (0,01)

2403.1

    -1,48 (0,00)
    -3,31 (0,00)
    -3,40 (0,00)
    3,77 (0,04)

2358.1

    -0,13 (0,00)
    -0,03 (0,00)
    -0,50 (0,00)
    -1,06 (0,00)

2270.2

    -0,14 (0,00)
    -0,03 (0,00)
    -0,65 (0,00)
    -2,24 (0,00)

2262.4

    -0,11 (0,00)
    -0,03 (0,00)
    -0,08 (0,00)
    -1,83 (0,00)

2356

    -0,10 (0,00)
    -0,03 (0,00)
    -0,12 (0,00)
    -1,95 (0,00)

2379.2

    -0,12 (0,00)
    -0,03 (0,00)
    -0,01 (0,00)
    -2,40 (0,00)

2317.3

    -0,14 (0,00)
    -0,03 (0,00)
    -0,53 (0,00)
    0,01 (0,00)

2272.3

    -0,16 (0,00)
    -0,03 (0,00)
    -0,68 (0,00)
    0,01 (0,00)

2300.4

    -0,13 (0,00)
    -0,03 (0,00)
    -0,09 (0,00)
    0,01 (0,00)

2372.9

    -0,11 (0,00)
    -0,03 (0,00)
    -0,14 (0,00)
    0,01 (0,00)

2400.9

Размер компании

Рентабельность

Ликвидность

Деловая активность

Финансовая устойчивость

AIC

Ln_Netassets

Ln_rev

ROA

ROE

ROS

Cur_liq

Abs_liq

Rev_cur_assets

Turn_assets

Turn_ac_rec

Turn_ac_pay

Turn_reserv

Goldrule

Liab_assets

Portion_fix_liab

CF_liab

Ac_rec_assets

Property _status

Capital_product

Work_cap_assets

Prevent_bank

Ac_recpay

Autonomy

    -0,14 (0,00)
    -0,03 (0,00)
    -0,01 (0,00)
    0,01 (0,00)

2353.6

Без учета переменных группы деловой активности

    -1,44 (0,00)
    -3,16 (0,00)
    1,24 (0,91)
    -1,79 (0,28)

2473.8

    -1,44 (0,00)
    -3,19 (0,00)
    1,27 (0,91)
    3,39 (0,06)

2472.2

    -1,14 (0,00)
    -3,40 (0,00)
    3,56 (0,97)
    -2,54 (0,00)

2426.3

    -1,44 (0,00)
    -3,23 (0,00)
    1,33 (0,91)
    3,86 (0,00)

2467.3

По результатам второго метода для дальнейшего анализа выберем две лучшие модели (наименьшее значение критерия Акаике и все переменные значимы на 5% уровне): Модель 17: Чистые активы (Ln_Netassets) + Рентабельность активов (ROA) + Коэффициент текущей ликвидности (Cur_liq) + Коэффициент оборачиваемости кредиторской задолженности (Turn_ac_pay) + Имущественное положение (Property _status) и Модель 2: Чистые активы (Ln_Netassets) + Рентабельность активов (ROA) + Коэффициент текущей ликвидности (Cur_liq) + Коэффициент оборачиваемости кредиторской задолженности (Turn_ac_pay) + Коэффициент автономии (Autonomy). Но первая не может быть использована из-за сильной корреляции между Cur_liq и Turn_ac_pay, а вторая из-за сильной корреляции Autonomy и ROA, Ln_Netassets. Так как коэффициент текущей ликвидности во время построения вышеупомянутых моделей был всегда на грани 5% уровня значимости при совместном включении переменной Turn_ac_pay из группы "Деловой активности", с которой имеется сильная парная корреляция, а при включении других переменных из этой группы коэффициент текущей ликвидности не имеет статистической значимости, то попробуем выбрать наилучшую модель без показателей ликвидности (так как абсолютная ликвидность была вообще статистически незначимой). Выберем одну из моделей с наименьшим значением критерия Акаике, всеми значимыми переменными без учета переменных из группы ликвидность: Модель 20: Чистые активы (Ln_Netassets) + Рентабельность активов (ROA) + Коэффициент оборачиваемости оборотных активов (Rev_cur_assets) + Коэффициент автономии (Autonomy) и Модель 21: Чистые активы (Ln_Netassets) + Рентабельность активов (ROA) + Коэффициент оборачиваемости капитала (Turn_assets) + Коэффициент автономии (Autonomy). Т. к. Ln_Netassets и ROA показали статистическую значимость во всех построенных моделях и не имеют сильной парной корреляции между собой, то их фиксируем в модели, как представителей группы "Размер компании" и "Рентабельность" соответственно. В таком случае все переменные из группы "Деловая активность" могут быть включены в модель, так как не имеют сильных корреляций (выше уровня 0.3) с упомянутыми выше показателями. Что касается переменных из группы "Финансовая устойчивость", то выбор в ней коэффициент автономии (Autonomy) имеют сильную корреляцию с ROA и Ln_Netassets, а другие показатели из групп этих показателей не являются статистически значимыми для модели, значит, не включаем именно коэффициент автономии. Переменная CF_liab оказалась статистически незначимой для модели. Далее по качеству ROC-кривых в группе "Финансовая устойчивость" идет Work_cap_assets, который сильно коррелирует с ROA и не может быть включен в модель. Проверяем возможность включение Ac_recpay. Видим, что отсутствует зависимость с уже включенными в модель ROA и Ln_Netassets, но есть ограничение на совместное включение с Turn_ac_pay из группы "Деловая активность". Проверяем объясняющую переменную Liab_assets и видим, что есть сильная корреляция с Ln_Netassets. Переменную Goldrule можно попробовать, так как нет сильных парных корреляций, но она в модели 14 оказалась статистически незначимой. Переменная Capital_product может быть включена в модель - отсутствуют сильные парные корреляции с другими переменными. По схожим рассуждениям могут быть проверены переменные Ac_rec_assets, Property_status и Prevent_bank. А переменная Portion_fix_liab не может быть включена в модель, так как имеет сильную корреляцию с Ln_Netassets и слабое качество ROC-кривой. Дополнительное ограничение на модель оказывает проведенный для каждой переменной ANOVA-тест. Так, по его результатам, в модель не могут быть включены Ac_rec_assets и Ac_recpay. Таким образом, можем протестировать модели со следующими переменными из группы "Финансовая устойчивость": Goldrule, Capital_product, Property_status, Prevent_bank. Все четыре показателя не имеют ограничений на включение переменных из группы "Деловая активность". Переменная Goldrule как и в модели 14 осталась незначимой для всех возможных спецификаций модели.

Подытожим полученную модель вторым методом на основе поочередного включения переменных из каждой группы и с учетом качества ROC-кривых, парных корреляций и ANOVA-теста (табл. 12): Таблица 12.

Коэффициенты наилучшей модели, построенной вторым методом

Размер компании

Рентабельность

Ликвидность

Деловая активность

Финансовая устойчивость

Критерий AIC

Модель 29

Ln_Netassets

ROA

Turn_assets

Property _status

2262.4

Еще одним вариантом модели является включение коэффициента текущей ликвидности и не включение переменных из группы "Деловая активность". Можем проверить еще четыре модели (38-41 в табл. 11) с переменными из группы "Финансовой устойчивости": Goldrule, Capital_product, Property_status, Prevent_bank. Как мы видим, ни одна из таких моделей не может быть использована, так как в них Cur_liq не является статистически значимым на любом уровне, а информационный критерий Акаике выше, чем в модели полученной без включения переменных из группы "Ликвидность". Как итог, для дальнейшего анализа оставляем модель 29 (табл. 12).

Похожие статьи




Построение модели бинарного выбора несколькими методами - Анализ и прогнозирование уровня конкурентоспособности компаний строительного комплекса

Предыдущая | Следующая