Сопоставление статистических методов и искусственных нейронных сетей - Влияние значений финансовых коэффициентов на вероятность банкротства компании

Для прогнозирования банкротства, некоторые исследователи создают модели, основанные на использовании искусственных нейронных сетей. Как правило, нейронные сети присутствуют в работе как дополнительный метод моделирования и сравниваются со статистическими методами по предсказательной силе.

Работа ученых из Туниса (Hamdi and Mestiri, 2014), опубликованная в Economics Bulletin (Q3 В экономике, эконометрике и финансах), сравнивает предсказательную силу полупараметрической логистической регрессии и искусственных нейронных сетей на выборке из 528 тунисских фирм за период с 1999 по 2006 год. Из 528 компаний выборки, 80 были признаны банкротами.

В качестве объясняющих переменных в модель логистической регрессии включены 7 финансовых коэффициентов: оборачиваемость активов, экономическая прибыльность, ROA, ROE, уровень обеспеченности собственным капиталом, отношение финансовых расходов к общему долгу и долгосрочная кредитоемкость. Последний коэффициент был включен в модель нелинейно. В итоговой модели, полученной с помощью логистической регрессии, наибольшую значимость (подсчитанную по формуле ) имели коэффициент экономической прибыльности и коэффициент отдачи от активов. Одновременно с этим, ROE оказался незначимым на 5% уровне значимости.

Искусственная нейронная сеть также использовала 7 выбранных финансовых коэффициентов. 80% имевшихся наблюдений авторы использовали для обучения сети. Для скрытого слоя использовалась наиболее распространенная в финансовом моделировании сигмоидальная функция по образцу исследования (McNelis, 2005). Линейная функция была применена для выходного слоя.

Для оценки качества модели был рассчитан процент ошибок и площадь под ROC кривой для каждой модели. В случае логистической регрессии эти показатели составили 0,129 и 0,763 соответственно, а для нейронной сети: 0,111 и 0,871. Исходя из полученных значений, авторы заключили, что искусственная нейронная сеть превосходит логистическую регрессию по предсказательной силе на данной выборке.

В работа российских ученых (Макеева и Бакурова, 2012) сравнивается предсказательная сила логистической регрессии и модели с использованием искусственных нейронных сетей на выборке из европейских компаний нефтегазового сектора за период с 2000 по 2010 год. В качестве объясняющих переменных были взяты следующие показатели:

    - Финансовый рычаг, который был рассчитан как логарифм отношения обязательств к собственному капиталу. Логарифмирование было произведено для увеличения степени нормальности распределения данных; - Ликвидность, как логарифм отношение текущих активов к текущим обязательствам; - Оборачиваемость, как отношение рабочего капитала к суммарным активам; - Рентабельность, как соотношение чистого дохода и суммарных активов.

Логистическая регрессия правильно предсказывает 76% исходов (93,8% для банкротов и 40,9% для небанкротов), а эффективность прогнозов модели на основе нейронных сетей составляет 98% (100% для банкротов и 94,8% для небанкротов). Несмотря на значительное превосходство нейронных сетей, авторы отмечают, что, в случае их использования, результат применения в значительной степени зависит от используемой выборки. В условиях неполной информации могут возникнуть смещенные результаты.

В другой работе (Dong et al, 2014), посвященной предсказанию банкротства компаний Китая, занимающихся операциями с недвижимостью, авторы используют три метода моделирования: логистическую регрессию, искусственные нейронные сети и регрессию опорных векторов. Используемая выборка представляет собой несбалансированную панель из 14 банкротов и 315 небанкротов.

Сравнивая качество предсказаний используемых моделей, авторы принимают предпосылку о том, что цена ошибок первого и второго рода не равна. Поэтому они используют следующий способ оценки эффективности модели:

,

Где: TPR это процент правильно предсказанных банкротов от общего числа банкротов, а TNR - процент правильно предсказанных небанкротов от их общего числа.

Наибольшей оценки через G-mean смогла достичь логистическая регрессия (1,256); на втором месте по точности предсказаний оказалась модель, созданная с помощью регрессии вспомогательных векторов (1,227). Хуже всего при такой системе оценки проявил себя подход моделирования через искусственные нейронные сети (1,111).

Mario Tinoco и Nick Wilson в работе (Tinoco and Wilson, 2013), которая была опубликована в International Review of Financial Analysis (Q2 В экономике, эконометрике и финансах), дополняют набор объясняющих переменных рыночными и макроэкономическими детерминантами. Авторы проводят моделирование с помощью логистической регрессии, множественного дискриминантного анализа и искусственных нейронных сетей.

Выборка включает в себя наблюдения по 3 020 нефинансовым залистованным компаниям Великобритании за период с 1980 по 2011 год. Помимо финансовых коэффициентов, в качестве объясняющих переменных взяты два макроэкономических показателя - индекс потребительских цен Великобритании и реальная ставка по трехмесячным казначейским облигациям Соединенного Королевства, а также четыре переменных, основанных на рыночных данных по компаниям - цена акций компании, накопленная сверхдоходность с задержкой в один год, отношение рыночной капитализации компании к рыночной капитализации FTSE All Share Index и отношение капитализации к общему долгу компании.

Сравнивая построенные модели с помощью оценки площади под ROC кривой, исследователи заключили, что искусственные нейронные сети с оценкой 0,925 превосходят модель Альтмана (0,852) и логистическую регрессию (0,913). Однако, по мнению авторов, разница несущественная, в то время как логистическая модель обладает большей прозрачностью и переносимостью по сравнению с нейронными сетями.

В исследовании (Korol, 2013), опубликованном в Economic Modeling (Q2 В экономике и эконометрике), ставится цель сравнить детерминанты банкротства компаний в Латинской Америке и Центральной Европе. Помимо этого, автор проводит сравнение эффективности дискриминантного анализа, искусственных нейронных сетей и модели на основе дерева решений. Выборка по Латинской Америке включает 60 компаний, залистованных на биржах Мексики, Аргентины, Перу, Бразилии и Чили за период с 1996 по 2009 год, в том числе 30 банкротов. Центральная Европа представлена 185 компаниями, залистованными на Варшавской фондовой бирже. За период с 2000 по 2007 год 50 компаний из выборки обанкротились.

Для каждой выборки были отобраны наиболее релевантные объясняющие переменные из множества финансовых коэффициентов, и составлены три вида моделей. Автор отмечает, что модели для Латинской Америки были сложнее по структуре, так как включали больше детерминант банкротства. Для обеих выборок наиболее эффективной оказалась модель на основе дерева решений: для американской выборки она предсказала правильно 96,66% исходов, а для европейской - 96,23%. Дискриминантный анализ имел предсказательную силу 86,53% и 86,79% соответственно. Эффективность нейронных сетей для американской выборки оказалась значительно выше, чем для европейской: 92,31% против 85,18%.

Примечательной является работа (Chen et al, 2006), опубликованная в Review of Pacific Basin Financial Markets and Policies (Q3 В экономике, эконометрике и финансах). В ней авторы используют четыре различных метода моделирования: линейный дискриминантный анализ, логистическая регрессия, дерево решений и искусственные нейронные сети.

В работе используется выборка китайских залистованных компаний за период с 1999 по 2003 год. Она представляет собой несбалансированную панель из 1 029 компаний, из которых 89 обанкротились. В качестве прокси банкротства для китайских компаний использовалось присвоение метки особого внимания (special treatment label - ST).

Полученные результаты оценки моделей демонстрируют несовершенство метода оценки эффективности по общему числу ошибок модели в рамках несбалансированной выборки. Например, процентные значения величины общей ошибки для линейного дискриминантного анализа и искусственных нейронных сетей примерно равны: 22,33% и 22,16% соответственно. Однако, если рассмотреть результаты в разрезе ошибок первого и второго рода, то для ЛДА эти значения равны 41,57% и 3,09% соответственно, а для ИНС - 6,74% и 23,62%. Поэтому авторы решили пересчитать общую ошибку используя разные веса для ошибок первого и второго рода. Для весов, соотносящихся как 9:1, 8:2 и 7:3 ИНС модель оказалась лучшей из протестированных. При весе ошибок 6:4 логистическая регрессия опережала другие методы прогнозирования.

Главным методологическим преимуществом искусственных нейронных сетей над статистическими методами является отсутствие требования выполнения предпосылок о нормальности и независимости регрессоров. На практике эти предпосылки часто не выполняются, что снижает качество статистических моделей. Некоторые исследователи (например, Tinoco and Wilson, 2013) предполагают, что нейронные сети должны превосходить логистическую регрессию и дискриминантный анализ, однако исходя из рассмотренной литературы это происходит не всегда.

Вопрос о методологии сравнения между собой различных моделей также является дискуссионным. Во многих рассмотренных работах использовались оценки с помощью общих ошибок или площади под ROC кривой, которые подразумевают равный вес ошибок первого и второго рода. Однако большинство исследователей согласны, что для реальной экономической деятельности цена этих ошибок отличается. В существующей литературе нет однозначных рекомендаций по значениям весов для ошибок первого и второго рода, поэтому наилучшим выходом видится рассмотрение различных комбинаций по аналогии с работой (Chen et al, 2006).

Похожие статьи




Сопоставление статистических методов и искусственных нейронных сетей - Влияние значений финансовых коэффициентов на вероятность банкротства компании

Предыдущая | Следующая