Сопоставление статистических методов и искусственных нейронных сетей - Влияние значений финансовых коэффициентов на вероятность банкротства компании
Для прогнозирования банкротства, некоторые исследователи создают модели, основанные на использовании искусственных нейронных сетей. Как правило, нейронные сети присутствуют в работе как дополнительный метод моделирования и сравниваются со статистическими методами по предсказательной силе.
Работа ученых из Туниса (Hamdi and Mestiri, 2014), опубликованная в Economics Bulletin (Q3 В экономике, эконометрике и финансах), сравнивает предсказательную силу полупараметрической логистической регрессии и искусственных нейронных сетей на выборке из 528 тунисских фирм за период с 1999 по 2006 год. Из 528 компаний выборки, 80 были признаны банкротами.
В качестве объясняющих переменных в модель логистической регрессии включены 7 финансовых коэффициентов: оборачиваемость активов, экономическая прибыльность, ROA, ROE, уровень обеспеченности собственным капиталом, отношение финансовых расходов к общему долгу и долгосрочная кредитоемкость. Последний коэффициент был включен в модель нелинейно. В итоговой модели, полученной с помощью логистической регрессии, наибольшую значимость (подсчитанную по формуле ) имели коэффициент экономической прибыльности и коэффициент отдачи от активов. Одновременно с этим, ROE оказался незначимым на 5% уровне значимости.
Искусственная нейронная сеть также использовала 7 выбранных финансовых коэффициентов. 80% имевшихся наблюдений авторы использовали для обучения сети. Для скрытого слоя использовалась наиболее распространенная в финансовом моделировании сигмоидальная функция по образцу исследования (McNelis, 2005). Линейная функция была применена для выходного слоя.
Для оценки качества модели был рассчитан процент ошибок и площадь под ROC кривой для каждой модели. В случае логистической регрессии эти показатели составили 0,129 и 0,763 соответственно, а для нейронной сети: 0,111 и 0,871. Исходя из полученных значений, авторы заключили, что искусственная нейронная сеть превосходит логистическую регрессию по предсказательной силе на данной выборке.
В работа российских ученых (Макеева и Бакурова, 2012) сравнивается предсказательная сила логистической регрессии и модели с использованием искусственных нейронных сетей на выборке из европейских компаний нефтегазового сектора за период с 2000 по 2010 год. В качестве объясняющих переменных были взяты следующие показатели:
- - Финансовый рычаг, который был рассчитан как логарифм отношения обязательств к собственному капиталу. Логарифмирование было произведено для увеличения степени нормальности распределения данных; - Ликвидность, как логарифм отношение текущих активов к текущим обязательствам; - Оборачиваемость, как отношение рабочего капитала к суммарным активам; - Рентабельность, как соотношение чистого дохода и суммарных активов.
Логистическая регрессия правильно предсказывает 76% исходов (93,8% для банкротов и 40,9% для небанкротов), а эффективность прогнозов модели на основе нейронных сетей составляет 98% (100% для банкротов и 94,8% для небанкротов). Несмотря на значительное превосходство нейронных сетей, авторы отмечают, что, в случае их использования, результат применения в значительной степени зависит от используемой выборки. В условиях неполной информации могут возникнуть смещенные результаты.
В другой работе (Dong et al, 2014), посвященной предсказанию банкротства компаний Китая, занимающихся операциями с недвижимостью, авторы используют три метода моделирования: логистическую регрессию, искусственные нейронные сети и регрессию опорных векторов. Используемая выборка представляет собой несбалансированную панель из 14 банкротов и 315 небанкротов.
Сравнивая качество предсказаний используемых моделей, авторы принимают предпосылку о том, что цена ошибок первого и второго рода не равна. Поэтому они используют следующий способ оценки эффективности модели:
,
Где: TPR это процент правильно предсказанных банкротов от общего числа банкротов, а TNR - процент правильно предсказанных небанкротов от их общего числа.
Наибольшей оценки через G-mean смогла достичь логистическая регрессия (1,256); на втором месте по точности предсказаний оказалась модель, созданная с помощью регрессии вспомогательных векторов (1,227). Хуже всего при такой системе оценки проявил себя подход моделирования через искусственные нейронные сети (1,111).
Mario Tinoco и Nick Wilson в работе (Tinoco and Wilson, 2013), которая была опубликована в International Review of Financial Analysis (Q2 В экономике, эконометрике и финансах), дополняют набор объясняющих переменных рыночными и макроэкономическими детерминантами. Авторы проводят моделирование с помощью логистической регрессии, множественного дискриминантного анализа и искусственных нейронных сетей.
Выборка включает в себя наблюдения по 3 020 нефинансовым залистованным компаниям Великобритании за период с 1980 по 2011 год. Помимо финансовых коэффициентов, в качестве объясняющих переменных взяты два макроэкономических показателя - индекс потребительских цен Великобритании и реальная ставка по трехмесячным казначейским облигациям Соединенного Королевства, а также четыре переменных, основанных на рыночных данных по компаниям - цена акций компании, накопленная сверхдоходность с задержкой в один год, отношение рыночной капитализации компании к рыночной капитализации FTSE All Share Index и отношение капитализации к общему долгу компании.
Сравнивая построенные модели с помощью оценки площади под ROC кривой, исследователи заключили, что искусственные нейронные сети с оценкой 0,925 превосходят модель Альтмана (0,852) и логистическую регрессию (0,913). Однако, по мнению авторов, разница несущественная, в то время как логистическая модель обладает большей прозрачностью и переносимостью по сравнению с нейронными сетями.
В исследовании (Korol, 2013), опубликованном в Economic Modeling (Q2 В экономике и эконометрике), ставится цель сравнить детерминанты банкротства компаний в Латинской Америке и Центральной Европе. Помимо этого, автор проводит сравнение эффективности дискриминантного анализа, искусственных нейронных сетей и модели на основе дерева решений. Выборка по Латинской Америке включает 60 компаний, залистованных на биржах Мексики, Аргентины, Перу, Бразилии и Чили за период с 1996 по 2009 год, в том числе 30 банкротов. Центральная Европа представлена 185 компаниями, залистованными на Варшавской фондовой бирже. За период с 2000 по 2007 год 50 компаний из выборки обанкротились.
Для каждой выборки были отобраны наиболее релевантные объясняющие переменные из множества финансовых коэффициентов, и составлены три вида моделей. Автор отмечает, что модели для Латинской Америки были сложнее по структуре, так как включали больше детерминант банкротства. Для обеих выборок наиболее эффективной оказалась модель на основе дерева решений: для американской выборки она предсказала правильно 96,66% исходов, а для европейской - 96,23%. Дискриминантный анализ имел предсказательную силу 86,53% и 86,79% соответственно. Эффективность нейронных сетей для американской выборки оказалась значительно выше, чем для европейской: 92,31% против 85,18%.
Примечательной является работа (Chen et al, 2006), опубликованная в Review of Pacific Basin Financial Markets and Policies (Q3 В экономике, эконометрике и финансах). В ней авторы используют четыре различных метода моделирования: линейный дискриминантный анализ, логистическая регрессия, дерево решений и искусственные нейронные сети.
В работе используется выборка китайских залистованных компаний за период с 1999 по 2003 год. Она представляет собой несбалансированную панель из 1 029 компаний, из которых 89 обанкротились. В качестве прокси банкротства для китайских компаний использовалось присвоение метки особого внимания (special treatment label - ST).
Полученные результаты оценки моделей демонстрируют несовершенство метода оценки эффективности по общему числу ошибок модели в рамках несбалансированной выборки. Например, процентные значения величины общей ошибки для линейного дискриминантного анализа и искусственных нейронных сетей примерно равны: 22,33% и 22,16% соответственно. Однако, если рассмотреть результаты в разрезе ошибок первого и второго рода, то для ЛДА эти значения равны 41,57% и 3,09% соответственно, а для ИНС - 6,74% и 23,62%. Поэтому авторы решили пересчитать общую ошибку используя разные веса для ошибок первого и второго рода. Для весов, соотносящихся как 9:1, 8:2 и 7:3 ИНС модель оказалась лучшей из протестированных. При весе ошибок 6:4 логистическая регрессия опережала другие методы прогнозирования.
Главным методологическим преимуществом искусственных нейронных сетей над статистическими методами является отсутствие требования выполнения предпосылок о нормальности и независимости регрессоров. На практике эти предпосылки часто не выполняются, что снижает качество статистических моделей. Некоторые исследователи (например, Tinoco and Wilson, 2013) предполагают, что нейронные сети должны превосходить логистическую регрессию и дискриминантный анализ, однако исходя из рассмотренной литературы это происходит не всегда.
Вопрос о методологии сравнения между собой различных моделей также является дискуссионным. Во многих рассмотренных работах использовались оценки с помощью общих ошибок или площади под ROC кривой, которые подразумевают равный вес ошибок первого и второго рода. Однако большинство исследователей согласны, что для реальной экономической деятельности цена этих ошибок отличается. В существующей литературе нет однозначных рекомендаций по значениям весов для ошибок первого и второго рода, поэтому наилучшим выходом видится рассмотрение различных комбинаций по аналогии с работой (Chen et al, 2006).
Похожие статьи
-
Среди современных исследований на тему предсказания банкротства можно выделить группу работ, которые не ставят своей целью сравнение предсказательной...
-
Данная работа опирается на исследования, посвященные проблематике предсказания банкротства компаний. Наибольший интерес в работах предшественников...
-
Большинство современных исследований, посвященных предсказанию банкротства, используют больше одного метода моделирования и делают выводы о сравнительной...
-
Заключение - Влияние значений финансовых коэффициентов на вероятность банкротства компании
В рамках данного исследования были построены и оценены модели предсказания банкротства на базе логистической регрессии и искусственных нейронных сетей...
-
Основной целью исследования является сравнение предсказательной силы моделей, построенных на основе различных методов. В условиях несбалансированности...
-
Введение - Влияние значений финансовых коэффициентов на вероятность банкротства компании
Моделирование вероятности банкротства является широко применимой практической процедурой, которая необходима любой крупной кредитной организации....
-
Искусственные нейронные сети (ИНС) рассматриваются исследователями как возможная альтернатива статистическим методам. Исследования, использующие ИНС, как...
-
На следующем этапе в модель были добавлены дамми-переменные годов и отраслей. Таблицы соотношения переменных и данных приведены ниже. Кроме дамми...
-
Постановка гипотез - Влияние значений финансовых коэффициентов на вероятность банкротства компании
Цель данной работы заключается в сравнении предсказательной силы логистической регрессии и искусственных нейронных сетей (ИНС) в рамках моделирования...
-
Описание данных Данные для исследования получены из базы Руслана, предоставляемой компанией Бюро Ван Дайк. Эта база содержит данные финансовой отчетности...
-
Влияние значений финансовых коэффициентов на вероятность банкротства компании
Детализация расчета точки отсечения через G-mean для модели ИНС №2. Уровень Ошибка по небанкротам Ошибка по банкротам G-mean 0.04 10% 31% 1.262 0.039 10%...
-
В первоначальном выборе объясняющих переменных существует две стратегии. Часть авторов осуществляют подбор переменных, опираясь на собственные...
-
Приложения, - Влияние значений финансовых коэффициентов на вероятность банкротства компании
Описательные статистики по финансовым коэффициентам. Переменная Количество наблюдений Среднее Медиана 25 перцентиль 75 перцентиль Стандартное отклонение...
-
Проблема прогнозирования вероятности банкротства существует уже несколько десятков лет - все началось с работ Ramser, Foster (1931), Fitzpatrick (1932) и...
-
Построение модели с помощью логистической регрессии Прежде чем строить логистическую регрессию, необходимо выбрать конечный набор финансовых и...
-
Применение нейронных сетей в финансовой сфере - Прогнозирующие системы
Характерный пример успешного применения нейронных вычислений в финансовой сфере - управление кредитными рисками. Как известно, до выдачи кредита банки...
-
Описание используемых методов - Моделирование вероятности банкротства
В данной работе было принято решение использовать логистический анализ с помощью пакета STATA, а также алгоритм CART с помощью SPSS Modeler. Бинарная...
-
Описание данных - Моделирование вероятности банкротства
Данные для исследования были взяты из базы Ruslana (Bureau van Dijk), содержащей финансовую и некоторую нефинансовую информацию об организациях из...
-
Нефинансовые факторы, влияющие на вероятность банкротства - Моделирование вероятности банкротства
Как было отмечено выше, важность финансовых показателей для определения вероятности банкротства фирмы была замечена в самых ранних работах. Однако...
-
Отбор и классификация объясняющих переменных Для всесторонней оценки строительной компании в ходе анализа будут использоваться финансовые,...
-
Составляется матрица численных значений базисных функций, соответствующая расширенной матрице спектра плана Вычисляется информационная матрица...
-
По итогам проведенного исследования можно прийти к выводу о том, что и логит-регрессия и деревья решений позволили построить модели, которые с...
-
В данной главе мы приводим детальное описание метода обратного распространения - способа обучения многослойных НС. Подробно описана НС для распознавания...
-
Построение модели с помощью метода деревьев решений - Моделирование вероятности банкротства
В отличие от логистической регрессии, при использовании метода деревьев решений ограничения для независимых переменных отсутствуют, поэтому для...
-
Заключение - Моделирование вероятности банкротства
Целью данного исследования являлось моделирование вероятности банкротства российских нефинансовых компаний на основе наиболее значимых показателей...
-
Важной задачей статистики является разработка методики статистической оценки социально-экономических явлений, которая осложняется тем, что многие...
-
Введение - Моделирование вероятности банкротства
В настоящее время в условиях экономической стагнации и ухудшения финансового состояния бизнеса тема кредитоспособности и оценки устойчивости предприятий...
-
Методология исследования, Постановка гипотез - Моделирование вероятности банкротства
Постановка гипотез Целью данного исследования является построение модели вероятности банкротства, которая будет обладать надежностью не менее 80%. По...
-
Выбор переменных - Моделирование вероятности банкротства
Как уже было отмечено выше, единого набора финансовых и нефинансовых показателей, которые необходимо включать в модели, не существует, поэтому было...
-
Задача регрессии. Метод наименьших квадратов Ищу функцию регрессии в виде (1*). Оценки коэффициентов нахожу с помощью Метода Наименьших Квадратов (МКВ),...
-
Существует целый ряд классификаций моделей используемых для прогнозирования финансовой несостоятельности заемщиков. В своей работе Григорьева Т. И....
-
В настоящее время нельзя назвать область человеческой деятельности, в которой в той или иной степени не использовались бы методы моделирования. Особенно...
-
МЕТОДЫ ОТБОРА СПЕЦИАЛИСТОВ В ЭКСПЕРТНУЮ ГРУППУ - Основы прогнозирования
Проведение экспертизы начинается с создания специальной группы специалистов-организаторов опроса. Задачами группы являются выбор цели экспертизы,...
-
Особенности эконометрического метода - Особенности эконометрического метода
Становление и развитие эконометрического метода на методах вычислительной статистики: - на методах парной и множественной корреляции; - выделение тренда...
-
Заключение - Уровень конкурентоспособности строительных компаний
В ходе проведенного исследования была построена logit-модель вероятности дефолта для непубличных компаний строительного комплекса. Данная модель поможет...
-
Сущность группировки, их виды и значение Группировка -- это распределение единиц по группам в соответствии со следующим принципом: различия между...
-
Итак, модели, которые будут дальше анализироваться, и получены с помощью Первого метода - проведения теста для выделения наиболее дескриптивных...
-
Помимо технических характеристик здания, анализируемых выше, объекты офисной недвижимости характеризуются факторами удобства для арендаторов. К таким...
-
Гедонистический подход Гедонистический подход используется при анализе ценообразования и заключается в моделировании цены объекта как функции от его...
-
В интервальном вариационном ряду мода вычисляется по формуле: , Где Y O - нижняя граница модального интервала; H - размер модального интервала; F Mo -...
Сопоставление статистических методов и искусственных нейронных сетей - Влияние значений финансовых коэффициентов на вероятность банкротства компании