Предсказательная сила финальной модели - Анализ и прогнозирование уровня конкурентоспособности компаний строительного комплекса
Итак, будем тестировать модель с наилучшими характеристиками. Прогноз вне выборки проводился на основе тестовой выборки с 805 наблюдениями. В ней представлены данные 2014 года по 161 дефолтной строительной организации и 644 состоятельным организациям. Далее рассмотрим предсказательную силу финальной модели при нескольких порогах, которые являются барьером для состоятельных и несостоятельных компаний.
Если порог - дефолт, когда вероятность >= 2,5%, то в группе риска оказываются 268 компаний из 805. Данный порог позволяет правильно предсказать значительное количество дефолтов - 73% и состоятельных компаний - 77% (табл.24).
Таблица 24.
Классификационная таблица |
На основе модели | ||
Не дефолт |
Дефолт | ||
Реально |
Не дефолт |
77% |
23% |
Дефолт |
27% |
73% |
Если порог - дефолт, когда вероятность >= 3%. В группе риска: 194 компании из 805. Данный порог позволяет правильно предсказать значительное количество дефолтов - 61% и состоятельных компаний - 85% (табл.25).
Таблица 25.
Классификационная таблица |
На основе модели | ||
Не дефолт |
Дефолт | ||
Реально |
Не дефолт |
85% |
15% |
Дефолт |
39% |
61% |
Если порог - дефолт, когда вероятность >= 5%. В группе риска: 117 компаний из 805. Данный порог позволяет правильно предсказать 44% дефолтов и 93% состоятельных строительных организаций (табл. 26).
Таблица 26.
Классификационная таблица |
На основе модели | ||
Не дефолт |
Дефолт | ||
Реально |
Не дефолт |
93% |
7% |
Дефолт |
56% |
44% |
Для наглядности сведем полученные результаты при рассмотренных порогах в единую таблицу 27.
Таблица 27.
Критерий причисления компании к группе риска: вероятность дефолта >= порога |
Количество компаний, отнесенных к группе риска |
Процент верно предсказанных дефолтов |
Порог = 2,5% |
268 |
73% |
Порог = 3% |
194 |
61% |
Порог = 5% |
117 |
44% |
Исходя из полученных результатов, предполагается, что в данном исследовании оптимальным порогом можно считать, например, 2,5% вероятности дефолта. Он позволяет иметь сравнительно небольшие ошибки первого и второго рода, а также достаточно сбалансированные точные предсказания касательно состоятельных и дефолтных организаций. В целом, выбор порога является задачей пользователя модели и зависит от его предпочтений касательно ошибок первого и второго рода.
Также, после построения финальных моделей на данных обучающей выборки и получения прогнозных результатов на данных тестовой выборки проведем анализ ошибок первого и второго рода, чтобы сравнить прогнозную силу полученных моделей. Ошибкой первого рода принято считать случаи, когда модель предсказывала, что строительная компания является устойчивой, а на самом деле в следующем году она объявила дефолт. Ошибка второго рода, напротив, отражает случаи, когда прогнозируется, что строительная компания будет несостоятельной, а она избежала дефолта. Очевидно, что с точки зрения инвестора, надзорного органа или партнера при выборе контрагента лучше перестраховаться, поэтому для них ошибка второго рода, когда в группу риска дефолта относится больше компаний, чем есть на самом деле, не так страшна. Другое дело ошибка первого рода, когда могло оказаться доверие строительной компании на основе модели, а она утратила состоятельность. В этом случае потери инвестора или партнера будут очень серьезными. С этой точки зрения, в рамках данного исследования стоит минимизировать ошибку первого рода, чтобы избежать рисков неплатежеспособности контрагента. Для проведения анализа данных ошибок были построены графики вероятности каждой из ошибок при изменении порога дефолта. Напомним, что порогом является значение вероятности дефолта для принятия решения о будущей состоятельности строительной организации. Так, когда вероятность дефолта больше установленного порога, ожидается дефолт компании. Тем не менее, как уже отмечалось, выбор порога зависит от предпочтений пользователя модели (инвестора, надзорного органа, партнера) (Bovenzi et al., 1983). Таким образом, алгоритм построения графиков заключается в нахождении для каждого порога пары вероятности ошибки первого рода и вероятности ошибки второго рода. В данном исследовании вычисление вероятности каждой из ошибок на основе тестовой выборки производилось 1000 раз для каждой модели. Что касается оценки полученных графиков, то предсказательная сила лучше у той модели, чей график находится ниже (Peresetsky et al., 2004).
Графики ошибок первого и второго рода были построены для:
- - модель, построенная на основе статистического отбора переменных без перехода к нормированной шкале (красный цвет); - модель, построенная на основе статистического отбора переменных с переходом к нормированной шкале (черный цвет); - модель, построенная на основе поочередного включения переменных без перехода к нормированной шкале (синий цвет); - модель, построенная на основе поочередного включения переменных с переходом к нормированной шкале (зеленый цвет).
Сравнение графиков для модели, построенной первым методом (рис. 1), еще раз подтверждает правильность перехода к нормированной шкале.
Рисунок 1. Сравнение первой модели (статистический отбор переменных), с нормализацией (черный) и без (красный)
Так же как и сравнение графиков для модели, построенной вторым методом (рис. 2), где график модели после нормирования шкалы находится ниже, чем без нормирования.
Рисунок 2. Сравнение второй модели (поочередное включение переменных), с нормализацией (зеленый) и без (синий)
Что касается сравнения двух финальных моделей, полученных как раз после нормирования шкал, то рисунок 3 показывает, что большей предсказательной силой, несмотря на несколько пересечений графиков, обладает модель статистического отбора переменных, так как она при значительно большем количестве порогов находится ниже альтернативного графика.
Рисунок 3. Сравнение 1ой (черный) и 2ой (зеленый) модели в нормализованных шкалах
Рисунок 4. Общий график ошибок 1 и 2 рода
На общем графике также видно, что присутствует довольно большая область, где ниже всех расположена модель, построенная на основе статистического отбора переменных с переходом к нормированной шкале (черный цвет). Эта же модель показала наилучшую форму ROC-кривой, где коэффициент AUC имеет значение 0,8029. Значит и данный подход указывает на ее достаточно сильную предсказательную способность.
Похожие статьи
-
ЗАКЛЮЧЕНИЕ - Анализ и прогнозирование уровня конкурентоспособности компаний строительного комплекса
В ходе проведенного исследования была построена logit-модель вероятности дефолта для непубличных компаний строительного комплекса. Данная модель поможет...
-
Теперь, когда в рамках данного исследования была получена модель с наилучшими характеристиками для непубличных строительных компаний, полученные...
-
Существует целый ряд классификаций моделей используемых для прогнозирования финансовой несостоятельности заемщиков. В своей работе Григорьева Т. И....
-
Далее предпримем попытки улучшить качество полученных моделей с помощью поочередного перехода к порядковой шкале и нормированной шкале. Полученные...
-
ВВЕДЕНИЕ - Анализ и прогнозирование уровня конкурентоспособности компаний строительного комплекса
Актуальность темы исследования. Строительная отрасль характеризуется огромным количеством потенциальных исполнителей. Полный цикл возведения любого...
-
Перейдем к интерпретации построенной модели для непубличных строительных компаний, так как она представляет не меньший интерес, чем прогнозное качество...
-
Для дополнительной наглядности полученных результатов предлагается подготовить рейтинговую шкалу, которая отмечала бы, какие значения вероятности дефолта...
-
Для анализа был выбран временной диапазон с 2004 года по 2014 год. В целях построения прогнозной модели собранные годовые данные были разделены на две...
-
При дальнейшем построении модели воспользуемся таким ограничением, как на каждую объясняющую переменную должно приходиться не менее тридцати наблюдений...
-
Для целей проверки гипотезы о значимости рассматриваемых нами институциональных показателей (место нахождения, задолженность по уплате налогов), в...
-
Отбор и классификация объясняющих переменных Для всесторонней оценки строительной компании в ходе анализа будут использоваться финансовые,...
-
Проверим значимость квадратичной формы переменных для двух полученных моделей. Сначала рассмотрим значимость данных преобразований для первой модели...
-
Как показывает практика, чтобы любой инструмент стал широко используемым, он должен либо пройти через сито мнений экспертов отрасли, для анализа которой...
-
Как отмечалось в ходе исследования, logit-модель может характеризоваться сильной зависимостью от обучающей выборки. Поэтому чтобы быть уверенным в...
-
Итак, модели, которые будут дальше анализироваться, и получены с помощью первого метода - проведения теста для выделения наиболее дескриптивных...
-
Определение критериев события дефолт Строительная отрасль является одним из главных двигателей экономики. В России количество компаний, работающих на...
-
Предпосылки построения индекса Строительная отрасль России характеризуется очень большим объемом строительных компаний и объемом работ, выполненных по...
-
Ниже можно ознакомиться с первыми результатами расчета всего "семейства" индексов (см. табл. 33 и рис.7): Таблица 33. Значения ИКСО по федеральным...
-
Сравнительный анализ нейросетевых и регрессионных моделей прогноза без учета пространственного лага Приведем результаты оценки прогноза за период...
-
Для комбинирования отобраны модели с наименьшей корреляцией между собой с помощью корреляционной матрицы. Корреляционная матрица состоит из числовых и...
-
Кей-анализ по оценке изменения стоимости Thermo Fisher Scientific Incorporation в результате поглощения Dionex Corporation Для того чтобы оценить...
-
Поглощение одной компании другой является весьма распространенным механизмом корпоративного строительства. Самый сложный процесс -- определение стоимости...
-
В ходе данного исследования был проведен регрессионный анализ M&;A-сделок в фармацевтической отрасли. Целью анализа является выявление факторов, влияющих...
-
Анализ статических моделей панельных данных имеет ряд недостатков. Во-первых, при условии корреляции между лагом зависимой эндогенной зависимой...
-
Регрессионные модели В теории пространственной экономики выделяют пространственные связи двух типов: пространственная автокорреляция и пространственная...
-
В данной главе перейдем к анализу модели в-конвергенции по панельным данным. Для начала оценим модель безусловной конвергенции, в основе которой лежит...
-
Построение модели - Анализ поведения домашних хозяйств в современной России
Ориентируясь на результаты предварительного анализа и экономических соображений, была построена базовая регрессионная модель по данным, собранным в...
-
В настоящее время проектный подход к управлению становится общепризнанным мировым стандартом работы. Эффективность деятельности компании определяется ее...
-
2.1 Код для построения модели Кривая производственных возможностей помогает найти оптимальный вариант, при котором альтернативные издержки минимальны, а...
-
Модели потребления - Статистические методы в исследовании потребления населения
Под моделями потребления понимаются уравнения или их система, отражающая зависимость показателей потребления товаров и услуг от комплекса...
-
При добавлении в панельную модель безусловной в-конвергенции факторов, влияющих на экономический рост, модель преобразуется в "условную". Большинство...
-
Анализ мукомольной отрасли в РФ - Разработка стратегии роста для компании
Традиционно главным ценообразующим фактором мукомольной отрасли является стоимость зерна на рынке. Наибольший объем производства пшеницы приходится на...
-
Несмотря на то, что сегодня нет единого мнения относительно наличия в-конвергенции среди регионов России в 1992-2000 годах, большинство авторов полагают,...
-
Анализ товарооборота Данные о товарообороте магазина "Меркурий" (ООО "Ковжаров - Мобайл") в 2014-2015 годах приведены в таблице 2.2.1.1. Таблица 2.2.1.1...
-
Спецификация модели для США и интерпретация результатов В этой главе будет приведено два исследования, задачами которых будет выяснение ключевых...
-
В рамках данной главы для проведения сравнительного анализа поведения российских, индийских и китайских фармацевтических компаний был выполнен анализ...
-
Эмпирическое исследование интеллектуального капитала компании В последнее время при принятии важных стратегических решений, используется подход, который...
-
Заключение - Слияния и поглощения на фармацевтическом рынке и их влияние на стоимость компаний
В процессе работы над исследованием были изучены труды как отечественных, так и зарубежных авторов посвященные данной тематике. Было отмечено, что...
-
Гипотеза, выдвинутая в начале исследования состоит в том, что учет пространственной взаимосвязи регионов посредством ввода в модель пространственных...
-
Анализ результатов моделирования в-конвергенции Во второй главе были описаны результаты построения моделей в-конвергенции для 76 регионов России. Анализ...
Предсказательная сила финальной модели - Анализ и прогнозирование уровня конкурентоспособности компаний строительного комплекса