Риск наступления дефолта. - Моделирование времени жизни ипотечного кредита
Для объяснения риска наступления дефолта была протестирована непараметрическая регрессия пропорциональных рисков Кокса. Она не обеспечила желаемую подгонку к данным, поскольку в данных была выявлена ненаблюдаемая, то есть не описываемая объясняющими переменными, разнородность. Ввиду того, что риски в модели не пропорциональны, для целей исследования были отобраны следующие параметрические спецификации:
AFT модель (модель ускоренного времени) обобщенной гамма регрессии,
Логнормальная модель с ненаблюдаемым эффектом, имеющим гамма распределение.
Обе модели обеспечивают очень хорошую подгонку к данным, однако с точки зрения визуального анализа остатков Кокса-Снелла гамма регрессия чуть точнее объясняет на правом хвосте. Параметрический анализ на основании значения критерия Акаике рекомендует сделать выбор в пользу гамма регрессии, однако сравнение моделей по прогнозной силе показывает, что логнормальная модель с ненаблюдаемым эффектом чуть точнее прогнозирует вне выборки (на тестовой части данных).
Поскольку в данных был выявлен ненаблюдаемый эффект, также были протестированы различные модели разделенной совокупности mover-stayer, причем коды для их оценивания были написаны вручную ввиду их отсутствия в пакете Stata. Чтобы улучшить качество подгонки, обеспечиваемое гамма регрессией и логнормальной регрессией с ненаблюдаемым эффектом, в первую очередь, на правом хвосте, были построены модели, в которых для описания длительности состояния в классе mover использовались те же распределения - гамма функция и логнормальная функция. При этом вероятность принадлежности к классу mover описывалась с помощью logit модели.
В результате мы пришли к выводу, что более сложные модели типа mover-stayer не приводят к заметному улучшению качества подгонки, обеспечиваемому гамма регрессией и логнормальной регрессией с ненаблюдаемым эффектом. Можно только отметить, что модель mover-stayer, в которой длительность состояния в классе кочевых описывается логнормальной регрессией чуть улучшает качество подгонки на правом хвосте по сравнению с логнормальной моделью с ненаблюдаемым эффектом.
Отметим некоторые наиболее существенные зависимости, выявленные в результате оценивания гамма регрессии. Дефолт по кредиту наступает раньше,
Если тип предмета ипотеки под залогом - дом или таунхаус,
Чем выше доля заемных средств в стоимости жилья,
Если предмет ипотеки находится в недостаточно развитом регионе,
И позже, если
Если основной заемщик имеет высшее образование,
Если предмет ипотеки представляет собой однокомнатное жилье.
В качестве дальнейшего исследования факторов, влияющих на риск наступления дефолта, было бы интересно включение в модель рыночного фактора - изменение рыночных цен на залоговый актив, то есть динамического показателя (LTV)t. Для включения данного показателя в модель необходим периодический мониторинг рыночных цен жилья на основании данных риэлторских агентств.
Исследование времени до реализации залога.
Для целей исследования отобраны следующие модели:
Непараметрическая модель пропорциональных рисков Кокса,
Параметрическая модель Вейбулла с ненаблюдаемым эффектом.
Параметрическая логнормальная регрессия с ненаблюдаемым эффектом.
С точки зрения анализа остатков Кокса-Снелла, все три модели демонстрируют очень точную подгонку к данным. Параметрические модели практически неотличимы друг от друга, что подтверждает визуальный анализ и практически совпадающие значения AIC.
Если сравнивать модели по прогнозной силе, то регрессия Кокса точнее прогнозирует вне выборки (на тестовой части данных), чем регрессия Вейбулла с ненаблюдаемым эффектом, хотя не очень значительно.
Также на данных были протестированы модели mover-stayer, в которых длительность состояния в классе кочевых описывается логнормальной функцией. В результате получены оценки, очень схожие по характеру приближения данных с предыдущими моделями. Таким образом, усложнение моделей не приводит к заметному улучшению качества подгонки.
Отметим, что наиболее сильно на время до реализации залога влияет показатель LTV, а также нахождение предмета ипотеки в развитом регионе. При прочих равных характеристиках при увеличении доли заемных средств в стоимости жилья (на момент выдачи кредита) время до реализации залога с момента дефолта кредита уменьшается. Нахождение предмета ипотеки в развитом регионе увеличивает время до реализации залога при прочих равных характеристиках по сравнению с остальными регионами.
В качестве дальнейшего исследования факторов, влияющих на время до реализации залога, было бы интересно включение в модель рыночного фактора - изменение рыночных цен на залоговый актив, то есть динамического показателя (LTV)t.
Итак, отдельным направлением по развитию и расширению задач, связанных с описанием временной структуры рисков (досрочного погашения, дефолта и реализации залога) в денежных потоках по розничным кредитам, является внедрение рыночных факторов, а также совместная их оценка с индивидуальными характеристиками кредита и связанного с ним актива. Примерами таких рыночных факторов помимо рассмотренных выше эффектов рыночной ставки и динамики рыночных цен на залоговый актив, могут также выступать рыночные факторы, влияющие на входящий поток денежных средств, используемых клиентом (заемщиком) для облуживания кредита, как например уровень безработицы, рост инфляции и др.
Также интересным направлением для работы представляется исследование опционной модели рисков на данных российского рынка ипотеки, то есть учет рисков наступления досрочного погашения и дефолта в одной модели.
Библиография
Айвазян С. А., Мхитарян В. С. Прикладная статистика и основы эконометрики // М.: ЮНИТИ.1998.
Гнеденко Б. В., Беляев Ю. К., Соловьев А. Д. Математические методы в теории надежности. М.: Наука, 1965.
Ратникова Т. А., Фурманов К. К. Анализ панельных данных и данных о длительности состояния. Издательский дом Высшей школы экономики. 2014.
РИАРЭЙТИНГ Рейтинговое Агентство Рейтинг социально-экономического положения субъектов РФ. Итоги 2013 года. http://www. riarating. ru/
Aalen O. O. Nonparametric Inference for a Family of Counting Processes // Annals of Statistics.1978. Vol. 6. P. 701-726.
Asay M., Guillaume F. H., Mattu R. K. Duration and Convexity of Mortgage Backed Securities: Some Hedging Implications from a Prepayment Linked Present Value Model. In Mortgage Backed securities, edited by Frank Fabozzi. Chicago: Probus Publishing. 1987.
Breslow N. E. Covariance Analysis of Censored Survival Data. Biometrics. 1974. Vol. 30. P.89-99.
Chinloy P. The Option Structure of a Mortgage Contract// Journal of Housing Research. 1991. Vol. 2(1). P.21-38.
Cox D. R. Regression Models and Life-Tables // Journal of the Royal Statistical Society. Ser. B. 1972. Vol. 34. P.187-220.
Cox D. R., Oakes D. Analysis of Survival Data // London: Chapman and Hall. 1984.
Cleves M. A., Gould W. W., Gutierrez R. G. An Introduction to Survival Analysis Using Stata. Revised Edition. Stata Press, 2004.
Demyanyk Y., Hemert O. V. Understanding the Subprime Mortgage Crisis // The Review of Financial Studies. 2011. Vol. 24. 6. P. 1848-1880.
Deng Y., Quigley J. M., van Order R. Mortgage Terminations, Heterogeneity and the Exercise of Mortgage Options // Econometrica. 2000. Vol. 68. 2. P. 275-307.
Davidson A., Sanders A., Wolff L-L., Ching A. Securitization. Structuring and Investment Analysis. John Wiley @ Sons, Inc. Hoboken. New Jersey. 2003.
Box-Steffensmeier J. M., Jones B. S. Event History Modelling: A Guide for Social Scientists. Cambridge University Press, 2004.
Grambsch P. M., Therneau T. M. Proportional hazards tests and diagnostics based on weighted residuals. Biometrica. 81. 1994. P.515-526.
Green J. R., Shoven J. B. The effects of Interest Rates on Mortgage Payments// Journal of Money, Credit and Banking. 1986. Vol. 36(1). P.41-58.
Kalbfleisch J. D. and Prentice R. L. The Statistical Analysis of Failure Time Data. 2d ed. New York: John Wiley &; Sons. 2002.
Kang P., Zenios S. A. Complete Prepayment Models for Mortgage-Backed Securities // Management Science. 1992. Vol. 38(11). P.1665-1685.
Kaplan E. L., Meier P. Non-parametric Estimation from Incomplete Observations // Journal of American Statistical Association. 1958. Vol. 53. P.457-481.
Nelson W. Theory and Applications of Hazard Plotting for Censored Failure Data // Technometrics.1972. Vol. 14. P. 945-965.
Newson R. B. Comparing the predictive powers of survival models using Harrell's C or Somers' D // The Stata Journal. 2010. 10. Number 3, P. 339-358.
Scott F. R., Roll R. Prepayments on Fixed-rate Mortgage-backed Securities // Journal of Portfolio Management.1989. P.73-82.
Rodriguez G. Survival Models // Quantile №.5. 2008. P.1-27.
Sasieni P. D., Winnett A. Martingale Difference Residuals as a Diagnostic Tool for the Cox Model. Biometrica. Vol. 90. 2003. P. 899-912.
Schmidt P., Witte A. D. Predicting Criminal Recidivism Using "Split Population" Survival Time Models. NBER Working Paper No. 2445. 1987.
Schmidt P., Witte A. D. Predicting Criminal Recidivism Using Survival Models. N. Y.:Springer-Verlag, 1988.
Schoenfeld D. Partial Residuals for the proportional hazards regression model. Biometrica. 69. 1982. P.239-241.
Schwartz E. S., Torous W. N. Prepayment and the Valuation of Mortgage Backed Securities // Journal of Finance. 1989. Vol 44(2). P.375-392.
Stepanova M., Thomas L. C. PHAB Scores: Proportional Hazards Analysis Behavioural Scores //The Journal of the Operational Research Society. 2001. Vol. 52. 9. P. 1007-1016.
Thomas L. C. Consumer Credit Models: Pricing, Profit and Portfolios. Oxford University Press. 2009.
Приложение
Модели mover-stayer для исследования риска наступления дефолта.
//Mover-stayer model for log-normal survival function and logit - mover-class probability
Stset time_to_default, failure(censor_del)
Program drop movstay_lnormal
Program define movstay_lnormal
Args lnf xb za sigma
Tempvar p s d mu
Quietly gen double 'mu'='xb'
Quietly gen double 'd'=exp('za')/(1+exp('za'))
Quietly gen double 's'=1-'d'+'d'*(1-normal((ln($ML_y1)-'mu')/'sigma'))
Quietly gen double 'p'=ln('d')+lnnormalden((ln($ML_y1)-'mu')/'sigma')-ln('sigma'*$ML_y1)
Quietly replace 'lnf'=$ML_y2*('p')+(1-$ML_y2)*ln('s')
End
Ml model lf movstay_lnormal (duration: time_to_default = payed_sum1 payed_sum2 educ_level1 educ_level2 employm_1 employm_2 PTI_20 PTI_35 region_1 region_3 age_28 age_45 sex marital cobor_1 cobor_3 realty_flat realty_house rooms_1 rooms_3 LTV_50 LTV_70 term_120 term_180) (logit: censor_del = realty_house) /sigma if test==1
//ml model lf movstay_lnormal (duration: time_to_default = payed_sum1 payed_sum2 educ_level1 educ_level2 employm_1 employm_2 PTI_20 PTI_35 region_1 region_3 age_28 age_45 sex marital cobor_1 cobor_3 realty_flat realty_house rooms_1 rooms_3 LTV_50 LTV_70 term_120 term_180) (logit: censor_del = ) /sigma if test==1
Ml max
Est store movst_lognorm_1
//est store movst_lognorm_2
Estat ic
Est tab movst_lognorm_1 movst_lognorm_2, b(%7.4f) star
//Mover class probability calculation
Drop za prob
Predict za, eq(logit)
Gen prob=exp(za)/(1+exp(za))
Sum prob
// Cox-Snell Residuals calculation
Drop xb
Drop S
Drop H_na
Drop S_mover S
Predict xb, eq(duration)
Gen S_mover=1-normal((ln(time_to_default)-xb)/ 1.401899)
Gen S=prob*S_mover+(1-prob)
Gen H_na=-ln(S)
// Cox-Snell Residuals on teaching data
Drop H11
Stset H_na if test==1, fail(censor_del)
Sts gen H11=na
Line H11 H_na H_na if test==1, sort ytitle("") legend(cols(1))
// Cox-Snell Residuals on test data
Drop H11
Stset H_na if test==0, fail(censor_del)
Sts gen H11=na
Line H11 H_na H_na if test==0, sort ytitle("") legend(cols(1))
//Mover-stayer model for gamma survival function and logit - mover-class probability
Stset time_to_default, failure(censor_del)
Program drop movstay_gamma
Program define movstay_gamma
Args lnf xb za ln_sigma kappa
Tempvar p s d mu d sigma gamma z u surv
Quietly gen double 'mu'='xb'
Quietly gen double 'd'=exp('za')/(1+exp('za'))
Quietly gen double 'sigma'=exp('ln_sigma')
Quietly gen double 'gamma'=(abs('kappa'))^(-2)
Quietly gen double 'z'=sign('kappa')*((log($ML_y1)-'xb')/'sigma')
Quietly gen double 'u'='gamma'*exp(abs('kappa')*'z')
If 'kappa'>0 quietly gen double 'surv'=1-gammap('gamma','u')
Else if 'kappa'==0 quietly gen double 'surv'=1-normal('z')
Else if 'kappa'<0 quietly gen double 'surv'=gammap('gamma','u')
Quietly gen double 's'=1-'d'+'d'*'surv'
If 'kappa'==0 quietly gen double 'p'= ln('d')-ln('sigma'*$ML_y1)-0.5*ln(_pi*2)-0.5*'z'^2
Else quietly gen double 'p'= ln('d')+'gamma'*ln('gamma')+'z'*sqrt('gamma')-'u'-ln('sigma'*$ML_y1)-0.5*ln('gamma')-lngamma('gamma')
Quietly replace 'lnf'=$ML_y2*('p')+(1-$ML_y2)*ln('s')
End
//ml model lf movstay_gamma (duration: time_to_default = payed_sum1 payed_sum2 educ_level1 educ_level2 employm_1 employm_2 PTI_20 PTI_35 region_1 region_3 age_28 age_45 sex marital cobor_1 cobor_3 realty_flat realty_h rooms_1 rooms_3 LTV_50 LTV_70 term_120 term_180) (logit: censor_del = realty_house) /sigma /kappa if test==1 , technique(dfp)
Ml model lf movstay_gamma (duration: time_to_default = payed_sum1 payed_sum2 educ_level1 educ_level2 employm_1 employm_2 PTI_20 PTI_35 region_1 region_3 age_28 age_45 sex marital cobor_1 cobor_3 realty_flat realty_h rooms_1 rooms_3 LTV_50 LTV_70 term_120 term_180) (logit: censor_del = ) /sigma /kappa if test==1 , technique(dfp)
Ml max
Est store movst_gamma_1
Est store movst_gamma_2
Estat ic
Est tab movst_gamma_1 movst_gamma_2, b(%7.4f) star
Модели с ненаблюдаемым эффектом для исследования риска реализации залога.
//Fitting Weibull Distribution with Frailty Gamma
Stset time_to_fcl, failure (censor_realis)
Program drop WeibFrailty_llog
Program define WeibFrailty_llog
Args lnf xb p ln_theta
Tempvar ln_dens s l theta surv
Quietly gen double 'l'=exp('xb')
Quietly gen double 'theta'=exp('ln_theta')
Quietly gen double 'surv'=exp(-'l'*($ML_y1)^'p')
Quietly gen double 's'=(1-'theta'*ln('surv'))^(-1/'theta') //survival
Quietly gen double 'ln_dens'=(1+'theta')*ln('s')+ln('l')-'l'*($ML_y1)^'p'+ln('p')+('p'-1)*ln($ML_y1)-ln('surv')
Quietly replace 'lnf'=$ML_y2*('ln_dens')+(1-$ML_y2)*ln('s')
End
Ml model lf WeibFrailty_llog (duration: time_to_fcl = floor_num_9 mainborr_contr_07 educ_level1 live_tot_06 region_1 marital realty_house rooms_1 LTV_50 LTV_70 term_120 term_180)(censor: censor_realis= ) /theta if test==1, technique(dfp)
Ml max
Estat ic
//Fitting Lognormal Distribution with Frailty Gamma
Stset time_to_fcl, failure (censor_realis)
Program drop LogNormalFrailty_llog
Program define LogNormalFrailty_llog
Args lnf xb ln_sigma ln_theta
Tempvar p s l theta surv sigma
Quietly gen double 'l'=exp('xb')
Quietly gen double 'theta'=exp('ln_theta')
Quietly gen double 'sigma'=exp('ln_sigma')
Quietly gen double 'surv'=1-normal(ln('l'*$ML_y1)/'sigma')
Quietly gen double 's'=(1-'theta'*ln('surv'))^(-1/'theta') //survival
Quietly gen double 'p'=(1+'theta')*ln('s')+lnnormalden(ln('l'*$ML_y1)/'sigma')-ln('sigma'*$ML_y1)-ln('surv')
Quietly replace 'lnf'=$ML_y2*('p')+(1-$ML_y2)*ln('s')
End
Ml model lf LogNormalFrailty_llog (duration: time_to_fcl = floor_num_9 mainborr_contr_07 educ_level1 live_tot_06 region_1 marital realty_house rooms_1 LTV_50 LTV_70 term_120 term_180)(censor: censor_realis = ) /theta if test==1 //, technique(dfp)
Ml max
Estat ic
Похожие статьи
-
Риск наступления досрочного погашения. - Моделирование времени жизни ипотечного кредита
Для объяснения риска наступления досрочного погашения были отобраны 2 модели: Непараметрическая модель пропорциональных рисков Кокса, AFT модель (модель...
-
Введение - Моделирование времени жизни ипотечного кредита
Постановка задачи. Экономическое и практическое обоснование важности ее решения. Рассмотрим задачу моделирования денежных потоков по портфелю (пулу)...
-
Рассмотрим алгоритм создания эмпирической базы для моделирования на примере трехуровневой иерархии, на среднем уровне которой есть пять видов рисков...
-
Модель Бокса и Дженкинса Процедуры оценки параметров и прогнозирования, описанные в разделе Идентификация модели временных рядов, предполагают, что...
-
Оценка времени поездки на основе моделирования транспортных потоков
Оценка времени поездки на основе моделирования транспортных потоков С. Н.Козорезова Постоянное увеличение количества транспортных заторов на...
-
Нелинейные модели регрессии - Моделирование в эконометрике
Нелинейные модели регрессии и их линеаризация. 1. Типы нелинейных моделей: 2. Нелинейные модели линейные по объясняющим переменным и их линеаризация. 3....
-
Моделирование динамики рыночной системы
Введение В современных условиях динамичного развития рыночной системы экономика, испытывающая многочленные подъемы и спады, требует внешнего воздействия,...
-
Постоянство механизмов. Одно из условий, на которое опирается эконометрическое моделирование, состоит в том, что функциональное соотношение не меняется в...
-
Описание используемых методов - Моделирование вероятности банкротства
В данной работе было принято решение использовать логистический анализ с помощью пакета STATA, а также алгоритм CART с помощью SPSS Modeler. Бинарная...
-
Нефинансовые факторы, влияющие на вероятность банкротства - Моделирование вероятности банкротства
Как было отмечено выше, важность финансовых показателей для определения вероятности банкротства фирмы была замечена в самых ранних работах. Однако...
-
Оценим уравнение объема отгруженных инновационных товаров и услуг на основании данных, взятых из сборников Росстата "Россия. Статистический справочник" и...
-
В состав системы эконометрических уравнений входят множество зависимых или эндогенных переменных и множество предопределенных переменных (лаговые и...
-
Приведем данные среднегодовой численности занятого населения Год Тыс. чел. 1996 2301,3 1997 2341,4 1998 2329,8 1999 2351,6 2000 2367,8 2001 2372,3 2002...
-
Эконометрическое моделирование и прогнозирование объемов таможенных платежей в регионе деятельности Ростовской таможни В настоящее время для...
-
Моделирование тарифов Водоканала и РАО ЕЭС, Тарифы водоканала - Статистика ЖКХ
Тарифы водоканала Изучим динамику цен на услуги водоканала. Данные возьмем с сайта организации http://www. vodokanal. spb. ru. Показатель: условия...
-
Основные понятия теории экономико-математического моделирования Кибернетический подход к исследованию экономико-математических систем Обычно...
-
Моделирование теплопотребления шихты в зависимости от влажности и химического состава
Моделирование теплопотребления шихты в зависимости от влажности и химического состава Выполнен анализ теплопотребления шихты в зонах сушки и подогрева в...
-
Введение - Дескриптивный подход к моделированию коррупции как фактора социальной конфликтности
Настоящая работа является продолжением статьи [6], в которой рассматривались методологические аспекты математического моделирования коррупции и возможных...
-
Описание реальных отношений между экономическими объектами и производственными процессами наиболее рационально и в полной мере осуществляется с помощью...
-
В 1974г. группа аргентинских ученых во главе с профессором А. Эррерой получила предварительные результаты работы над латиноамериканской моделью...
-
Коэффициенты структурной модели могут быть оценены разными способами в зависимости от вида системы одновременных уравнений. Наибольшее распространение...
-
Суть, причины и последствия автокорреляции. - Моделирование в эконометрике
Одной из предпосылок регрессионного анализа является независимость случайного члена в любом наблюдении от его значений во всех других наблюдениях, т. е....
-
Фиктивные переменные во множественной регрессии - Моделирование в эконометрике
До сих пор в качестве факторов рассматривались экономические переменные, принимающие количественные значения в некотором интервале. Вместе с тем может...
-
Вычисляют выборочную дисперсию, характеризующую меру разброса опытных данных (x I ; Y I ) вокруг значений регрессии, то есть дисперсию остатков ....
-
Неопределенность - это фундаментальное свойство природы, а еще более (и точнее) - свойство, характеризующее неточность, незамкнутость, неокончательность,...
-
Математическое моделирование экономических явлений и процессов с целью оптимизации процессов управления - область научно-практической деятельности,...
-
Заключение - Моделирование вероятности банкротства
Целью данного исследования являлось моделирование вероятности банкротства российских нефинансовых компаний на основе наиболее значимых показателей...
-
На основе данных таблицы 1 приложения А построим предварительную регрессионную модель: Модель 1: МНК, использованы наблюдения 2005:01-2007:12 (T = 36)....
-
Примеры лаговых моделей в экономике - Экономическое моделирование временных рядов
Модель адаптивных ожиданий Моделью адаптивных ожиданий называется динамическая эконометрическая модель, которая учитывает предполагаемое (или желаемое)...
-
Моделирование рынка тепла - Расчетная модель оптимизации системы теплоснабжения региона
Энергосистема теплоснабжение конкуренция регион В нашей предыдущей работе [1] была разработана методология анализа конкуренции ТЭЦ и/или котельных, а...
-
Современные экономические теории и исследования опираются в значительной степени на использование математических моделей и методов анализа. Постоянно...
-
Информация - это все данные, являющиеся объектом сбора, хранения, обработки, передачи и преобразования. Землеустроительная информация - это особый вид...
-
По итогам проведенного исследования можно прийти к выводу о том, что и логит-регрессия и деревья решений позволили построить модели, которые с...
-
Построение модели с помощью логистической регрессии Прежде чем строить логистическую регрессию, необходимо выбрать конечный набор финансовых и...
-
Процесс экономико-математического моделирования - Экономико-математические методы
Этот процесс состоит из нескольких взаимосвязанных этапов. Разбиение на этапы и выделение на каждом этапе присущих ему процессов условно: на одном из...
-
Уже из приведенного примера видно, что "управлять" величинами изменения значимости тех или иных элементов иерархии достаточно проблематично вследствие ее...
-
Проблема прогнозирования вероятности банкротства существует уже несколько десятков лет - все началось с работ Ramser, Foster (1931), Fitzpatrick (1932) и...
-
Введение - Моделирование вероятности банкротства
В настоящее время в условиях экономической стагнации и ухудшения финансового состояния бизнеса тема кредитоспособности и оценки устойчивости предприятий...
-
Выводы - Использование нейродинамики для моделирования производственных процессов предприятия
Исходя из вышеизложенного, можно заключить, что для решения задач прогнозирования наиболее подходит сеть с обратным распространением. Она позволяет...
-
Пример успешного использования методов многошагового обучения для задачи управления производством. Рассмотрим простейший вариант, когда производится лишь...
Риск наступления дефолта. - Моделирование времени жизни ипотечного кредита