Риск наступления дефолта. - Моделирование времени жизни ипотечного кредита

Для объяснения риска наступления дефолта была протестирована непараметрическая регрессия пропорциональных рисков Кокса. Она не обеспечила желаемую подгонку к данным, поскольку в данных была выявлена ненаблюдаемая, то есть не описываемая объясняющими переменными, разнородность. Ввиду того, что риски в модели не пропорциональны, для целей исследования были отобраны следующие параметрические спецификации:

AFT модель (модель ускоренного времени) обобщенной гамма регрессии,

Логнормальная модель с ненаблюдаемым эффектом, имеющим гамма распределение.

Обе модели обеспечивают очень хорошую подгонку к данным, однако с точки зрения визуального анализа остатков Кокса-Снелла гамма регрессия чуть точнее объясняет на правом хвосте. Параметрический анализ на основании значения критерия Акаике рекомендует сделать выбор в пользу гамма регрессии, однако сравнение моделей по прогнозной силе показывает, что логнормальная модель с ненаблюдаемым эффектом чуть точнее прогнозирует вне выборки (на тестовой части данных).

Поскольку в данных был выявлен ненаблюдаемый эффект, также были протестированы различные модели разделенной совокупности mover-stayer, причем коды для их оценивания были написаны вручную ввиду их отсутствия в пакете Stata. Чтобы улучшить качество подгонки, обеспечиваемое гамма регрессией и логнормальной регрессией с ненаблюдаемым эффектом, в первую очередь, на правом хвосте, были построены модели, в которых для описания длительности состояния в классе mover использовались те же распределения - гамма функция и логнормальная функция. При этом вероятность принадлежности к классу mover описывалась с помощью logit модели.

В результате мы пришли к выводу, что более сложные модели типа mover-stayer не приводят к заметному улучшению качества подгонки, обеспечиваемому гамма регрессией и логнормальной регрессией с ненаблюдаемым эффектом. Можно только отметить, что модель mover-stayer, в которой длительность состояния в классе кочевых описывается логнормальной регрессией чуть улучшает качество подгонки на правом хвосте по сравнению с логнормальной моделью с ненаблюдаемым эффектом.

Отметим некоторые наиболее существенные зависимости, выявленные в результате оценивания гамма регрессии. Дефолт по кредиту наступает раньше,

Если тип предмета ипотеки под залогом - дом или таунхаус,

Чем выше доля заемных средств в стоимости жилья,

Если предмет ипотеки находится в недостаточно развитом регионе,

И позже, если

Если основной заемщик имеет высшее образование,

Если предмет ипотеки представляет собой однокомнатное жилье.

В качестве дальнейшего исследования факторов, влияющих на риск наступления дефолта, было бы интересно включение в модель рыночного фактора - изменение рыночных цен на залоговый актив, то есть динамического показателя (LTV)t. Для включения данного показателя в модель необходим периодический мониторинг рыночных цен жилья на основании данных риэлторских агентств.

Исследование времени до реализации залога.

Для целей исследования отобраны следующие модели:

Непараметрическая модель пропорциональных рисков Кокса,

Параметрическая модель Вейбулла с ненаблюдаемым эффектом.

Параметрическая логнормальная регрессия с ненаблюдаемым эффектом.

С точки зрения анализа остатков Кокса-Снелла, все три модели демонстрируют очень точную подгонку к данным. Параметрические модели практически неотличимы друг от друга, что подтверждает визуальный анализ и практически совпадающие значения AIC.

Если сравнивать модели по прогнозной силе, то регрессия Кокса точнее прогнозирует вне выборки (на тестовой части данных), чем регрессия Вейбулла с ненаблюдаемым эффектом, хотя не очень значительно.

Также на данных были протестированы модели mover-stayer, в которых длительность состояния в классе кочевых описывается логнормальной функцией. В результате получены оценки, очень схожие по характеру приближения данных с предыдущими моделями. Таким образом, усложнение моделей не приводит к заметному улучшению качества подгонки.

Отметим, что наиболее сильно на время до реализации залога влияет показатель LTV, а также нахождение предмета ипотеки в развитом регионе. При прочих равных характеристиках при увеличении доли заемных средств в стоимости жилья (на момент выдачи кредита) время до реализации залога с момента дефолта кредита уменьшается. Нахождение предмета ипотеки в развитом регионе увеличивает время до реализации залога при прочих равных характеристиках по сравнению с остальными регионами.

В качестве дальнейшего исследования факторов, влияющих на время до реализации залога, было бы интересно включение в модель рыночного фактора - изменение рыночных цен на залоговый актив, то есть динамического показателя (LTV)t.

Итак, отдельным направлением по развитию и расширению задач, связанных с описанием временной структуры рисков (досрочного погашения, дефолта и реализации залога) в денежных потоках по розничным кредитам, является внедрение рыночных факторов, а также совместная их оценка с индивидуальными характеристиками кредита и связанного с ним актива. Примерами таких рыночных факторов помимо рассмотренных выше эффектов рыночной ставки и динамики рыночных цен на залоговый актив, могут также выступать рыночные факторы, влияющие на входящий поток денежных средств, используемых клиентом (заемщиком) для облуживания кредита, как например уровень безработицы, рост инфляции и др.

Также интересным направлением для работы представляется исследование опционной модели рисков на данных российского рынка ипотеки, то есть учет рисков наступления досрочного погашения и дефолта в одной модели.

Библиография

Айвазян С. А., Мхитарян В. С. Прикладная статистика и основы эконометрики // М.: ЮНИТИ.1998.

Гнеденко Б. В., Беляев Ю. К., Соловьев А. Д. Математические методы в теории надежности. М.: Наука, 1965.

Ратникова Т. А., Фурманов К. К. Анализ панельных данных и данных о длительности состояния. Издательский дом Высшей школы экономики. 2014.

РИАРЭЙТИНГ Рейтинговое Агентство Рейтинг социально-экономического положения субъектов РФ. Итоги 2013 года. http://www. riarating. ru/

Aalen O. O. Nonparametric Inference for a Family of Counting Processes // Annals of Statistics.1978. Vol. 6. P. 701-726.

Asay M., Guillaume F. H., Mattu R. K. Duration and Convexity of Mortgage Backed Securities: Some Hedging Implications from a Prepayment Linked Present Value Model. In Mortgage Backed securities, edited by Frank Fabozzi. Chicago: Probus Publishing. 1987.

Breslow N. E. Covariance Analysis of Censored Survival Data. Biometrics. 1974. Vol. 30. P.89-99.

Chinloy P. The Option Structure of a Mortgage Contract// Journal of Housing Research. 1991. Vol. 2(1). P.21-38.

Cox D. R. Regression Models and Life-Tables // Journal of the Royal Statistical Society. Ser. B. 1972. Vol. 34. P.187-220.

Cox D. R., Oakes D. Analysis of Survival Data // London: Chapman and Hall. 1984.

Cleves M. A., Gould W. W., Gutierrez R. G. An Introduction to Survival Analysis Using Stata. Revised Edition. Stata Press, 2004.

Demyanyk Y., Hemert O. V. Understanding the Subprime Mortgage Crisis // The Review of Financial Studies. 2011. Vol. 24. 6. P. 1848-1880.

Deng Y., Quigley J. M., van Order R. Mortgage Terminations, Heterogeneity and the Exercise of Mortgage Options // Econometrica. 2000. Vol. 68. 2. P. 275-307.

Davidson A., Sanders A., Wolff L-L., Ching A. Securitization. Structuring and Investment Analysis. John Wiley @ Sons, Inc. Hoboken. New Jersey. 2003.

Box-Steffensmeier J. M., Jones B. S. Event History Modelling: A Guide for Social Scientists. Cambridge University Press, 2004.

Grambsch P. M., Therneau T. M. Proportional hazards tests and diagnostics based on weighted residuals. Biometrica. 81. 1994. P.515-526.

Green J. R., Shoven J. B. The effects of Interest Rates on Mortgage Payments// Journal of Money, Credit and Banking. 1986. Vol. 36(1). P.41-58.

Kalbfleisch J. D. and Prentice R. L. The Statistical Analysis of Failure Time Data. 2d ed. New York: John Wiley &; Sons. 2002.

Kang P., Zenios S. A. Complete Prepayment Models for Mortgage-Backed Securities // Management Science. 1992. Vol. 38(11). P.1665-1685.

Kaplan E. L., Meier P. Non-parametric Estimation from Incomplete Observations // Journal of American Statistical Association. 1958. Vol. 53. P.457-481.

Nelson W. Theory and Applications of Hazard Plotting for Censored Failure Data // Technometrics.1972. Vol. 14. P. 945-965.

Newson R. B. Comparing the predictive powers of survival models using Harrell's C or Somers' D // The Stata Journal. 2010. 10. Number 3, P. 339-358.

Scott F. R., Roll R. Prepayments on Fixed-rate Mortgage-backed Securities // Journal of Portfolio Management.1989. P.73-82.

Rodriguez G. Survival Models // Quantile №.5. 2008. P.1-27.

Sasieni P. D., Winnett A. Martingale Difference Residuals as a Diagnostic Tool for the Cox Model. Biometrica. Vol. 90. 2003. P. 899-912.

Schmidt P., Witte A. D. Predicting Criminal Recidivism Using "Split Population" Survival Time Models. NBER Working Paper No. 2445. 1987.

Schmidt P., Witte A. D. Predicting Criminal Recidivism Using Survival Models. N. Y.:Springer-Verlag, 1988.

Schoenfeld D. Partial Residuals for the proportional hazards regression model. Biometrica. 69. 1982. P.239-241.

Schwartz E. S., Torous W. N. Prepayment and the Valuation of Mortgage Backed Securities // Journal of Finance. 1989. Vol 44(2). P.375-392.

Stepanova M., Thomas L. C. PHAB Scores: Proportional Hazards Analysis Behavioural Scores //The Journal of the Operational Research Society. 2001. Vol. 52. 9. P. 1007-1016.

Thomas L. C. Consumer Credit Models: Pricing, Profit and Portfolios. Oxford University Press. 2009.

Приложение

Модели mover-stayer для исследования риска наступления дефолта.

//Mover-stayer model for log-normal survival function and logit - mover-class probability

Stset time_to_default, failure(censor_del)

Program drop movstay_lnormal

Program define movstay_lnormal

Args lnf xb za sigma

Tempvar p s d mu

Quietly gen double 'mu'='xb'

Quietly gen double 'd'=exp('za')/(1+exp('za'))

Quietly gen double 's'=1-'d'+'d'*(1-normal((ln($ML_y1)-'mu')/'sigma'))

Quietly gen double 'p'=ln('d')+lnnormalden((ln($ML_y1)-'mu')/'sigma')-ln('sigma'*$ML_y1)

Quietly replace 'lnf'=$ML_y2*('p')+(1-$ML_y2)*ln('s')

End

Ml model lf movstay_lnormal (duration: time_to_default = payed_sum1 payed_sum2 educ_level1 educ_level2 employm_1 employm_2 PTI_20 PTI_35 region_1 region_3 age_28 age_45 sex marital cobor_1 cobor_3 realty_flat realty_house rooms_1 rooms_3 LTV_50 LTV_70 term_120 term_180) (logit: censor_del = realty_house) /sigma if test==1

//ml model lf movstay_lnormal (duration: time_to_default = payed_sum1 payed_sum2 educ_level1 educ_level2 employm_1 employm_2 PTI_20 PTI_35 region_1 region_3 age_28 age_45 sex marital cobor_1 cobor_3 realty_flat realty_house rooms_1 rooms_3 LTV_50 LTV_70 term_120 term_180) (logit: censor_del = ) /sigma if test==1

Ml max

Est store movst_lognorm_1

//est store movst_lognorm_2

Estat ic

Est tab movst_lognorm_1 movst_lognorm_2, b(%7.4f) star

//Mover class probability calculation

Drop za prob

Predict za, eq(logit)

Gen prob=exp(za)/(1+exp(za))

Sum prob

// Cox-Snell Residuals calculation

Drop xb

Drop S

Drop H_na

Drop S_mover S

Predict xb, eq(duration)

Gen S_mover=1-normal((ln(time_to_default)-xb)/ 1.401899)

Gen S=prob*S_mover+(1-prob)

Gen H_na=-ln(S)

// Cox-Snell Residuals on teaching data

Drop H11

Stset H_na if test==1, fail(censor_del)

Sts gen H11=na

Line H11 H_na H_na if test==1, sort ytitle("") legend(cols(1))

// Cox-Snell Residuals on test data

Drop H11

Stset H_na if test==0, fail(censor_del)

Sts gen H11=na

Line H11 H_na H_na if test==0, sort ytitle("") legend(cols(1))

//Mover-stayer model for gamma survival function and logit - mover-class probability

Stset time_to_default, failure(censor_del)

Program drop movstay_gamma

Program define movstay_gamma

Args lnf xb za ln_sigma kappa

Tempvar p s d mu d sigma gamma z u surv

Quietly gen double 'mu'='xb'

Quietly gen double 'd'=exp('za')/(1+exp('za'))

Quietly gen double 'sigma'=exp('ln_sigma')

Quietly gen double 'gamma'=(abs('kappa'))^(-2)

Quietly gen double 'z'=sign('kappa')*((log($ML_y1)-'xb')/'sigma')

Quietly gen double 'u'='gamma'*exp(abs('kappa')*'z')

If 'kappa'>0 quietly gen double 'surv'=1-gammap('gamma','u')

Else if 'kappa'==0 quietly gen double 'surv'=1-normal('z')

Else if 'kappa'<0 quietly gen double 'surv'=gammap('gamma','u')

Quietly gen double 's'=1-'d'+'d'*'surv'

If 'kappa'==0 quietly gen double 'p'= ln('d')-ln('sigma'*$ML_y1)-0.5*ln(_pi*2)-0.5*'z'^2

Else quietly gen double 'p'= ln('d')+'gamma'*ln('gamma')+'z'*sqrt('gamma')-'u'-ln('sigma'*$ML_y1)-0.5*ln('gamma')-lngamma('gamma')

Quietly replace 'lnf'=$ML_y2*('p')+(1-$ML_y2)*ln('s')

End

//ml model lf movstay_gamma (duration: time_to_default = payed_sum1 payed_sum2 educ_level1 educ_level2 employm_1 employm_2 PTI_20 PTI_35 region_1 region_3 age_28 age_45 sex marital cobor_1 cobor_3 realty_flat realty_h rooms_1 rooms_3 LTV_50 LTV_70 term_120 term_180) (logit: censor_del = realty_house) /sigma /kappa if test==1 , technique(dfp)

Ml model lf movstay_gamma (duration: time_to_default = payed_sum1 payed_sum2 educ_level1 educ_level2 employm_1 employm_2 PTI_20 PTI_35 region_1 region_3 age_28 age_45 sex marital cobor_1 cobor_3 realty_flat realty_h rooms_1 rooms_3 LTV_50 LTV_70 term_120 term_180) (logit: censor_del = ) /sigma /kappa if test==1 , technique(dfp)

Ml max

Est store movst_gamma_1

Est store movst_gamma_2

Estat ic

Est tab movst_gamma_1 movst_gamma_2, b(%7.4f) star

Модели с ненаблюдаемым эффектом для исследования риска реализации залога.

//Fitting Weibull Distribution with Frailty Gamma

Stset time_to_fcl, failure (censor_realis)

Program drop WeibFrailty_llog

Program define WeibFrailty_llog

Args lnf xb p ln_theta

Tempvar ln_dens s l theta surv

Quietly gen double 'l'=exp('xb')

Quietly gen double 'theta'=exp('ln_theta')

Quietly gen double 'surv'=exp(-'l'*($ML_y1)^'p')

Quietly gen double 's'=(1-'theta'*ln('surv'))^(-1/'theta') //survival

Quietly gen double 'ln_dens'=(1+'theta')*ln('s')+ln('l')-'l'*($ML_y1)^'p'+ln('p')+('p'-1)*ln($ML_y1)-ln('surv')

Quietly replace 'lnf'=$ML_y2*('ln_dens')+(1-$ML_y2)*ln('s')

End

Ml model lf WeibFrailty_llog (duration: time_to_fcl = floor_num_9 mainborr_contr_07 educ_level1 live_tot_06 region_1 marital realty_house rooms_1 LTV_50 LTV_70 term_120 term_180)(censor: censor_realis= ) /theta if test==1, technique(dfp)

Ml max

Estat ic

//Fitting Lognormal Distribution with Frailty Gamma

Stset time_to_fcl, failure (censor_realis)

Program drop LogNormalFrailty_llog

Program define LogNormalFrailty_llog

Args lnf xb ln_sigma ln_theta

Tempvar p s l theta surv sigma

Quietly gen double 'l'=exp('xb')

Quietly gen double 'theta'=exp('ln_theta')

Quietly gen double 'sigma'=exp('ln_sigma')

Quietly gen double 'surv'=1-normal(ln('l'*$ML_y1)/'sigma')

Quietly gen double 's'=(1-'theta'*ln('surv'))^(-1/'theta') //survival

Quietly gen double 'p'=(1+'theta')*ln('s')+lnnormalden(ln('l'*$ML_y1)/'sigma')-ln('sigma'*$ML_y1)-ln('surv')

Quietly replace 'lnf'=$ML_y2*('p')+(1-$ML_y2)*ln('s')

End

Ml model lf LogNormalFrailty_llog (duration: time_to_fcl = floor_num_9 mainborr_contr_07 educ_level1 live_tot_06 region_1 marital realty_house rooms_1 LTV_50 LTV_70 term_120 term_180)(censor: censor_realis = ) /theta if test==1 //, technique(dfp)

Ml max

Estat ic

Похожие статьи




Риск наступления дефолта. - Моделирование времени жизни ипотечного кредита

Предыдущая | Следующая