Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Губин Евгений Иванович. Методология подготовки больших данных для систем оценки кредитных рисков

Губин Евгений Иванович. Методология подготовки больших данных для систем оценки кредитных рисков

С 5 по 9 июля мы приглашаем вас принять участие в Летней школе по финансовым технологиям, организуемой Лабораторией финансовых технологий Инженерной школы информационных технологий и робототехники Томского политехнического университета (ИШИТР ТПУ). Программа мероприятия включает серию онлайн-лекций преподавателей ТПУ и приглашенных специалистов в сфере современных информационных финансовых технологий.

Чтобы не пропустить остальные трансляции, рекомендуем пройти регистрацию на сайте школы https://itr-tpu.timepad.ru/event/1629832/

---
Подписывайтесь на Exactpro в социальных сетях:

LinkedIn https://www.linkedin.com/company/exactpro-systems-llc
Twitter https://twitter.com/exactpro
Facebook https://www.facebook.com/exactpro/
Instagram https://www.instagram.com/exactpro/

Подписывайтесь на YouTube канал Exactpro http://www.youtube.com/c/ExactproVlog

5206c19df417b8876825b5561344c1a0?s=128

Exactpro
PRO

July 06, 2021
Tweet

Transcript

  1. 1 Применение аналитики SAS в области управления рисками для получения

    прибыли
  2. 2 Содержание 1. Составные части скоринга 2. Использование аналитических возможностей

    SAS 3. Проблематика кредитного скоринга 4. Процедура разработки скоринговой карты 5. Области применения скоринга 6. Математическая модель 7. Risk Based Pricing 8. Расчет долговой нагрузки на основании статистического анализа портфеля заемщиков 9. Статистическое правило установления границ зон 10. Учет филиальной специфики (региональные скоринговые карты) 11. Самонастраивающиеся скоринговые карты 12. Многомерные скоринговые карты 13. Behavior Scoring 14. Collection Scoring 15. Оптимизация досрочных погашений 16. Использование скоринга для кросс-продаж 17. Basel II 18. Стресс-тестирование
  3. 3 Банк ВТБ24 ЗАО 1. Уверенно входит в 10-ку ведущих

    банков 2. Более 500 точек продаж по России 3. Скоринговые решения запущены в 2006 году 4. В 2007 году запущен скоринг по ипотеке и малому бизнесу 5. Использует комплексный подход по анализу рисков, разработанный на основе продуктов SAS
  4. 4 Составные части скоринга Исходные данные Аналитическая система Отчетность и

    мониторинг On-line система Анкетные данные клиента Скоринг Поведенче ские данные клиента SAS Enterprise Miner 1.Достаточный объем данных – не менее 1000 «плохих» 2.Данные должны проходить предварительную «очистку» SAS Enterprise Guide SAS ETL Studio SAS Base SAS Credit Scoring IT Система, позволяющая в режиме реального времени рассчитывать вероятность платежеспособности (PD) и производные характеристики 1.Методология разработки скоринговых карт 2.Набор управленческих отчетов 3.Зафиксированный порядок действий по вводу в действие новой скоринговой карты SAS BI
  5. 5 Использование аналитических возможностей SAS SAS Enterprise Miner SAS Enterprise

    Guide SAS ETL Studio SAS Base SAS Credit Scoring SAS BIS CS Для целей кредитного скоринга используется 20-30% возможностей аналитических инструментов! SAS BI
  6. 6 Проблематика кредитного скоринга Исходя из определения, кредитный скоринг используется

    для прогноза успешного погашения кредита Согласно Guide to Credit Scoring 2000 кредитный скоринг измеряет статистическую вероятность того, что кредит будет успешно погашен. Кредитный скоринг фактически основывается на предположении, что возможно, используя статистические инструменты, предсказать будущее поведение заявителей на кредит с анкетными данными, аналогичными уже существующим
  7. 7 Процедура разработки скоринговой карты ? Что дальше ?

  8. 8 Области применения скоринга

  9. 9 Основой поведенческого скоринга является автоматизация процесса получения поведенческих характеристик

    клиента. Как результат – доходность по кредитному портфелю ! Области применения скоринга (behavior scoring)
  10. 10 Математическая модель В основе скоринга лежит логистическая регрессия. С

    помощью логистической регрессии можно оценивать вероятность того, что анализируемое событие наступит (возврат кредита/дефолт, досрочное погашение/плановое погашение, согласие клиента на маркетинговое предложение банка/отказ и т.д.). Пусть X 1 ,X 2 ,…,X N – исходные данные (например, анкетные данные клиента), Y-анализируемое событие (возврат кредита/дефолт, досрочное погашение/плановое погашение, согласие клиента на маркетинговое предложение банка/отказ и т.д.). Тогда уравнение регрессии выглядит следующим образом: где В, B 1 , …, B N – регрессионные коэффициенты (баллы скоринга). В случае, если наблюдаются временные возмущения характеристик (например сезонность), то уравнение регрессии можно сформулировать иначе: Вероятность появления события Y равна: Таким образом механизм скоринга можно использовать не только в кредитной процедуре для предсказания дефолта заемщика, но и предсказания любых других событий при анализе клиента, которые можно описать двоичной дихотомической переменной 0/1 – наличие признака/отсутствие признака. Для анализа скоринговых моделей используют ROC-кривые, которые показывают зависимость количества верно классифицированных положительных примеров от количества неверно классифицированных отрицательных примеров. При этом более качественная модель та, у которой площадь под кривой больше. Оценкой качества моделей служат ROC-индекс, коэффициент Gini, коэффициент Колмогорова-Смирнова и другие. Только комплексная оценка всех показателей и экспертное мнение аналитика могут дать оценку качеству скоринговой модели.
  11. 11 Примеры определения границ автоматического отсечения и одобрения 1.Расчет скоринговой

    карты и определение предиктивной способности модели •Gini=0.7 •ROC Index=0.72 •Kolmogorov-Smirnov Statistic=0.62 •Количество значимых переменных (значимость более 5%) – 18 На рисунках представлена зависимость количества (%) "плохих« заявок (Cumulative Event Rate – левая шкала) и общего количества одобренных заявок (Cumulative Approval Rate – правая шкала) от границы отсечения (Cutoff Score). •Черные прерывистые вертикальные/горизонтальные линии – определяют границу автоматического одобрения/ автоматического отсечения зон •Красная горизонтальная прямая – текущая граница автоматического одобрения (approval rate) •Синяя горизонтальная прямая – текущая граница автоматического отсечения (event rate) 2.Расчет скоринговой карты и определение предиктивной способности модели 3.Вынесение результатов на Комитет по рискам и утверждение параметров скоринговой модели Границы автоматического отказа и автоматического одобрения определяется на основании разумного компромисса между уровнем просроченной задолженности и количеством одобренных кредитных заявок
  12. 12 1.Сокращение числа сотрудников, принимающих решение 2.Снижение стоимости процесса 3.Увеличение

    скорости прохождения заявки белая зона черная зона серая зона Автоматическое одобрение Автоматический отказ Решение принимается экспертно риск - менеджером 15 – 25 % заявок Процедура принятия решения Информаци я о скоринге Информаци я о кредитной истории Информаци я о стоп- факторах Информаци я о лимите на ГСЗ Дополнител ьная информация из анкеты Матрицы компетенций и условий
  13. 13 Risk Based Pricing Basel II формулирует ожидаемые потери по

    кредитному договору в виде следующей формулы: Основные компоненты риска (risk components) включают следующие показатели: - вероятность дефолта (probability of default, PD) – далее P(X); - удельный вес убытков в случае дефолта (loss given default, LGD); - стоимость под риском дефолта (exposure at default, EAD). P(X) – это вероятность дефолта, рассчитанная на основании скорингового балла Кредитный риск, относящийся к ожидаемым потерям EL, компенсируется добавочной процентной ставкой s, которая в сумме с базовой ставкой r даёт реальную процентную ставку R = r + s. Используя определение LGD по Basel II, означающее, что величина 1 – EAD · LGD – это величина возмещения по ссуде, вышедшей на дефолт, строится следующая система: - без дефолта банк получает величину 1 + r + s - в случае дефолта банк получает (1 – EAD LGD)(1 + r + s) Величина s зависит от величин P(X), EAD, LGD и r путём следующего рассуждения: рисковая премия, относящаяся к неожидаемым потерям и образующаяся из безрисковой процентной ставки r, должна быть равна объёму прибыли в случае ожидаемых потерь EL: Решая это уравнение, можем определить процентную ставку по кредиту *Журнал «Управление финансовыми рисками» № 2 2008 г., «Модель расчета процентной ставки», Коновалихин Максим, Сергиенко Дмитрий, Кулик Вадим, Голицын Сергей Динамика изменения лимитов кредитования и аннуитетных платежей в зависимости от изменения процентной ставки Зависимость процентной ставки от скорингового балла
  14. 14 Расчет долговой нагрузки на основании статистического анализа портфеля заемщиков

    *Журнал «Управление финансовыми рисками» № 3 2007 г., «Модель расчета лимита кредитования», Коновалихин Максим, Сергиенко Дмитрий, Кулик Вадим
  15. 15 Динамика выдач Первые выходы на просрочку до 30 дней

    (FPD) В результате запуска статистических методов расчета лимитов при неизменном approval rate: •Вырос средний лимит (в среднем на 10 %) •В два раза снизилось количество отказов клиентов •За счет учета профиля риска клиентов снизились в два раза первые выходы на просрочку до 30 дней (FPD) Расчет долговой нагрузки на основании статистического анализа портфеля заемщиков
  16. 16 Статистическое правило установления границ зон Ожидаемая прибыль по кредиту

    равна процентному доходу для договоров без дефолта EP= (1-PD)* Rate *Dur Ожидаемый убыток при дефолте EL = PD * EAD * LGD Зоны отсечения и одобрения определяются знаком выражения PL = EP – EL . Однако величины рассчитаны статистически и фактически лежат в некотором интервале своего среднего значения. Правила установления зон могут быть сформулированы следующим образом: 1.Черная зона устанавливается для тех коридоров скорингового балла входной популяции, где верхняя граница ожидаемого дохода меньше нижней границы ожидаемых убытков. 2.Белая зона устанавливается для тех коридоров скорингового балла одобренной популяции, где нижняя граница ожидаемого дохода больше верхней границы ожидаемых убытков. 3. Границы «серой» зоны определялись диапазоном статистической погрешности определения ожидаемого дохода в разрезе интервалов скорингового балла
  17. 17 1. Исследуются параметры заемщиков, на основании которых целесообразно объединять

    филиалы в обобщенные группы (кластеры). 2. Поскольку задача состояла в группировке филиалов, использовались не абсолютные значения характеристик, а их индексы – отношение значения характеристики для филиала к медианному значению характеристики по всему набору филиалов. Созданы обобщенные характеристики – факторы – линейные комбинации составляющих их характеристик. Коэффициенты линейной комбинации выбраны процедурой факторного анализа так, чтобы наиболее полно отразить вариативность выборки с помощью одного фактора. 3. Группировка филиалов производилась на основе полученных значений Value и Risk для каждого филиала 4. Строится иерархия объектов (филиалов) по максимальной разнице евклидовых расстояний между объектами 5. Выделяются четыре группы – филиалы с низким уровнем риска – филиалы со средним уровнем риска – филиалы с высоким уровнем риска – Головной офис 6. В дальнейшем для каждого кластера рассчитаны отдельные скоринговые карты и набор коэффициентов для расчета лимита кредита. Проведенная группировка филиалов позволила учесть особенности локальных рынков, обеспечив лучшее соотношение Value/Risk Учет филиальной специфики (региональные скоринговые карты) Все заявки Принятые Плохие Среднемесячное количество заявлений * Доля одобренных заявлений * Средний BadRate * Среднее число дней просрочки * Средняя сумма просрочки * Средний размер кредита * * Средний срок кредита * * Средняя ставка по кредиту * * Средний подтвержденный доход *
  18. 18 Анкета на получение Кредита (владелец бизнеса) Финансовые показатели Анализ

    доходов и обязательств владельца бизнеса Анализ демографических данных владельца бизнеса Анализ информации из БКИ по владельцу бизнеса Анализ финансовых показателей предприятия Отраслевой анализ предприятия Анализ информации из БКИ по предприятию Консолидация данных Анализ владельца бизнеса (аналогично Consumer Loans) Анализ предприятия Скоринг в SME
  19. 19 Скоринг в SME Black Zone Gray Zone Gray Zone

    Gray Zone Gray Zone White Zone Gray Zone White Zone White Zone Параметры физического лица-владельца бизнеса Экономические параметры бизнеса Матричное принятие решения с двумя скоринговыми картами для субъектов малого бизнеса
  20. 20 Самонастраивающиеся скоринговые карты АБС On-line система Анкетные данные заемщика

    SAS Credit Scoring (аналитическая среда) Результаты скоринга Результаты скоринга Корректирующие воздействия θ В режиме квази-online (ежедневно) в аналитическую среду SAS Credit Scoring поступает информация о результатах оценки кредитоспособности заемщика (скоринге), а также информация о просроченной задолженности из АБС. В аналитической среде формируется корректирующий вектор θ, который вносит изменения в скоринговую карту для соответствия заранее установленным нормативам. Уравнение регрессии приобретает следующий вид: Вероятность появления события Y равна: Информация о просроченной задолженности Трудозатраты аналитика на корректировку скоринговой карты составляют 7-10 ч/дней, мониторинг 2 ч/часа ежедневно
  21. 21 Многомерные скоринговые карты позволяют сократить количество скоринговых карт, используемых

    в кредитных процедурах банка. Обычно в скоринговых картах используются одиночные характеристики анкеты, например: В многомерной скоринговой карте вместо одной характеристики используются несколько характеристик. Например, двухмерная скоринговая карта может иметь вид: В данную матрицу можно добавить третье измерение, например, продуктовый ряд. В данном случае будет использоваться единая скоринговая карта для всех продуктов и регионов. Уравнение регрессии принимает следующий вид в векторной форме: где X и Z – векторы характеристик скоринговой карты. Вероятность появления события Y равна: Основная проблема при разработки данной скоринговой карты – большое количество характеристик, которые могут использоваться и трудоемкость в разработке. Многомерные скоринговые карты Характеристика Балл Наличие телефона 10 Возраст 20-25 -3 Возраст 25-30 2 Возраст 30-50 7 Пол мужской 2 Пол женский 10 Характеристика\Регион Москва Московская обл. Тверская обл. Наличие телефона 10 5 7 Возраст 20-25 -3 -2 0 Возраст 25-30 2 3 2 Возраст 30-50 7 8 9 Пол мужской 2 1 3 Пол женский 10 9 8 Существует проблема достаточно большого количества скоринговых карт для разных регионов и продуктов
  22. 22 Behavior Scoring Behavior Scoring – скоринг, основанный на демографических

    и поведенческих характеристиках клиентов. Круг приложений Behavior Scoring достаточно широк и определяется целью применения данной скоринговой карты (например, анализ досрочного погашения/планового погашения, согласие клиента на маркетинговое предложение банка/отказ, определение категории качества клиента и т.д.). При этом результирующая характеристика должна иметь бинарное значение (0 - отсутствие признака, 1 – наличие признака). Пусть X 1 ,X 2 ,…,X N – исходные анкетные данные клиента, Z 1 ,X 2 ,…,Z M – поведенческие характеристики клиента, Y- анализируемое событие (возврат кредита/дефолт, досрочное погашение/плановое погашение, согласие клиента на маркетинговое предложение банка/отказ и т.д.). Тогда уравнение регрессии выглядит следующим образом: где В, B i , B j – регрессионные коэффициенты (баллы скоринга). Вероятность появления события Y равна: Поведенческий скоринг можно использовать не только как инструмент контроля рисков, а как инструмент, позволяющий получить максимальную доходность от определенных групп клиентов.
  23. 23 Application scoring используется при выдаче клиенту новых кредитов. При

    этом учитываются демографические клиента, указанные в анкете, такие как пол, возраст, информация связанная с занятостью, доход и т.д. Весь возможный интервал значений разбивается на три зоны принятия решений – черная, серая и белая (отказ, анализ кредитной заявки риск-менеджером и автоматическое одобрение). Collection Scoring использует кроме демографических характеристик клиента еще и поведенческие характеристики (своевременность платежей, количество кредитов, срок до окончания кредита, отношение просроченной задолженности к общей сумме кредита и т.д.). При этом Collection Scoring может использоваться специалистами Collection для выработки стратегий работы с должником. Например, если должник имеет низкий скоринговый балл, имеет просрочку 10 дней и по ему не могут дозвониться по домашнему телефону, то скорее всего логично было бы отправить должника сразу на Hard Collection, минуя Soft Collection, экономя при этом операционные ресурсы. С другой стороны, например, если должник имеет высокий скоринговый балл, и имеет незначительную просроченную задолженность, то стратегия работы с данным должником может строиться на основе ожидания очередного платежа и такие должники имеют самый низкий приоритет в группе Call Monitoring. Второе приложение Collection Scoring –реструктуризация просроченной задолженности. Например, клиент может иметь высокий скоринговый балл, иметь просроченную задолженность и погашать кредит частичными платежами. Это может говорить о том, что клиент добросовестный и испытывает финансовые трудности, возможно связанные с временной потерей трудоспособности (болезнь), и в связи с недостатком средств не имеющем возможности войти в график платежей. Как вариант данному клиенту можно реструктурировать долг на больший срок с меньшим аннуитетным платежом. Black Zone Gray Zone Gray Zone Collection Scoring
  24. 24 Оптимизация досрочных погашений Определим анализируемое событие Y как факт

    досрочного погашения клиентом кредита. В данном случае банк имеет недополученную прибыль. Могут быть различные причины, которые привели к досрочному погашению – высокий социальный статус клиента, наличие высокого дохода, низкий запрошенный кредитный лимит или низкий рассчитанный кредитный лимит, наличие частичных досрочных погашений и т.д. Степень влияния данных характеристик на общую результирующую переменную Y можно определить с помощью скоринговой модели. Рассчитав скоринговый балл, банк может увидеть, что вероятность досрочного погашения данным клиентом достаточно велика. В этом случае можно предпринять стратегические меры, позволяющие снизить риск недополучения прибыли – например, заранее предложить клиенту новый кредит на более льготных условиях или предложить клиенту разместить свободные средства в льготный депозитный вклад. При этом полученный скоринговый балл может дополнительно использоваться для расчета суммы нового кредита. Таким образом скоринг выступает инструментом получения дополнительной прибыли и снижения уровня досрочных погашений. Основная сложность, возникающая при разработки модели по погашениям – наличие постоянного временного тренда, который свидетельствует об увеличении части досрочных погашений в более старших поколениях. Стандартная скоринговая модель разрабатывается на основании данных в «созревших» поколениях, т.е. тогда, когда в анализируемом поколении доля просроченной задолженности стабильна. В случае с досрочными погашениями в модель добавляется зависимость от времени жизни поколения.
  25. 25 Использование скоринга для кросс-продаж Основная цель кросс-продаж (cross-selling) –

    получение дополнительной прибыли за счет предложения клиенту новых банковских услуг. Примеры использования скоринга: - определение качества клиента, чтобы предлагать качественному клиенту дополнительные услуги; - более точное определение сегмента клиентов, которые дали отклик на предложение дополнительных услуг. 1.Определение качества клиента В данном случае определяется некоторый интегральный показатель «Качественный клиент», в который могут входить несколько характеристик – платежеспособность, доход, обязательства, качество обслуживания долга. На основании данного показателя строится скоринговая модель, которая определяет тот сегмент клиентов, который максимально подходит для получения некоторой дополнительной банковской услуги. При этом строится продуктовая матрица, где по оси X идут банковские продукты, по оси Y – ФИО клиентов. На пересечении X-Y ставится скоринговый балл. Исходя из данной матрицы можно определить , какой банковский продукт наиболее оптимален для клиента. 2.Определение сегмента клиентов, давших отклик на продукт Некоторой группе клиентов предложили новый банковский продукт, например, отослали по почте кредитную карту. Из этой группы клиентов часть воспользовалась данной картой. Остальные клиенты отказались. С помощью скоринга можно максимизировать прибыль банка, рассчитав вероятность того, что клиент воспользуется банковской услугой. При этом клиентам с низкой вероятностью отклика в дальнейшем не рассылается предложение на банковский продукт.
  26. 26 Стресс-тестирование Для стресс-тестирования портфеля розничных продуктов на основании статистических

    данных была разработана модель, позволяющая оценить изменения объема портфеля и уровня просроченной задолженности 90+. Основными параметрами, задействованными в модели являются средний скоринговый балл по портфелю (рейтинг заемщиков), среднее отношение платеж по кредиту/доход и вероятность реализации залога, которая в свою очередь рассчитывается, как функция отношения платеж по кредиту/доход (к примеру, характер изменения этой величины в ипотечном портфеле оценивался по аналогии с изменением величины LTV во время ипотечного кризиса в США). В расчетах использовался «мягкий» сценарий стресс-тестирования: при понижении уровня доходов населения, связанным с ростом инфляции предполагалось, что качество заёмщиков остается неизменным. Таким образом, в расчетах по стресс-тестированию, проведенным в начале 2008г. рассматривалось 10% ухудшение доходов населения. Кризисные явления на финансовом рынке РФ позволяют сделать предположение о более сильном влиянии инфляции на доходы населения. Основываясь на предположении о 25% падении доходов, был произведен расчет, основанный на данных на 01.07.2008. Модель
  27. 27 Basel II Внедрение продвинутого (AIRB) подхода снижает требования к

    капиталу* *Экспертные данные, опубликованные в иностранной прессе
  28. 28 Некоторые наработки могут быть доступными в виде расширения стандартной

    функциональности базового ПО Определ ение Лимита на базе PD Оптимал ьное Определ ение Границ серой Зоны на базе PD Данные PD- модель Определ ение Процентн ой Ставки на базе PD
  29. 29 Процедура разработки скоринговой карты (дополнительно) Risk Based Pricing Расчет

    лимита кредитования Зоны принятия решений
  30. 30 Спасибо за внимание!