Modely hodnotenia bonity klienta
Čo je bonita a prečo ju modelovať
Bonita klienta predstavuje pravdepodobnosť, že klient splní svoje finančné záväzky v plnom rozsahu a včas. Hodnotenie bonity je jadrom riadenia úverového rizika a ovplyvňuje celý úverový cyklus: predschválenie, pricing, limity, kolaterály, monitoring, vymáhanie aj kapitálové požiadavky. Moderné bankovníctvo využíva spektrum modelov – od expertne nastavených skóre kariet až po strojové učenie – s cieľom odhadnúť pravdepodobnosť zlyhania (PD), očakávanú stratu (EL = PD × LGD × EAD), stratu pri zlyhaní (LGD) a expozíciu pri zlyhaní (EAD). Výsledkom je kvantifikácia rizika, ktorá sa následne transformuje do obchodných rozhodnutí a kapitálovej primeranosti.
Typy modelov podľa miesta použitia v úverovom cykle
- Application scoring – hodnotí nových žiadateľov pri vstupe (onboarding). Využíva demografiu, príjem, zamestnanie, úverovú históriu a údaje z registrov.
- Behavioral scoring – priebežné hodnotenie existujúcich klientov na základe platobného správania, salda, využitia limitov, zmien v príjme a transakčných vzorov.
- Collection/Recovery scoring – riadi stratégie vymáhania (časovanie kontaktov, ponuky splátkových kalendárov) podľa pravdepodobnosti návratu do plnej platobnej disciplíny.
- SME/Corporate rating – ratingové modely pre malé, stredné a korporátne podniky; kombinujú finančné ukazovatele, kvalitatívne faktory a odvetvové riziko.
- LGD a EAD modely – odhadujú mieru straty a expozíciu v čase zlyhania; kľúčové pre kapitál a IFRS 9 očakávané kreditné straty (ECL).
Expertno-pravidlové prístupy a skórovacie karty
Historicky prvé boli expertné pravidlá (cut-offy na príjem, DTI, vek, typ zamestnania) a skórovacie karty s bodovaním atribútov. Karty sa často vytvárajú cez monotónne binningy premenných, Weight of Evidence (WoE) transformáciu a Information Value (IV) na výber prediktorov. Výhody: transparentnosť, jednoduché nasadenie a vysvetliteľnosť. Nevýhody: obmedzená nelineárnosť a interakcie, nižší výkon na komplexných dátach.
Štatistické modely: logistická regresia a jej rozšírenia
Logistická regresia je priemyselným štandardom pre PD v retaili: ponúka interpretovateľné koeficienty, dobre sa kalibruje a pracuje s WoE transformáciami. Rozšírenia zahŕňajú regularizáciu (L1/L2) na prevenciu preučenia, splajny pre nelinearity a interakčné členy pre kľúčové kombinácie. Kalibrácia sa vykonáva pomocou Platt scaling alebo isotonic regression na zosúladenie odhadov s empirickými PD.
Strojové učenie: stromy, ansámble a neurónové siete
- Rozhodovacie stromy – prirodzene modelujú nelinearity; samostatne však často preučujú.
- Random Forest – znižuje varianciu baggingom, robustný voči outlierom, no menej interpretovateľný.
- Gradient Boosting (XGBoost, LightGBM, CatBoost) – štandard pre vysoký prediktívny výkon; výborne pracuje s heterogénnymi znakmi.
- Support Vector Machines – účinné na vysoko-dimenzionálne dáta; horšie sa kalibrujú a vysvetľujú.
- Neurónové siete – využiteľné pri veľkých transakčných dátach, sekvenčných vzoroch a alternatívnych zdrojoch (open banking, telco); vyžadujú dôkladnú kalibráciu a vysvetliteľnosť.
Štrukturálne a kombinačné modely bonity podnikov
- Pomerové modely (napr. logika Altman Z-score, Ohlson O-score) – využívajú likviditu, zadlženosť, rentabilitu a aktivitu; poskytujú rýchlu orientáciu.
- Štrukturálne modely (Merton/KMV) – odvodzujú PD z trhovej hodnoty aktív a volatility; vhodné pre obchodované firmy.
- Kombinované ratingy – spájajú finančné pomery, kvalitatívne faktory (riadenie, odvetvie, postavenie na trhu) a externé signály (register, platobná disciplína).
Point-in-Time (PIT) vs. Through-the-Cycle (TTC) PD
PIT PD reflektujú aktuálne makro podmienky a okamžité riziko – používajú sa v IFRS 9 pre ECL a v operatívnom risk pricingu. TTC PD vyhladzujú cyklus a slúžia pre kapitálové modely a limity. Často sa zavádza makroekonomický overlay pre PIT a mapovanie medzi PIT a TTC cez cyklické faktory.
Dáta: zdroje, kvalita a inžinierstvo príznakov
- Interné dáta – žiadosti, splácanie, transakcie, správanie kanálov, interakcie so zákazníckym servisom.
- Externé registre – bankové a nebankové úverové registre, obchodný register, insolvenčné registre, daňové dáta (ak sú legálne dostupné).
- Open Banking a alternatívne dáta – agregácia účtov, účel platieb, vzory príjmov, variabilita cash flow, device/behaviorálne signály.
- Feature engineering – stabilné agregáty (percentily, rolling priemery), trendové indikátory, utilization ratios, volatility, seasonality, peer group deltas.
- Kvalita dát – chýbajúce hodnoty, konzistencia, duplicitnosť, oneskorenia; metriky ako data completeness a anomaly rate.
Výber vzorky a problém odmietnutých žiadostí (reject inference)
Modely trénované len na prijatých klientoch trpia selection biasom. Reject inference koriguje odhad PD odmietnutých žiadostí. Prístupy: augmentation (pripísanie fiktívnych labelov podľa podobnosti), parceling (redistribúcia defaultu v skupinách), two-model approach (model prijatia × model defaultu), prípadne propensity score weighting. Kľúčové je robiť stability checks a citlivostné analýzy.
Modelové metriky: diskriminácia, kalibrácia a stabilita
- Diskriminačná sila – ROC AUC, Gini (2×AUC−1), KS štatistika.
- Kalibrácia – Brier score, Hosmer–Lemeshow, reliabilitné krivky, expected vs. observed PD v deciloch.
- Stabilita – PSI (Population Stability Index), CSI (Characteristic Stability Index), drift príznakov.
- Klasifikačné prahy – optimalizácia podľa cost matrix (cena falošných pozitív/negatív), expected loss alebo obchodných cieľov (schvaľovanosť, NPL).
IFRS 9 a očakávané kreditné straty (ECL)
IFRS 9 zavádza Stage 1–3 podľa významného zvýšenia kreditného rizika (SICR). Pre Stage 1 sa počíta 12-mesačná ECL, pre Stage 2 a 3 doživotná ECL. Modely PIT PD sú projektované dopredu pomocou makro scenárov (baseline, adverse, severe) s pravdepodobnostnými váhami; LGD má downturn a workout pohľad (cash flow z vymáhania, diskont). EAD zahŕňa kreditné konverzné faktory (CCF) pre limity a kontokorenty.
Basel/CRR rámec a kapitálové modely
V režime IRB banky odhadujú vlastné PD, LGD, EAD a M (maturita) pre výpočet kapitálových požiadaviek. Požiadavky zahŕňajú downturn LGD, margin of conservatism, low default portfolio (LDP) techniky (Bayes, pooling, expert judgement) a use test – preukázanie využitia modelov v praxi (limity, pricing, rozhodovanie).
Fairness, GDPR a vysvetliteľnosť
Automatizované rozhodovanie musí rešpektovať GDPR (transparentnosť, minimalizácia údajov, právo na vysvetlenie). Hodnotí sa fairness voči chráneným skupinám (testy parity schvaľovania, rozdiel v chybovosti, equalized odds). Pre pokročilé modely sa používajú SHAP a ICE grafy na lokálne a globálne vysvetlenia, pričom sa uplatňujú monotonic constraints (napr. vyššie omeškania nikdy nezlepšujú skóre).
Model risk management a governance
- Životný cyklus modelu – návrh, vývoj, nezávislá validácia, schválenie, implementácia, monitoring, rekalibrácia, retirácia.
- Dokumentácia – účel, dátové zdroje, transformácie, predpoklady, limity, výsledky testov, citlivostné analýzy.
- Backtesting a challenger modely – porovnanie so zjednodušenými či alternatívnymi prístupmi.
- Kontrolné limity – prahové hodnoty pre AUC/Gini, PSI, PD-observed odchýlky, override rates.
Kalibrácia, rekalibrácia a monitoring v čase
Po nasadení je nutné kontinuálne sledovať calibration drift (napr. Expected–Observed pomer), feature drift a vplyv makro zmien. Rekalibrácia môže byť technická (posun interceptu), parciálna (úprava koeficientov) alebo plná (nový tréning). V krízových obdobiach sa aplikuje overlay alebo procyclicality dampeners.
Nasadenie do praxe: rozhodovacie stratégie a pricing
- Cut-off stratégie – kombinované prahy pre schválenie, manuálny review a zamietnutie; často v spojení s policy rules (vek, DTI, LTV).
- Risk-based pricing – preklad PD/LGD/EAD do marže a RPMN pri rešpektovaní regulácií (stropy RPMN, zodpovedné úverovanie).
- Limit management – dynamická úprava limitov kreditných kariet/čerpaní podľa behaviorálneho skóre a rizikového apetítu.
- Kolekčné stratégie – segmentácia podľa pravdepodobnosti cure vs. roll; optimalizácia kontaktnej frekvencie a kanála.
Modely LGD a EAD: špecifiká a metodiky
LGD sa odhaduje metódou workout (diskontované cash flow z vymáhania mínus náklady) alebo market (ceny zabezpečenia, recovery rates). Pri zabezpečených hypotékach je kľúčový LTV v čase zlyhania, volatilita cien a náklady realizácie kolaterálu. EAD pri revolvingových produktoch využíva Credit Conversion Factor alebo Levine-Sebe prístup na odhad čerpania pred defaultom.
Makro prepojenia a stresové testovanie
Pre PIT rámec sa PD modely spájajú s makro premennými (nezamestnanosť, príjmy, sadzby, ceny nehnuteľností). Stresové testy simulujú extrémne, no plausibilné scenáre a sledujú dopad na PD/LGD/EAD, kapitál a likviditu. Dôležité je reverse stress testing na identifikáciu scenárov vedúcich k porušeniu kapitálových limitov.
Špecifiká pre segmenty: retail vs. SME vs. korporáty
- Retail – vysoký objem, nízka jednotková expozícia; modely sú silno dátovo riadené a automatizované.
- SME – heterogénne dáta a kvalita účtovníctva; kombinácia finančných pomerov, kvalitatívnych posúdení a behaviorálnych znakov.
- Korporáty – dôraz na forward-looking analýzu cash flow, odvetvové scenáre, kvalitu manažmentu a kovenanty; modely často slúžia ako input pre expertný ratingový výbor.
Implementačné otázky: IT architektúra a realtime scoring
Nasadenie vyžaduje model serving (API), verziovanie a feature store pre konzistentné výpočty v tréningu aj produkcii (training–serving skew). Latency je kritická pri online onboardingoch; batch scoring sa uplatňuje pri mesačnom monitoringu portfólia. Logovanie pre audit musí obsahovať vstupné znaky, skóre, rozhodnutie a vysvetlenia.
Etika, robustnosť a odolnosť modelov
- Robustnosť – citlivosť na malé zmeny vstupov, odpor voči outlierom, zámerná manipulácia (gaming).
- Etika – vylúčenie explicitne chránených znakov a proxy premenných; pravidelné fairness audity.
- Bezpečnosť – kontrola kvality dátových kanálov, detekcia anomálií a podvodov (fraud), segregácia prístupov.
Praktický rámec pre návrh a validáciu modelu
- Definícia cieľa – horizont defaultu (12M/24M), definícia defaultu, segmentácia.
- Dáta a príznaky – zber, očistenie, binning/WoE, interakcie, výber premenných (IV, VIF, stability).
- Tréning a validácia – časové rozdelenie, k-fold, out-of-time validácia; riešenie imbalance (váhy, oversampling/SMOTE s opatrnosťou).
- Benchmark/Challenger – porovnanie logistickej regresie, boosting a skórovacej karty.
- Kalibrácia – Platt/Isotonic, intercept shift, bucket testy PD vs. observed.
- Dokumentácia a schválenie – metodika, limity, riziká, testy citlivosti, model change policy.
Kombinácia výkonu, vysvetliteľnosti a compliance
Neexistuje univerzálne najlepší model bonity. V praxi sa najlepšie osvedčuje hybridný prístup: interpretable backbone (logistická/skórovacia karta) doplnený o silnejší challenger (boosting) a robustný governance rámec. Kľúčom je udržateľná kalibrácia v čase, etická a právna kompatibilita, dôsledný monitoring stability a schopnosť preklopiť modelové výstupy do zrozumiteľných obchodných rozhodnutí – od schvaľovania cez pricing až po včasný zásah v prípade zhoršenia rizikového profilu.