PDI — Credit Risk Scoring

Prédire P(bad) (risque de défaut) et transformer ce score en décision ACCEPT / REVIEW / REJECT via des seuils métier configurables.

Pourquoi ce projet ?

Au-delà de la performance modèle, l’enjeu est de rendre le résultat exploitable : décisions explicites, auditables et adaptées à des environnements régulés (banque/assurance).

Dataset & approche

Dataset : credit-g (OpenML)
Méthodologie : CRISP-DM
Baseline : Régression logistique (interprétable, stable)

Logique de décision

Deux seuils : A (accept) et R (reject)

ACCEPT si P(bad) < A
REVIEW si A ≤ P(bad) < R
REJECT si P(bad) ≥ R

Principe : le modèle estime le risque, le métier garde la décision.

Contenu

Pipeline de bout en bout, du prétraitement des données au déploiement du service de décision
Modèle de base interprétable (régression logistique) sélectionné pour sa stabilité et sa auditabilité
Couche de décision métier traduisant les scores de risque en ACCEPT / REVIEW / REJECT
API web et interface décisionnelle
Déploiement conteneurisé sur Google Cloud Run avec CI/CD (GitHub Actions, WIF)

Stack technique

Python · scikit-learn · Flask API · Docker · Google Cloud Run · CI/CD

Public cible

Ce projet est destiné aux parties prenantes techniques et non techniques intéressées par la façon dont les systèmes d'apprentissage automatique peuvent soutenir des décisions métier contrôlées, explicables et adaptées à des environnements régulés.

Démo & code

Ouvrir la démo Voir le dépôt