PDI — Credit Risk Scoring
Prédire P(bad) (risque de défaut) et transformer ce score en décision ACCEPT / REVIEW / REJECT via des seuils métier configurables.
Pourquoi ce projet ?
Au-delà de la performance modèle, l’enjeu est de rendre le résultat exploitable : décisions explicites, auditables et adaptées à des environnements régulés (banque/assurance).
Dataset & approche
- Dataset : credit-g (OpenML)
- Méthodologie : CRISP-DM
- Baseline : Régression logistique (interprétable, stable)
Logique de décision
Deux seuils : A (accept) et R (reject)
- ACCEPT si P(bad) < A
- REVIEW si A ≤ P(bad) < R
- REJECT si P(bad) ≥ R
Principe : le modèle estime le risque, le métier garde la décision.
Contenu
- Pipeline de bout en bout, du prétraitement des données au déploiement du service de décision
- Modèle de base interprétable (régression logistique) sélectionné pour sa stabilité et sa auditabilité
- Couche de décision métier traduisant les scores de risque en ACCEPT / REVIEW / REJECT
- API web et interface décisionnelle
- Déploiement conteneurisé sur Google Cloud Run avec CI/CD (GitHub Actions, WIF)
Stack technique
Python · scikit-learn · Flask API · Docker · Google Cloud Run · CI/CD
Public cible
Ce projet est destiné aux parties prenantes techniques et non techniques intéressées par la façon dont les systèmes d'apprentissage automatique peuvent soutenir des décisions métier contrôlées, explicables et adaptées à des environnements régulés.