Projets

Projets sélectionnés illustrant comment le machine learning soutient des décisions métier réelles.

Credit Risk Scoring — Business Decision Thresholds

D’une probabilité ML à des décisions crédit exploitables

Un système de scoring de risque crédit prêt pour la production : un modèle ML estime la probabilité de défaut (P(bad)), puis une couche de décision métier convertit ce risque en ACCEPT / REVIEW / REJECT.

L’objectif n’est pas d’optimiser une métrique unique, mais de transformer un score de risque en décisions explicites et auditables. Les performances du modèle importent dans la mesure où elles permettent des seuils stables, une explicabilité claire, et un déploiement sûr en environnement régulé.

  • Dataset : OpenML credit-g
  • Modèle : Régression logistique
  • ROC AUC ≈ 0.78
  • Seuils de décision métier
  • Déployé sur Google Cloud Run

Métriques orientées métier

  • Rappel sur les clients risqués (bad) — priorité à la détection des cas à haut risque pour éviter des défauts non détectés coûteux.
  • Faux négatifs (FN) — dossiers risqués acceptés à tort. Cette métrique est volontairement minimisée.
  • Faux positifs (FP) — clients solvables rejetés ou envoyés en revue manuelle, représentant un coût d’opportunité contrôlé.
  • Coût métier pondéré — les seuils sont choisis pour minimiser un coût global reflétant l’asymétrie des risques.
  • Zones de décision explicites — séparation claire entre ACCEPT, REVIEW et REJECT pour réduire la charge manuelle tout en gardant le contrôle métier.

Ce que ce projet démontre

  • ML orienté décision — le modèle n’est pas une fin en soi : il sert un processus explicite (ACCEPT / REVIEW / REJECT).
  • Choix interprétables — la régression logistique est choisie pour la stabilité, l’explicabilité et les contextes régulés.
  • Seuils de décision plutôt que score brut — conversion des probabilités en règles métier actionnables.
  • Approche production — application containerisée, CI/CD, déploiement cloud, health checks et smoke tests.
  • Séparation des responsabilités — data, modèle, règles métier, API et UI sont volontairement découplés.