Data Lineage
FrontierBank · Data Lineage · Phase 3
Traçabilité des Données — De la Source au Reporting
17 systèmes · 17 flux · 10 données critiques BCBS 239 · Mar – Mai 2026
53%
Coverage lineage
10
Nœuds BCBS 239
9
Flux documentés
Lineage tracé, transformation documentée
7
Flux partiels
Documentation incomplète à finaliser
1
Flux non documentés
Traçabilité absente — risque réglementaire
10
Données critiques BCBS
Nœuds soumis aux 14 principes BCBS 239
Situation Phase 3 — Data Catalog & Qualité
Phase 3 — Déploiement du Data Catalog Collibra. Le stream Kafka est intégré. Les contrôles qualité automatisés alimentent le catalog. Les flux BCBS 239 sont en cours de documentation.
Graphe de Data Lineage — Vue Complète
Cartographie des flux de données de bout en bout · 17 systèmes · 17 flux tracés à la Phase 3
Lecture : Le graphe se construit progressivement au fil des phases. Les nœuds bordés en couleur sont des données critiques BCBS 239. Les flèches vertes continues indiquent un flux documenté, les oranges en tirets un lineage partiel, et les rouges en pointillés un flux non documenté — risque réglementaire. Le badge BCBS signale les nœuds soumis aux 14 principes.
Démarche — Ce qui se passe réellement à la Phase 3
Rôle du consultant Data, actions des équipes internes et livrables produits pour faire progresser le lineage
Consultant Data
Livrable
Collibra opérationnel · Glossaire 120 termes · Process de certification · Dashboard coverage
Data Stewards
Livrable
Catalog alimenté · Tests qualité déployés · Anomalies de lineage remontées
Équipe Conformité
Livrable
Couverture BCBS 239 validée · Gaps réglementaires identifiés · Plan de remédiation
Nouveautés Phase 3 — Data Catalog & Qualité
Systèmes et flux introduits à cette phase du programme
Nouveaux systèmes
Stream Temps Réel
IngestionKafka · Owner : IT/DSI
Ingestion temps réel des flux de transactions et événements marché
Contrôles Qualité
TransformationBCBS 239Great Expectations · Owner : Data Team
Tests automatisés de qualité — complétude, exactitude, cohérence, fraîcheur
Data Catalog
StockageBCBS 239Collibra · Owner : Data Steward
Référentiel des métadonnées, glossaire, lineage, règles de qualité et ownership
Modèles IA
ConsommationPython/MLflow · Owner : Data Science
Consommation des données certifiées pour l'entraînement et l'inférence des modèles
Reporting BCBS 239
ReportingBCBS 239Regulatory Engine · Owner : Conformité
Production des reportings réglementaires BCBS 239 — données agrégées de risque
Nouveaux flux tracés
Volume
~2GB/h
Fréquence
Continu
Transform
Sérialisation Parquet
Volume
1 200 tests
Fréquence
Quotidien
Transform
Tests Great Expectations
Volume
KPIs qualité
Fréquence
Quotidien
Transform
Publication métriques
Volume
2 400 tables
Fréquence
Continu
Transform
Scan automatique
Volume
Features store
Fréquence
Hebdomadaire
Transform
Feature engineering
Volume
14 principes
Fréquence
Quotidien
Transform
Calcul réglementaire
Catalogue des Systèmes — Phase 3
Détail de chaque système visible à cette phase — type, propriétaire, criticité réglementaire
| Système | Type | Technologie | Propriétaire | Phase intro | BCBS 239 | Description |
|---|---|---|---|---|---|---|
Core Banking | Source | Temenos T24 | IT/DSI | P1 | Système central bancaire — données clients, comptes, transactions, contrats | |
CRM | Source | Salesforce | Marketing | P1 | — | Gestion de la relation client — interactions, opportunités, segments |
Moteur de Risques | Source | Murex | Risques | P1 | Calcul des indicateurs de risque marché, crédit et liquidité (LCR, VaR, NSFR) | |
Grand Livre | Source | SAP Finance | Finance | P1 | Comptabilité générale — écritures, balances, P&L par entité juridique | |
Données Marché | Source | Bloomberg | Trésorerie | P2 | Flux de données marché temps réel — cours, taux, spreads de crédit | |
ETL Opérationnel | Ingestion | Talend | IT/DSI | P1 | — | Collecte et chargement des données opérationnelles depuis les systèmes sources |
Stream Temps RéelNouveau | Ingestion | Kafka | IT/DSI | P3 | — | Ingestion temps réel des flux de transactions et événements marché |
API Gateway | Ingestion | Internal API | IT/DSI | P2 | — | Exposition des données via API REST pour les consommateurs internes et partenaires |
Transformation dbt | Transformation | dbt Core | Data Team | P2 | Transformations SQL documentées — calcul des indicateurs métier et réglementaires | |
Contrôles QualitéNouveau | Transformation | Great Expectations | Data Team | P3 | Tests automatisés de qualité — complétude, exactitude, cohérence, fraîcheur | |
Data Lake | Stockage | Azure ADLS | IT/DSI | P1 | — | Stockage brut des données — zone raw, silver et gold — format Parquet/Delta |
Data Warehouse | Stockage | Snowflake | Data Team | P2 | Entrepôt de données analytique — données certifiées, modèle en étoile, historisation | |
Data CatalogNouveau | Stockage | Collibra | Data Steward | P3 | Référentiel des métadonnées, glossaire, lineage, règles de qualité et ownership | |
Reporting Risques | Consommation | Power BI | Risques | P2 | Tableaux de bord risques — LCR, NSFR, VaR, FRTB, ratio de levier | |
Reporting Finance | Consommation | Power BI | Finance | P2 | — | Reportings financiers internes — P&L, budget vs réalisé, prévisions |
Modèles IANouveau | Consommation | Python/MLflow | Data Science | P3 | — | Consommation des données certifiées pour l'entraînement et l'inférence des modèles |
Reporting BCBS 239Nouveau | Reporting | Regulatory Engine | Conformité | P3 | Production des reportings réglementaires BCBS 239 — données agrégées de risque |
Progression du Coverage Lineage par Phase
Évolution du taux de documentation des flux de données — objectif 100% à Phase 6
Diagnostic & Cadrage
5 systèmes · 4 flux
Identification des sources — aucun flux documenté formellement
Framework Gouvernance
10 systèmes · 11 flux
Introduction dbt + DWH Snowflake — premiers flux documentés
Data Catalog & Qualité
15 systèmes · 17 flux
Déploiement Collibra — les flux critiques BCBS 239 sont tracés
Data Lineage & MDM
19 systèmes · 21 flux
IA Governance
20 systèmes · 21 flux
Acculturation & Scale
20 systèmes · 21 flux