Data Lineage

Traçabilité des flux de données · Données critiques

2026
v1.0

FrontierBank · Data Lineage · Phase 3

Traçabilité des Données — De la Source au Reporting

17 systèmes · 17 flux · 10 données critiques BCBS 239 · Mar – Mai 2026

53%

Coverage lineage

10

Nœuds BCBS 239

53%

9

Flux documentés

Lineage tracé, transformation documentée

À compléter

7

Flux partiels

Documentation incomplète à finaliser

Critique

1

Flux non documentés

Traçabilité absente — risque réglementaire

BCBS 239

10

Données critiques BCBS

Nœuds soumis aux 14 principes BCBS 239

Situation Phase 3Data Catalog & Qualité

Phase 3 — Déploiement du Data Catalog Collibra. Le stream Kafka est intégré. Les contrôles qualité automatisés alimentent le catalog. Les flux BCBS 239 sont en cours de documentation.

Graphe de Data Lineage — Vue Complète

Cartographie des flux de données de bout en bout · 17 systèmes · 17 flux tracés à la Phase 3

Source
Ingestion
Transformation
Stockage
Consommation
Reporting
Documenté
Partiel
Non documenté
Donnée critique BCBS 239
SourcesIngestionTransform & StockageDWH & CatalogConsommationExtract dailyRisk indicatorsAccounting dataLoad rawCustomer eventsMarket feedStream to lakeAPI to DWHSilver transformTest suiteGold layerQuality metadataTable metadataRisk data martFinance data martTraining dataRegulatory dataCore BankingTemenos T24BCBSCRMSalesforceMoteur de RisquesMurexBCBSGrand LivreSAP FinanceBCBSDonnées MarchéBloombergBCBSETL OpérationnelTalendNEWStream Temps RéelKafkaAPI GatewayInternal APITransformation dbtdbt CoreBCBSNEWContrôles QualitéGreat ExpectationsBCBSData LakeAzure ADLSData WarehouseSnowflakeBCBSNEWData CatalogCollibraBCBSReporting RisquesPower BIBCBSReporting FinancePower BINEWModèles IAPython/MLflowNEWReporting BCBS 239Regulatory EngineBCBS

Lecture : Le graphe se construit progressivement au fil des phases. Les nœuds bordés en couleur sont des données critiques BCBS 239. Les flèches vertes continues indiquent un flux documenté, les oranges en tirets un lineage partiel, et les rouges en pointillés un flux non documenté — risque réglementaire. Le badge BCBS signale les nœuds soumis aux 14 principes.

Démarche — Ce qui se passe réellement à la Phase 3

Rôle du consultant Data, actions des équipes internes et livrables produits pour faire progresser le lineage

Phase 3 · Data Catalog & Qualité

Consultant Data

Pilote le déploiement de Collibra — paramètre les workflows de validation des métadonnées
Anime des ateliers avec les Data Stewards pour alimenter le glossaire métier (120 termes)
Définit le processus de certification des données : qui valide, selon quels critères
Crée les tableaux de bord de suivi du coverage lineage pour le Comité de Gouvernance

Livrable

Collibra opérationnel · Glossaire 120 termes · Process de certification · Dashboard coverage

Data Stewards

Alimentent le data catalog avec les définitions métier et les règles de gestion
Documentent les transformations dans dbt en lien avec le glossaire Collibra
Exécutent les premiers contrôles qualité Great Expectations sur les données critiques
Remontent les anomalies de lineage identifiées lors des contrôles qualité

Livrable

Catalog alimenté · Tests qualité déployés · Anomalies de lineage remontées

Équipe Conformité

Valide que le lineage tracé couvre bien les 14 données critiques BCBS 239
Identifie les flux réglementaires non encore documentés (Reporting BCBS)
Prépare les premières réponses aux demandes de l'inspection réglementaire
Définit les exigences de traçabilité pour le reporting COREP/FINREP

Livrable

Couverture BCBS 239 validée · Gaps réglementaires identifiés · Plan de remédiation

Nouveautés Phase 3Data Catalog & Qualité

Systèmes et flux introduits à cette phase du programme

5 nouveaux systèmes6 nouveaux flux

Nouveaux systèmes

Stream Temps Réel

Ingestion

Kafka · Owner : IT/DSI

Ingestion temps réel des flux de transactions et événements marché

Contrôles Qualité

TransformationBCBS 239

Great Expectations · Owner : Data Team

Tests automatisés de qualité — complétude, exactitude, cohérence, fraîcheur

Data Catalog

StockageBCBS 239

Collibra · Owner : Data Steward

Référentiel des métadonnées, glossaire, lineage, règles de qualité et ownership

Modèles IA

Consommation

Python/MLflow · Owner : Data Science

Consommation des données certifiées pour l'entraînement et l'inférence des modèles

Reporting BCBS 239

ReportingBCBS 239

Regulatory Engine · Owner : Conformité

Production des reportings réglementaires BCBS 239 — données agrégées de risque

Nouveaux flux tracés

Stream Temps RéelData LakeDocumenté

Volume

~2GB/h

Fréquence

Continu

Transform

Sérialisation Parquet

Transformation dbtContrôles QualitéDocumenté

Volume

1 200 tests

Fréquence

Quotidien

Transform

Tests Great Expectations

Contrôles QualitéData CatalogDocumenté

Volume

KPIs qualité

Fréquence

Quotidien

Transform

Publication métriques

Data WarehouseData CatalogDocumenté

Volume

2 400 tables

Fréquence

Continu

Transform

Scan automatique

Data WarehouseModèles IADocumenté

Volume

Features store

Fréquence

Hebdomadaire

Transform

Feature engineering

Data WarehouseReporting BCBS 239Partiel

Volume

14 principes

Fréquence

Quotidien

Transform

Calcul réglementaire

Catalogue des Systèmes — Phase 3

Détail de chaque système visible à cette phase — type, propriétaire, criticité réglementaire

17 systèmes
SystèmeTypeTechnologiePropriétairePhase introBCBS 239Description
Core Banking
SourceTemenos T24IT/DSIP1Système central bancaire — données clients, comptes, transactions, contrats
CRM
SourceSalesforceMarketingP1Gestion de la relation client — interactions, opportunités, segments
Moteur de Risques
SourceMurexRisquesP1Calcul des indicateurs de risque marché, crédit et liquidité (LCR, VaR, NSFR)
Grand Livre
SourceSAP FinanceFinanceP1Comptabilité générale — écritures, balances, P&L par entité juridique
Données Marché
SourceBloombergTrésorerieP2Flux de données marché temps réel — cours, taux, spreads de crédit
ETL Opérationnel
IngestionTalendIT/DSIP1Collecte et chargement des données opérationnelles depuis les systèmes sources
Stream Temps RéelNouveau
IngestionKafkaIT/DSIP3Ingestion temps réel des flux de transactions et événements marché
API Gateway
IngestionInternal APIIT/DSIP2Exposition des données via API REST pour les consommateurs internes et partenaires
Transformation dbt
Transformationdbt CoreData TeamP2Transformations SQL documentées — calcul des indicateurs métier et réglementaires
Contrôles QualitéNouveau
TransformationGreat ExpectationsData TeamP3Tests automatisés de qualité — complétude, exactitude, cohérence, fraîcheur
Data Lake
StockageAzure ADLSIT/DSIP1Stockage brut des données — zone raw, silver et gold — format Parquet/Delta
Data Warehouse
StockageSnowflakeData TeamP2Entrepôt de données analytique — données certifiées, modèle en étoile, historisation
Data CatalogNouveau
StockageCollibraData StewardP3Référentiel des métadonnées, glossaire, lineage, règles de qualité et ownership
Reporting Risques
ConsommationPower BIRisquesP2Tableaux de bord risques — LCR, NSFR, VaR, FRTB, ratio de levier
Reporting Finance
ConsommationPower BIFinanceP2Reportings financiers internes — P&L, budget vs réalisé, prévisions
Modèles IANouveau
ConsommationPython/MLflowData ScienceP3Consommation des données certifiées pour l'entraînement et l'inférence des modèles
Reporting BCBS 239Nouveau
ReportingRegulatory EngineConformitéP3Production des reportings réglementaires BCBS 239 — données agrégées de risque

Progression du Coverage Lineage par Phase

Évolution du taux de documentation des flux de données — objectif 100% à Phase 6

53% documenté

Diagnostic & Cadrage

5 systèmes · 4 flux

15%

Identification des sources — aucun flux documenté formellement

Framework Gouvernance

10 systèmes · 11 flux

38%

Introduction dbt + DWH Snowflake — premiers flux documentés

3

Data Catalog & Qualité

15 systèmes · 17 flux

58%

Déploiement Collibra — les flux critiques BCBS 239 sont tracés

4

Data Lineage & MDM

19 systèmes · 21 flux

MDM + transmission BCE — lineage BCBS 239 complet

5

IA Governance

20 systèmes · 21 flux

Lineage modèles IA — traçabilité données → modèle → décision

6

Acculturation & Scale

20 systèmes · 21 flux

Lineage automatisé, versionné et maintenu en continu