Alors que le Règlement Général sur la Protection des Données (RGPD), vient de souffler, en mai dernier, sa cinquième bougie, la conformité réglementaire reste un véritable défi en termes de gestion des données, et peine à évoluer. A bien des égards, il a été le catalyseur de nouvelles normes en matière de confidentialité des données. Il a également poussé de nombreuses entreprises à examiner leurs processus internes et à visualiser l’ensemble du cycle de vie de la donnée, aussi appelé data lineage (ou lignage de données), afin d’être conformes aux exigences réglementaires.

Certains secteurs sont plus impactés par les conséquences de ces réglementations, celui de la finance en particulier, qui est supervisé par la Banque Centrale Européenne (BCE) pour les banques et l'Autorité de Contrôle Prudentiel et de Résolution (ACPR) pour les assurances et qui procèdent à des examens fréquents. Si ces contrôles réglementaires sont cruciaux pour garantir que les processus organisationnels internes protègent la vie privée des consommateurs et des citoyens, ils constituent également un véritable casse-tête pour de nombreuses entreprises.  

Respecter des exigences réglementaires strictes

Les données circulent sans cesse à travers ce que l’on appelle la chaîne d'approvisionnement des données. Dès qu’une donnée est créée ou intégrée, elle commence à se déplacer. En se déplaçant, elle peut également être manipulée et transformée par des personnes, des processus et des systèmes : le parcours d'une donnée dans une chaîne d’approvisionnement dédiée est in fine imprévisible. Elle ne se contente pas de se déplacer d'un point A à un point B en raison des environnements de données vastes et complexes des organisations. En résumé, une seule transaction de données peut passer d'un point A à un point K, revenir au point G puis se rendre au point V. Au fur et à mesure qu’elles transitent, leur format, leur fonction et leur niveau de qualité varient. Certaines se transforment même plusieurs fois au cours de leur transfert.

D’autre part, la complexité des données peut entrainer des difficultés pour se conformer aux exigences réglementaires de l’Union Européenne (RGPD) ou aux processus spécifiques d’un secteur d’activité. C’est pourquoi il est crucial pour les organisations de suivre le data lineage à travers différents systèmes et plateformes, afin de créer une piste d’audit complète pour le cycle de vie des données. Cette approche permet de mieux gérer les risques liés aux données et d’améliorer la conformité.  

Les vertus du data lineage

Rester conforme aux diverses réglementations induit la prise en compte de l’évolution des données. Ainsi, bien que les différentes visions du data lineage varient en fonction des rôles et des objectifs de leurs utilisateurs, en règle générale, les organisations doivent assurer le suivi des historiques business et technique, en s’appuyant notamment sur le déploiement d’un programme de gouvernance des données complet.

Le data lineage métier offre une visibilité complète sur les bases de données et l’origine de ces dernières en suivant leur cheminement dans le temps. Il permet de retracer les erreurs jusqu'à leurs sources, de telle sorte que les utilisateurs comprennent les données qu’ils manipulent, et qu’ils puissent se fier à elles pour, in fine, générer des informations fiables. Si ce niveau de traçabilité offre une compréhension plus complète des applications et des processus dans lesquels les données transitent, son utilisation pour la conformité réglementaire reste limitée.

En revanche, le data lineage technique est pour sa part essentiel pour la conformité réglementaire. En effet, il rend compte de l’ensemble des détails complexes d'un élément spécifique des données traitées et de leur emplacement physique. Cela inclut les procédures de stockage, la manière dont les données se combinent avec d'autres ensembles et les processus de transformation qu’elles subissent. Il permet également aux équipes informatiques d'explorer tous les détails de façon interactive et d’effectuer des recherches rapides dans les glossaires de données. Plus important encore, il démontre l'impact de la politique réglementaire sur divers environnements de données en identifiant où les données personnelles ou protégées sont stockées et comment ces données ont changé au fil du temps. Une fois le data lineage technique en place, les gestionnaires de données peuvent travailler à établir la conformité au RGPD.

En analysant les multiples étapes que les données franchissent dans un environnement, à travers les datawarehouses ou toute autre altération technique, les opérateurs capturent chaque détail des flux de données de l'entreprise et retracent les multiples mouvements effectués. Cette approche permet de respecter les exigences réglementaires et assurer la confidentialité des données sensibles.

Par Alexandre Laverdure, Senior Data Integrity Specialist chez Precisely