Les entreprises doivent faire face à l’obligation de conserver plus de données sur des périodes plus longues. Mais elles manquent d’outillages pour gérer le cycle de vie de la donnée…
Les CIO et leurs entreprises sont confrontés à l’explosion des données. Un phénomène dû à la multiplication des sources, formats et duplication des données, à l’usage du Big Data et des analytiques qui pour atteindre la précision recherchée doit reposer sur des volumes exponentiels de données, à l’allongement du cycle juridique de la donnée lié à des exigences réglementaires ? Sans oublier les utilisateurs qui ni le temps ni les moyens de gérer manuellement, ni de consulter toutes les données qui s’offrent à eux.
Conserver ou supprimer les données ?
Face à la croissance des données qui s’accumulent, principalement les données non-structurées, les DSI n’ont guère d’autre choix que soit de tout conserver, soit de s’efforcer de se débarrasser d’une montagne de données. Dans les deux cas, cela ne résout pas les problèmes sous-jacents liés au stockage des données. Il faut pourtant économiser sur l’achat de disques supplémentaires…
Avec la montée de l’Internet et du cloud, certains DSI se demandent s’il ne serait pas plus intéressant de laisser la donnée là où elle est, sans la stocker dans l’entreprise, et de se doter d’outils de recherche performants pour y accéder à la demande. Erreur, une étude d’Iron Mountain a démontré que le coût de la recherche et de l’usage d’un document spécifique est 500 fois plus élevé que de le conserver intact pendant 20 ans !
Voilà pourquoi il faut gérer le cycle de vie de la donnée en adoptant une stratégie de stockage et de conservation de la donnée. Sachant que le volume des données accumulées par l’employé ne cesse d’augmenter dans le temps alors que la probabilité de réutilisation d’une donnée chute rapidement jusqu’à être à 1 % quinze jours après sa création. Pour autant, les données inactives sont-elles sans valeur ?
Le cycle de vie de la donnée
La durée de vie ‘utile’ d’une donnée est très courte. A l’opposé sa conservation se révèle très longue. Et pour adopter une stratégie, il faut donner de la valeur à la donnée. Une étude CGOC de 2012, mais qui est encore reconnue aujourd’hui, segmente ainsi les données :
- 1 % des données sont soumises à une autorisation légale ;
- 5 % sont soumises à une réglementation légale en matière de conservation ;
- 25 % ont une valeur commerciale directe :
- 69 % ont une valeur inconnue.
Là encore, une valeur inconnue ne signifie pas que la donnée doit être supprimée… Simplement l’entreprise et ses employés manquent de temps pour la catégoriser. Il est donc plus simple de la conserver, et probablement l’archiver sur un stockage peu coûteux, et pourquoi pas dans le cloud.
Consolider la donnée
Pour cela, le maintien de la conformité réglementaire et l’e-découverte impliquent la nécessité de consolider l'information afin qu'elle puisse être recherchée et produite sur demande dans un délai acceptable. D'un autre côté, les données conservées pour des raisons d'historique d'entreprise et d'analyse de données ne nécessitent pas de recherche et de production rapides, mais doivent être consolidées pour faciliter la recherche et la production.
La hiérarchisation des données – chaud et froid pour les données actives ou semi-actives, archive pour les 69 % cités plus haut - va permettre de simplifier le cycle de vie de la donnée et d’optimiser les coûts du stockage. Donc la question « to tier or not to tier » n’en est plus une !
Image d’entête 690478842 @ iStock cifotart