La quantité de données non structurées créée chaque année est en pleine croissance, submergeant les architectures de stockage traditionnelles et créant à la fois des risques en termes de conformité et de récupération. Les entreprises confrontées à cette explosion sont de plus en plus nombreuses à se tourner vers le stockage objet à tel point qu’il est devenu la référence pour la conservation à long terme des données de grande valeur.
Si le stockage objet a depuis longtemps trouvé sa place dans le cloud et dans les data centers, l’explosion de la demande en matière de stockage fait peser un réel danger sur les départements IT et leurs budgets – les coûts risquant d’exploser. Les entreprises doivent donc trouver une alternative pour pouvoir profiter des avantages du stockage objet, sans pour autant que les coûts ne deviennent incontrôlables. Comme pour beaucoup d’autres problèmes de stockage – la réponse se trouve sur la bande !
La conservation et la protection des données au défi des coûts du stockage objet
La rétention des données est un problème clé pour de nombreuses entreprises qui ont recours au stockage objet. Si la période de conservation de nombreux types de données est spécifiée par la loi, on pourrait aussi s'attendre à ce que les données non soumises à des contraintes de conformité soient supprimées à un moment ou à un autre ; mais certaines données ont une valeur sur le (très) long terme. Par exemple, les données géologiques et génétiques n'ont pas de date d'expiration et peuvent représenter un investissement important. Un certain nombre de données restent donc à conserver sur de très longue période et doivent être accessibles et protégées tout du long. Le stockage objet de par son infrastructure permet de répondre à cette nécessité.
La demande de capacité de stockage augmente chaque année de 20 %. Cette croissance est une source de couts additionnels pour les entreprises. Le stockage objet doit donc devenir moins chers sans pour autant perdre de sa durabilité.
Pour permettre un nouvel équilibre entre budget et nécessité, le stockage objet doit réduire son coût total de possession (CTP) qui comprend non seulement le coût des supports, mais aussi les dépenses associées à la possession d'un équipement, comme les coûts d'acquisition, de maintenance, d'alimentation électrique, de refroidissement, ainsi que le bâtiment d'enceinte et le terrain sur lequel il se trouve. Aujourd’hui, la majorité des sauvegardes sont basées sur des disques durs, ce qui offre de bonnes performances et une bonne fiabilité, mais les coûts sont encore assez élevés.
La bande comme solution pour réconcilier budgets et besoins
La bande a un coût de support plus faible et contrairement aux disques, nécessite moins d'énergie et de ventilation lorsqu'elle n’est pas utilisée. Elle offre aussi un support idéal pour les grandes quantités de données stockées sur le long terme. Et pour les E/S séquentielles, la bande est plus performante que le disque en lecture et en écriture.
Pour exploiter tous les avantages de la bande dans le stockage objet, il faut également bien comprendre comment la gérer correctement. Il faut donc tenir compte des modes de défaillance propres aux bandes et également gérer les modes d'accès afin de réduire les latences et l'usure de la bande.
Avec la bonne expertise, les organisations peuvent mettre en œuvre un stockage objet sur bande pour la conservation des données à long terme tout en gardant les coûts de stockage sous contrôle.
Les clés du succès : catalogage et gestion des données
Un magasin d'objets peut atteindre une taille de l'ordre du pétaoctet ou même de l'exabyte . Pourtant, la taille des objets est souvent comprise entre kilo-octets et méga-octets : il y a potentiellement des quadrillions d'objets dans un magasin d'objets à l'échelle de l'exabyte. Comment savoir ce qui se trouve dedans ? Comment identifier et sélectionner des sous-ensembles complets d'informations dans un ensemble de données aussi vaste ?
Un catalogue du contenu du magasin d'objets remplace la mémoire humaine - c'est un mécanisme de sélection de sous-ensembles de données. Les données doivent être classées au fur et à mesure qu'elles sont ajoutées. La classification initiale comprendrait les attributs standard et pourrait également inclure une classification spécifique à un domaine.
Qui décide quels objets vont sur quel support de stockage ? Comment cette décision est-elle prise ? Comment sélectionnons-nous les ensembles de données nécessaires à une tâche ? Une bonne gestion des données garantit que les données sont là où l'utilisateur en a besoin, quand il en a besoin. Une fois qu'un objet d'intérêt est identifié, le système s'assure que les données sont placées pour un traitement optimal. Inversement, les données doivent se trouver à l'endroit où elles peuvent être conservées en toute sécurité et au moindre coût lorsqu'elles ne sont pas utilisées.
Des magasins d'objets correctement catalogués et gérés peuvent être le meilleur moyen de conserver des données non structurées comme un actif pour l'avenir.
Par Matthew Dewey, Technical Director chez Quantum