Le développement des LLM, la réplication des données et l'allongement des périodes de rétention des données accroissent très significativement les besoins en stockage. Cela suppose une augmentation des investissements
dans ce domaine.


Le stockage est le deuxième composant le plus important dune infrastructure d'IA selon les répondants à la dernière enquête Seagate réalisée par Recon Analytics, juste après la sécurité. Un résultat qui ne saurait surprendre de la part d’un fournisseur majeur de supports de stockage. Noter que les entreprises auxquelles appartiennent les répondants déclarent un chiffre d'affaires annuel supérieur à 10 millions de dollars et une capacité de stockage actuelle supérieure à 50 To.

L’étude enseigne que six acheteurs de solutions sur dix utilisent principalement le stockage dans le cloud pour la gestion des données d'IA et s'attendent à ce que les besoins en stockage doublent au moins d'ici à 2028. Trois causes expliquent cela. D’une part, la durée de conservation des données est plus longue, de six mois à plusieurs années. D’autre part, 73 % des membres du panel utilisent des points de contrôle LLM quotidiens ou hebdomadaires pour stocker les paramètres critiques. Enfin, 80 % des répondants jugent que la réplication des données pour l'IA est très ou modérément importante.

Parmi les personnes interrogées qui sauvegardent des points de contrôle quotidiennement, soit 28 % des personnes interrogées, près d’une sur trois conservent les données pendant plus de 12 mois, tandis que 29 % des répondants les conservent durant 6 à 12 mois.

Un recours au cloud accru pour répondre aux besoins

Le graphique ci-dessous indique les solutions adoptées pour faire face aux besoins croissants de stockage dus à l’usage de l’IA, en fonction du chiffre d'affaires. En bref, le cloud est utilisé majoritairement par les entreprises dont la CA est compris en 1 milliard de dollars et 500 millions de dollars.

Source du graphique : Recon analytics

Selon l’étude, le stockage dans le cloud devrait rester le principal vecteur de stockage pour l'IA, avec 65 % des données stockées dans le « nuage » plutôt qu'en interne en 2024
et 69 % en 2028. Les besoins en stockage devraient doubler au cours des trois prochaines années en mode hybride ou sur site.

La plupart des entreprises qui enregistrent et sauvegardent les points de contrôle le font sur une base quotidienne ou hebdomadaire sur le cloud. Cela concerne les organisations qui gèrent plus de 100 Po de données, considérant que la réplication des données améliore les résultats de l'IA de manière très significative.

Les besoins en énergie s’accroissent en conséquence

Un quart des répondants déclare cependant que la sécurité est prioritaire, suivie par 18 % pour le stockage. Deux d’entre eux sur trois classent le stockage parmi leurs quatre principales préoccupations en matière d'infrastructure. Bien noter que la consommation d’énergie due à l’IA croit aussi drastiquement, parallèlement à l’augmentation des capacités de stockage, un point qui ne peut être négligé et isolé d’un enjeu environnemental et technique global.

Une des pistes pour réduire le volume des données stockées est d’éliminer celles, très nombreuses, qui sont inexploitables. Un travail de gouvernance des données qui doit être sérieusement effectué par les intéressés.