Il semble évident aujourd’hui que la stratégie en matière de données doit être étroitement alignée sur les objectifs généraux de l’entreprise. Cependant, seulement 13 % des entreprises parviennent à industrialiser l’analytique et de l’apprentissage automatique.
La capacité des organisations à générer des informations exploitables à partir des données, souvent en temps réel, est devenue un impératif de la plus haute importance stratégique. Pour les aider à s’orienter vers les données, les entreprises déploient des technologies de plus en plus avancées basées sur le cloud, notamment des outils analytiques dotés de capacités d’apprentissage automatique. Toutefois, la valeur de ces outils sera limitée si les données ne sont pas abondantes, de qualité et facilement accessibles.
Dans ce contexte, une gestion efficace des données est l’un des fondements d’une organisation axée sur les données. Mais l’un des principaux défis pour les organisations est de comprendre comment en tirer parti pour créer de la valeur commerciale. Au fur et à mesure que de nouvelles technologies de données apparaissent, le poids des systèmes hérités et des silos de données, la fragmentation de l’architecture sont des casse-tête pour de nombreux directeurs des données (CDO), en raison de la variété des outils sur site et dans le cloud utilisés par de nombreuses organisations.
Vitesse et mise à l’échelle défaillants
Outre la mauvaise qualité des données, ces problèmes se combinent pour priver les plateformes de données des organisations, et les modèles d’apprentissage automatique et d’analytique qu’elles prennent en charge, de la vitesse et de l’échelle nécessaires pour obtenir les résultats commerciaux souhaités. Selon une étude, Building a high-performance data and AI organization, menée par MIT Technology Review Insights pour Databricks, seulement 13 % des entreprises excellent dans la mise en œuvre de leur stratégie données.
« Ce groupe d’excellence restreint obtient des résultats métiers mesurables dans toute l’entreprise. Son succès provient de l’attention portée aux fondations d’une gestion et d’une architecture de données solides, qui permettent de “démocratiser” les données et de tirer de la valeur du machine learning », affirme le rapport.
Les trois priorités des entreprises pour la donnée
D’après les conclusions du rapport, les priorités des organisations en matière de données pour les deux prochaines années se répartissent en trois domaines, tous soutenus par une adoption plus large des plateformes cloud : améliorer la gestion des données, renforcer l’analytique et le ML par la donnée, et étendre l’utilisation de tous les types de données d’entreprise, y compris les données en continu et non structurées. Le cloud, autrefois considéré comme un environnement technologique optionnel, est aujourd’hui le fondement de la modernisation de la gestion des données : 63 % des personnes interrogées utilisent largement les services ou l’infrastructure du cloud dans leur architecture de données.
« Cependant, la mise à l’échelle des cas d’utilisation du ML est extrêmement complexe pour de nombreuses organisations », explique le rapport. Le défi le plus important, selon 55 % des répondants, est l’absence d’un lieu central pour stocker et découvrir les modèles ML. Cette absence, ainsi que les erreurs de transfert entre la science des données et la production et le manque de ressources qualifiées en ML, tous deux cités par 39 % des personnes interrogées, suggèrent qu’il est très difficile de faire de la collaboration entre les équipes ML, données et utilisateurs une réalité.
À propos de l’étude :
Building a high-performance data and AI organization est un rapport de MIT Technology Review Insights sponsorisé par Databricks. Pour produire ce rapport, MIT Technology Review Insights a mené une enquête mondiale auprès de 351 chief data officers, chief analytics officers, chief information officers, et autres cadres supérieurs des technologies. Les répondants étaient répartis entre les régions Amérique du Nord, Europe et Asie-Pacifique. Quatorze secteurs étaient représentés dans l’échantillon et tous les répondants travaillent dans des organisations dont le chiffre d’affaires annuel est égal ou supérieur à un milliard de dollars.