Comment choisir une solution de Data Science pertinente, capable de générer suffisamment de valeur pour faire la différence ? Une infographie réalisée par Dataiku s’est intéressée aux principales erreurs qui pénalisent la réalisation d’un projet test autour du Big data.

Pour choisir une solution de Data Science, la majorité des entreprises vont d’abord réaliser un Proof-of-Concept (POC) afin de tester leur idée. Cette étape incontournable de la plupart des projets IT, en Data Science comme ailleurs, vise à vérifier la pertinence de la solution face aux problématiques rencontrées dans l’entreprise.

Un taux d’échec des POC en Big Data très élevé

Pourtant en pratique, de nombreux POC échouent et n’aboutissent à rien de concret. Seuls 38% des POC en Big Data réussissent, selon une étude menée par Cap Gemini il y a quelques années. Ce taux d’échec élevé représente un problème, aussi bien pour les organisations que pour les fournisseurs, qui gaspillent tous deux leur temps et leurs ressources.

Recommandations pour réussir un POC, en Big data et ailleurs

Comment faire pour éviter les pièges classiques ? Dans cette infographie, Dataiku propose quelques pistes, dont la plupart s’appliquent également aux POC dans d’autres domaines :

  1. Choisir un vrai cas d’usage, concret et bien délimité. Nul ne peut espérer des résultats probants à partir d’un vague projet.
  2. Prévoir un laps de temps limité : un POC n’a pas vocation à s’étaler dans le temps, juste à évaluer la faisabilité et la valeur potentielle d’un projet envisagé.
  3. Ne pas savoir quels objectifs on souhaite atteindre. Pour évaluer le succès d’un POC, il faut des critères précis et vérifiables, déterminés à l’avance.
  4. Allouer trop peu de monde à la réalisation du POC : si seul un ou deux collaborateurs travaillent dessus, et seulement quand ils ont le temps, il est peu probable de voir le POc aboutir.
  5. Allouer trop de monde est également une cause d’échec, car cela dilue les responsabilités et freine les décisions.
  6. Ne pas mettre le projet autour des données en production. Sans tester le projet sur de vraies données de production, la pertinence d’une solution ne peut pas réellement être évaluée.

01

Source : Dataiku