Dans l'informatique et l'industrie, cet écart entre le projet pilote et la production signifie non seulement une inefficacité et un mécontentement parmi les équipes de data scientists, mais également une énorme perte de temps, d'efforts et d’opportunité de croissance pour les entreprises.
Le BYOM enrichit « la boite à outils » des data scientists
Le BYOM, est basé sur l'idée que les data scientists peuvent utiliser leurs outils et langages familiers dans l'environnement de développement et d'opérationnalisation de leur choix. Cette approche offre ainsi une expansion significative de leurs possibilités en matière de développement et de fourniture de modèles.Dorénavant, les data scientists peuvent développer et former des modèles dans le langage et la technologie de leur choix (tel que Python, R, SAS et autres). Ce code, y compris le modèle analytique, est converti en formats dits d'échange (PMML, ONNX).
Ces formats peuvent ensuite être importés en base de données et mis en production sur de gros volumes de données. Le format d'échange peut comprendre non seulement le modèle analytique, mais aussi toutes les étapes de préparation des données. La problématique fréquente de mise à l’échelle lors du passage en production est ainsi résolue.
Toutefois, lorsque les data scientists développent des modèles, le but n’est pas seulement de trouver une solution intéressante au problème métier, mais aussi de réduire l’écart entre le développement des modèles en phase pilote et leur déploiement réussi dans l’environnement de production.
En développant et en intégrant leurs propres modèles, les data scientists peuvent garantir que les modèles sont intégrés aux opérations métiers et utilisés pour créer une réelle valeur ajoutée minimisant les risques lors de la création et de l’opérationnalisation des modèles.
Comme le BYOM permet aux data scientists de travailler dans leur environnement familier même après le déploiement, ils conservent le contrôle total sur l'ensemble du processus de développement de leurs modèles, et puisqu’il n’y a pas de rupture technologique à préparer pour le passage en production, ils économisent un temps précieux. À long terme, cela peut conduire à des économies importantes sur les coûts de développement.
De tels modèles personnalisés ont donc plus de chances de réussir dans l'environnement de production, en réalisant le potentiel de valeur de l'analyse et de l'IA.
Le BYOM, un attrait pour les data scientists
Le BYOM est également vu comme un argument pour attirer ou retenir des experts très recherchés, tels que les data scientists. Il fait office d’« argument de vente » dans la description de poste, car ils peuvent travailler exactement avec les outils et les langages auxquels ils sont habitués et qu'ils connaissent le mieux, évitant ainsi des dépenses supplémentaires, comme un réapprentissage fastidieux d’autres langages de programmation. Compte tenu de la pénurie mondiale de spécialistes en informatique, le BYOM est dans tous les cas un investissement rentable.Aussi le BYOM possède un potentiel d'innovation énorme. De nouvelles approches peuvent être testées indépendamment de fournisseurs externes sans longs cycles de développement ou de mise en œuvre. Par exemple, les modèles d’IA développés en interne et formés individuellement pour une entreprise peuvent être facilement opérationnalisés et développés en continu avec les dernières découvertes, données et technologies ainsi que les commentaires du terrain.
Il en résulte des solutions d'IA personnalisées, différenciées et donc mieux adaptées aux exigences spécifiques des utilisateurs et des entreprises. Cette agilité et cette capacité d'innovation permettent d'expérimenter de nouvelles idées, de répondre avec des solutions personnalisées et de s'adapter plus rapidement aux exigences en constante évolution du marché.
Le BYOM a tout pour séduire les data scientists qui souhaitent exploiter tout leur potentiel : l’usage d’un environnement familier et de langages familiers. Et les avantages à la clé sont nombreux allant d’une meilleure efficacité et productivité accrue et l’augmentation de la satisfaction des employés. Les résultats des data scientists sont enfin utilisés à bon escient et l'écart entre le pilote et la production comblé.
Par Pierre Maussion, Senior Solution Engineer chez Teradata