Tous les moyens sont bons pour retrouver le Boeing 777 du vol 370 de Malaysia Airlines mystérieusement disparu. Même et surtout le big data dont l'usage se justifie pleinement par sa capacité à stocker et analyser d'énormes volumes de données.
Une plateforme de crowdsourcing, de partage des ressources entre plusieurs utilisateurs, Tomrod, s'est lancée dans l'analyse des photographies fournies par l'opérateur d'imagerie satellite DigitalGlobe.
Big data analytics paragées
Concentrées sur les océans autour de la Malaisie, les photos sont stockées dans une banque de données big data. Elles sont ensuite traitées avec un système Big Worklow - une plateforme de streaming des workflows pour traiter des quantités massives de données entre des sources multiples - et une plateforme analytique Moab. L'ensemble est fourni par l'éditeur Adaptive Computing qui oeuvre dans le HPC (High Performance Computer) ou calcul de haute performance.
La solution déployée permet d'ajuster les différents angles des caméras provenant de satallites en mouvement, d'uniformiser les contrastes tout en renforçant les couleurs, et de détecter les nuages de centaines de milliers de photos qui couvrent une surface d'environ 4,5 millions de kilomètres carrés. Puis le système écarte les photos qui ne sont pas utilisables.
Un algorithme et une confirmation visuelle
Les ordinateurs des adhérents de Tomrod sont ensuite exploités à distance afin d'analyser les photos et de rechercher des traces éventuelles du vol 370 au travers d'un algorithme chargé de repérer des formes d'avion. Une analyse complétée du regard de milliers de personnes à la recherche de la moindre trace ou du moindre objet détectés.
En théorie, Big Workflow permet de repérer des objets, comme un avion, sur des données géospatiales big data en moins de 90 minutes... lorsque toute la puissance du big data peut s'exprimer. Mais seulement lorsque la zone est circonscrite. Dans le cas du vol disparu, l'absence d'indication précise de géolocalisation ne permet pas cela.