L’apprentissage automatique d’une l’IA montre encore ses limites dans plusieurs domaines. S’il permet actuellement aux ordinateurs d’identifier des visages ou interpréter des scans médicaux, la technique reste inefficace pour l’interprétation de contenus vidéo. La principale raison est que cette fonctionnalité nécessite une puissance de calcul beaucoup plus grande à cause du grand volume de données devant être traitées. Une équipe de chercheurs du MIT et IBM Watson AI Lab pensent avoir trouvé la solution. Il s’agit d’une nouvelle méthode permettant d’accélérer le processus d’apprentissage en réduisant la taille des modèles de reconnaissance vidéo. Si cette approche montre son efficacité, l’apprentissage automatique pourrait être supporté par des appareils de puissance plus modeste comme les mobiles. Pour arriver à un tel résultat, les chercheurs ont créé un module de décalage temporel. Celui-ci confère à l’IA une nouvelle perception du temps. Avec cette technique, ils ont réussi à multiplier par trois sa vitesse d’apprentissage automatique pour la reconnaissance vidéo. Les chercheurs vont présenter les détails de cette étude durant l’International conference on computer vision.
Selon Song Han, professeur assistant au MIT, cette découverte va surtout servir à rendre accessible la technologie de reconnaissance vidéo à tout le monde, via des périphériques de faible puissance. Selon ce dernier, la technique a l’avantage de consommer moins d’énergie et produit par conséquent moins de carbone. Certaines sociétés technologiques y trouveraient également un grand intérêt. Facebook et YouTube pourraient, par exemple, l’utiliser pour repérer les vidéos violentes ou à caractère terroriste. De leur côté, les institutions de service public comme les hôpitaux pourraient mieux sécuriser leurs données en utilisant les applications IA en local, plutôt que sur le cloud.