Les pirates utilisent désormais des technologies dérivées de l'Intelligence Artificielle pour créer une synthèse vocale ou générer de la parole de type humain, qui peuvent ensuite être utilisées pour ignorer les étapes d'authentification et contourner la sécurité vocale.

Avec la voix qui constitue de plus en plus la principale interface technologique avec le client, remplaçant le toucher, nous sommes entrés dans une économie conversationnelle. Avec les chatbots et les assistants vocaux, la voix prend le relais et affiche une réelle popularité. Connectée via l'IoT, la reconnaissance vocale permet ainsi aux consommateurs de contrôler différents aspects de leur vie quotidienne et professionnelle.

Dans le même temps, la voix ouvre un nouvel espace de risque. Se pose en effet le problème de l’identification du locuteur à partir d'un ensemble donné sur la base d'un échantillon audio. Surtout lorsque l’interface vocale est ouverte à tous. La vérification du locuteur est un véritable problème.

Ajoutons à cela qu'aujourd’hui, certains programmes permettent, parfois en une minute, de créer une voix artificielle réaliste. En 20 minutes, le logiciel Adobe Voco crée des paroles synthétiques dont la qualité sonore peut tromper la sécurité vocale. Les pirates peuvent également accéder à des applications comme Google Duplex, une IA (Intelligence Artificielle) destinée à l’assistant vocal de Google capable d’effectuer des appels et de dialoguer avec un humain...

Les taux d’erreurs de la sécurité vocale

Comment détecter et se protéger des attaques par usurpation de la voix, y compris les attaques d'enregistrement et de lecture, ainsi que la détection de la parole synthétique ? L'exactitude de la biométrie vocale repose sur les taux de fausses acceptations, de faux rejets et d'erreurs.

  • Le taux de fausses acceptations est la probabilité que le système authentifie de manière incorrecte une personne non autorisée en raison d'une correspondance incorrecte entre la voix d'un appelant et une empreinte vocale pour un compte. C’est donc le pourcentage d’appels non-valides mal authentifiés.
  • Le taux de rejets erronés est la probabilité que le système rejette de manière incorrecte l'accès à un appelant autorisé, faute de correspondance entre l'entrée biométrique et une empreinte vocale pour un compte. C’est donc le pourcentage d’appels valides rejetés de manière incorrecte.
  • Le taux d'erreurs indique la proportion de fausses acceptations par rapport à la proportion de faux rejets. Plus la valeur du taux d'erreurs est faible, plus la précision du système biométrique est élevée. Il serait cependant trompeur de ne compter que sur ce dernier pourcentage lors de l'évaluation d'une solution biométrique vocale...

Authentification et sécurité vocale

Face à l'augmentation des taux de fraudes, en particulier sur les téléphones, l'authentification et la sécurité vocales sont devenues un objectif important. Les entreprises veulent s'assurer qu'elles disposent de la technologie permettant de distinguer un client légitime d'un fraudeur. Le futur des technologies vocales repose certainement sur la capacité à assurer la sécurité vocale du client.

Il est temps de prendre conscience qu’à chaque avancée dans la communication voix-à-machine, l'interaction devient plus humaine, élargissant les types d'opportunités pour la voix en tant qu'interface. Ce qui par conséquent dessine un nouveau champ de bataille qui augmente le potentiel d'attaques...

Image d’entête 806376134 @ iStock Jane_Kelly