En partie grâce aux smartphones et aux assistants numériques, la technologie de reconnaissance vocale s’est fortement améliorée, au point que nous pouvons enfin sérieusement envisager de piloter les ordinateurs et les chaînes logistiques à la voix.

Il n’y a pas si longtemps, pour fonctionner correctement les utilisateurs de commandes vocales devaient procéder à un apprentissage parfois long, régulièrement soumis à des redites et des annulations, pour au final un résultat plutôt décevant. Au point que la technologie de reconnaissance vocale est encore aujourd’hui considérée comme peu fiable, car soumise à de nombreuses erreurs. Et surtout réservées à des personnes identifiées ayant eu le temps de procéder à l’adaptation des programmes à leur voix.

Désormais, les équipes de développement des solutions de commande vocale - chez Amazon, Apple, Google, IBM ou Microsoft, pour ne citer que ceux-là - sont arrivées à augmenter sensiblement la précision de la reconnaissance. Chez Google, par exemple, le taux d’erreur serait aujourd’hui de 4,9%, soit environ une erreur tous les 20 mots. La progression est faible en la matière, en revanche la technologie ne nécessite plus, sauf exception, d’adaptation à la voix du locuteur.

Si le taux d’erreur devient raisonnable, les problématiques demeurent

Plusieurs problématiques, cependant, ne sont pas résolues, en particulier la commande vocale dans un milieu bruyant. Une solution technique simple serait de doubler les microphones intégrés aux équipements, afin de croiser la source de la voix. Mais la course à la minceur sur les PC portables, les tablettes, les smartphones, et plus généralement les équipements connectés, ne favorise pas cette approche. D’ailleurs, rares sont les équipements dont le design dispose de 2 micros. Les constructeurs doivent encore travailler avant de supprimer la frustration de l’erreur.

D’autres problématiques portent sur les synonymes et le manque de contexte. En dépit des progrès récents, la technologie affiche encore des lacunes. Et les éditeurs comme les fabricants continuent d’investir massivement pour atténuer puis résoudre ces problèmes. Microsoft, par exemple, propose de faire appel à des groupes pour ‘former’ la reconnaissance vocale en l’exposant à certains aspects d’usage afin de mieux fonctionner.

Des avantages aujourd’hui démontrés. Exemples...

Mais ce sont surtout les gains de temps et de productivité qui poussent les entreprises à regarder du côté de la commande vocale. Au Canada, la Police a réduit de 85% le temps de saisie des rapports des policiers. Un gain de temps qui, de l’avis des utilisateurs, pourrait être encore plus important si l’environnement d’exécution, les fameux ‘bruits de fond’, pouvait être amélioré.

Dernier exemple pour prendre la dimension du phénomène : le commerce de détail. Peu importe l’activité du magasin, le client a toujours besoin de poser des questions et attend une réponse rapide. C’est un domaine qui se révèle vite stressant. Imaginons maintenant le client, ou le vendeur, qui interroge vocalement, et la réponse qui lui vient automatiquement sur le même mode. Réponses aux questions, conseils d’utilisation, état du stock, taille et couleur, localisation du produit disponible, commande automatisée, impression ou transfert du contrat, signature dématérialisée… Le vendeur peut se décharger de tous ces processus pour se consacrer à ce qui apporte de la valeur : la personnalisation du contact et de l’offre au client.

Même si des progrès restent à faire, le potentiel de la voix est évident et c’est l’avenir de la commande…

Image d’entête 485190787 @ iStock Ellagrin