Par René Thomas-Nelson, Capgemini

La voix, au travers des assistants vocaux, devient un canal privilégié de relation entre les utilisateurs et les services numériques. Avec une simplicité d’accès pour des interactions à usages rapides, il deviendra bientôt naturel de parler aux objets qui nous entourent…

La voix, le nouvel enjeu de l’expérience utilisateur

Ils s’appellent Google Home ou Amazon Alexa, ce sont des assistants vocaux, c’est-à-dire des objets que nous interrogeons ou qui nous interpellent par la voix. Et depuis quelques mois, ils rencontrent un succès considérable, des deux côtés de l’Atlantique. Qu’ont-ils en commun ? L’usage de la voix, tant pour être pilotés que pour répondre aux questions qui leurs sont posées. Un usage qui passe par une interface en langage naturel et ne demande quasi plus d’apprentissage, même si l’on est parfois troublé par l’absence de manipulation d’objet. Un usage qui met donc également en place de nouvelles façons d’interagir avec le monde qui nous entoure. Le Gartner a estimé que, d’ici à 2020, 30 % des recherches sur Internet se feront sans écran.

Ces premiers usages se sont révélés assez simples, voire limités, mais toujours marqués par le fait que la voix est intuitive et facile d’accès. C’est ainsi que l’on peut accompagner au téléphone un appelant sur un parcours scénarisé (« Pour obtenir un conseiller, tapez 1 ») ou répondre automatiquement à des questions simples (chatbots). Mais les usages se multiplient dans des domaines plus opérationnels par exemple, tels que pour accompagner la préparation des commandes ou la gestion des stocks dans les entrepôts. Ou encore en situation de handicap, pour interagir ou faire face à des actions pilotées par la voix.

C'est faire simple qui demande souvent le plus d'efforts

Si pour l’utilisateur, la voix simplifie son expérience avec de multiples choses, avec lesquelles nous pouvons dialoguer ou qui peuvent être pilotées, concevoir une solution qui part de la voix pour construire un canal de communication est tout sauf facile ! C’est même plutôt complexe si l’on souhaite offrir un service de qualité, ce que peu d’acteurs sont capables de faire. Cela nécessite en effet de développer et d’enrichir une intelligence pour à la fois traiter le langage et l’exploiter. Voilà pourquoi les acteurs capables d’offrir des capacités de reconnaissance vocale et une partie de l’IA (Intelligence Artificielle) nécessaires aux traitements des contextes sont si peu nombreux. Nous citerons Amazon, Google, IBM, ou Microsoft.

Faisant depuis longtemps l’objet de développements, nous rappellerons que, dès les années 80, nos chercheurs français étaient au cœur de nombreux projets de R&D sur la reconnaissance vocale - cette technologie a eu de nombreuses phases de déploiement. Aujourd’hui, de nombreuses expériences utilisateurs saisissent l’opportunité de s’attaquer à des usages simples, plus faciles et rapides à développer, et ne nécessitant aucun apprentissage.

La voix, demain

Même si l’usage de la voix ne cesse de se développer dans notre quotidien, personnel comme professionnel, il rencontre encore des freins au déploiement. Si l’interaction en langage naturel semble simple, sa conversion en actions efficaces est beaucoup plus difficile. Hors des scenarii figés, l’efficacité de modèles d’interaction intelligents reste complexe à faire vivre pour beaucoup de projets. La barrière des réglementations se renforce aussi régulièrement et la voix, comme toute donnée personnelle, est soumise aux règlementations sur le traitement des données personnelles (RGPD en particulier).

Deux exemples : le chatbot, soutenu par les directions marketing comme outil d’automatisation de la relation client, reste balbutiant et requiert encore beaucoup de travail pour développer une réelle intelligence. En réalité, il faut deux jours pour le brancher et des mois pour lui apporter de l’intelligence... Les centres d’appels, précurseurs dans l’utilisation de la voix pour interagir dans un parcours utilisateur, n’en sont toujours qu’à la reconnaissance du langage naturel pour qualifier un contexte et nous mettre en relation avec la bonne information ou le bon service. L’intelligence nécessaire pour construire un parcours bout en bout reste à développer.

Ces deux exemples nous démontrent que la voix s’impose sans difficulté là où il se révèle plus facile de parler pour interagir, ou pour des services difficiles à matérialiser au travers d’un écran. La généralisation du vocal dans les usages est de plus en plus importante dans des domaines d’interactions simples et naturelles : l’accompagnement des personnes âgées ou des enfants, l’éducation, l’industrie soumise à des process manuels. Ou encore le commerce de détail, une fois que la problématique de l’identification forte jusqu’au paiement aura été résolu. Et n’oublions pas que nous parlerons à notre voiture via l’intégration de services, ce qui nous permettra de converser facilement tout en ayant les mains occupées par le pilotage.

Développer un projet qui intègre la reconnaissance vocale

Si la reconnaissance vocale rencontre un certain succès aujourd’hui, c’est qu’elle a fait l’objet d’un long parcours nécessitant des capacités de R&D importantes. Quant à l’IA, utilisée de manière sous-jacente, elle demande des compétences à très haute valeur ajoutée. C’est pourquoi il se révèle difficile de lancer des projets en partant de zéro. D’ailleurs, il n’y en a quasiment pas !

Les entreprises qui se sont lancées ont été très tôt sensibilisées à la donnée et à son exploitation. Elles ont fait des choix en termes de compétences internes, tant vis-à-vis des objets connectés que des infrastructures nécessaires pour actionner les meilleures actions au travers de la voix. Mais en parallèle de la démarche technique, le plus important est aussi de construire une nouvelle expérience utilisateur, de se différencier de ses concurrents en réfléchissant aux cas d’usages au travers d’une interaction reposant uniquement sur la voix.

Une fois passées ces épreuves et implémentées les solutions qui les supportent, les usages de la voix pourront se multiplier, dans des directions restant à définir. Mais une de ces directions restera constante, c’est celle de capter au travers la reconnaissance vocale l’intention cliente.

Pour en apprendre plus sur les usages connectés avec nos clients et nos experts Capgemini, participez à la #CWIN18 à Paris mardi 16 octobre. Au programme : "Vers les objets autonomes - IA et IoT augmentent votre business." Inscriptions : https://www.capgemini.com/fr-fr/inscription-cwin-18 paris/?utm_source=itsocial&utm_medium=referral&utm_content=aie_none_none_event_none&utm_campaign=innovation_cwin