Reposez-vous sur … vos assistants vocaux

Les assistants vocaux (Amazon Echo ou Google Home) encore principalement utilisés pour l’écoute de musique en streaming et la recherche d’informations deviendront un des principaux modes d’interaction client au cours des trois prochaines années.

Avec un potentiel de croissance des achats réalisés via cette technologie de 500%…

assistant vocal
assistant vocal

« Depuis la nuit des temps l’Homme a commandé par la voix ».

La reconnaissance vocale

Technique informatique qui permet d’analyser la voix humaine captée au moyen d’un microphone pour la transcrire sous la forme d’un texte exploitable par une machine.

On parle depuis longtemps aux objets, notamment en les insultants quand ils dysfonctionnent. Mais tous n’ont pas, comme les assistants vocaux, à l’image du miroir magique de Blanche Neige, la capacité de nous répondre ou de prédire l’avenir. « Parler aux objets relève d’un côté magique », comme si le simple fait d’énoncer quelque chose nous faisait espérer une performativité de la parole ». Hubert Guillaud

La biométrie vocale permet de reconnaître un individu par sa voix, et peut apporter de nombreuses applications dans le domaine du marketing et du commerce. Les outils de biométrie et de reconnaissance vocale ouvrent ainsi de nouvelles opportunités dans la prospection et dans la relation client :

  • identifier plus simplement un individu pour l’accès à son compte ou à des paiements ;
  • reconnaître un client lors d’un appel entrant sur un centre de contact ;
  • personnaliser une offre ;
  • accéder rapidement à son historique.

Une technologie vocale de reconnaissance de mots retranscrit alors les sons entendus à l’écrit. La phrase recomposée sera ensuite étudiée par un processus d’analyse sémantique, le « natural language understanding », afin d’en extraire  les intentions – ce que souhaite savoir ou faire l’utilisateur (acheter un produit, connaître les prévisions météo…) – et les entités permettant de préciser la demande (le lieu, le temps…). De quoi déterminer l’intention de l’utilisateur.

L’empreinte vocale créée par les utilisateurs remplace le code secret et permet de gagner un temps considérable. Plus besoin de chercher un mot de passe compliqué, on prononce une phrase clé « passphrase », pour accéder directement au service.

Les empreintes vocales sont évidemment stockées sur bande, de manière sécurisée. Ce n’est pas la voix de l’utilisateur qui est enregistrée, mais un « gabarit », c’est-à-dire un ensemble des caractéristiques physiologiques et comportementales qui font l’unicité d’une voix.

Vous pouvez dicter du texte à votre PC Windows pour remplir des formulaires en ligne ou dicter du texte dans un programme de traitement de texte, tel que WordPad, afin de taper une lettre.

De grandes entreprises se tournent vers la biométrie vocale pour:

  • simplifier les interactions avec leurs clients ;
  • diminuer les fraudes par usurpation d’identité ;
  • réduire les coûts (un téléphone suffit).

En cas de tentative d’intrusion, par une bande sonore, il est mis en place  des processus de validation (historique) qui permettent de comparer une soumission aux précédentes. S’il y a trop de différences, celle-ci est rejetée.

l'assistance vocale
l’assistance vocale

Historique de la reconnaissance vocale :

  • 1952 : reconnaissance des dix premiers chiffres par un dispositif électronique câblé, afin de faciliter la commutation téléphonique. (Bell Laboratorie) ;
  • 1960 : utilisation des méthodes numériques ;
  • 1961 : IBM Shoebox capable de reconnaître 16 mots ;
  • 1965 : reconnaissance de phonèmes en parole continue ;
  • 1968 : reconnaissance de mots isolés par des systèmes implantés sur gros ordinateurs (jusqu’à 500 mots) ;
  • 1971 : lancement du projet ARPA aux États-Unis (15 millions de dollars) pour tester la faisabilité de la compréhension automatique de la parole continue avec des contraintes raisonnables ;
  • 1972 : premier appareil commercialisé de reconnaissance de mots ;
  • 1978 : commercialisation d’un système de reconnaissance à microprocesseurs sur une carte de circuits imprimés ;
  • 1983 : première mondiale de commande vocale à bord d’un avion de chasse en France ;
  • 1985 : commercialisation des premiers systèmes de reconnaissance de plusieurs milliers de mots ;
  • 1986 : lancement du projet japonais ATR de téléphone avec traduction automatique en temps réel ;
  • 1990 : Dragon lance Dragon dictate
  • 1993 : Esprit project SUNDIAL ;
  • 1996 : Microsoft introduit CLIPPY
  • 1997 : La société Dragon lance « Naturally speaking », premier logiciel de dictée vocale ;
  • 2008 : Google lance une application de recherche sur Internet mettant en œuvre une fonctionnalité de reconnaissance vocale ;
  • 2011 : Apple propose l’application Siri sur ses téléphones ;
  • 2012 : Google lance GOOGLE Now;
  • 2013 : Microsoft lance CORTANA;
  • 2015 : Amazon lance AMAZON ECHO et ALEXA;
  • 2016 : Amazon lance ECHO DOT et AMAZON TAP;
  • 2016 : Google lance GOOGLE HOME;
  • 2017 : Samsung lance BIXBY;
  • 2017 : Microsoft annonce égaler les performances de reconnaissance vocale des êtres humains;
  • 2017 : Amazon lance ECHO LOOK et ECHO SHOW;
  • 2017 : Alibaba lance GENIE X1.

Des assistants vocaux :

Siri : Les origines de Siri sont militaires. Ce qui a présidé à la naissance de Siri est un défi de la Darpa lancé en 2003 et arrêté en 2008 pour créer un assistant pour aider le commandement militaire dans les cas de surcharge cognitive :

Amazon, Google, Apple et Microsoft misent gros sur ces services vocaux qui permettent de gérer tout à la voix – de la playlist à la liste de courses ou à l’intensité de l’éclairage – sans avoir à toucher le moindre appareil électronique.

À la différence du téléphone ou de l’ordinateur où l’utilisateur interagit physiquement avec l’appareil, on parle parfois d’«interface ambiante» l’Echo d’Amazon, le Google Home ou le nouveau Homepod d’Apple captent le son en permanence et il suffit d’un mot-clé lancé à la cantonade pour que l’appareil réponde. L’interaction devient, de fait, invisible et presque subconsciente.

En France, quatre banques testent actuellement ce type de technologies : le Crédit Lyonnais, la Société Générale, BNP Paribas et la Banque Postale.

En association avec l’intelligence artificielle

Vous pouvez demander à Alexa, à l’Assistant Google ou à Siri : quelle est la température avant de sortir ou vous demander si vous avez besoin d’un parapluie. Les assistants vocaux peuvent également lire les instructions pour réaliser une recette ou régler la minuterie lorsque vos mains sont occupées dans la cuisine. Ils peuvent aussi vous jouer de la musique apaisante après une longue journée . Si vous avez des appareils ménagers intelligents, vous pouvez les contrôler avec votre voix au lieu de devoir sortir du lit ou du canapé pour allumer et éteindre les lumières.

Des hauts parleurs intelligents :

Nous avons déjà le choix entre :

  • le Home Mini et le Home Max ;
  • Apple et ses des enceintes intelligentes AI avec son HomePod.
  • Libratone lui enchaine le pas avec Zipp 2 et Zipp mini 2
  • Samsung cherche à faire son propre haut-parleur intelligent tôt ou tard avec son assistant vocal Bixby.

Nombre de produits peuvent se connecter aux assistants d’Amazon:

Phillips Hue, serrures intelligentes de Schlage, produits intelligents de TP-Link, Leviton, insteaon, SmartThings,, Caseta sans fil, ampoules intelligentes de LI-FX, ampoules intelligentes de lien de GE, WeMo, bougies intelligentes d’iHome, commutateurs iDevices , Nest, Thermostat Sensi, Thermostat EcoBee, Thermostat Lyric, Verrouillage intelligent Arlo Pro, Nest Cam IQ, Arroseurs Rachio, Porte de garage Gargeio, Aspirateurs intelligents Roomba iRobot.

Téléviseurs et haut-parleurs compatibles avec Chromecast, Nest, SmartThings, Phillips Hue, Lumières intelligentes LIFX, Home Smart TP-Link, Vivint Home Security, Sprinkleurs Rachio, Logitech Harmony, Tech connectée Geeni, Serrures intelligentes August, Anova Precision Cuisinière, prise Smart Wi-Fi Insignia, prise intelligente. Belkin WeMo Insight, iRobot Roomba 960, thermostat Wi-Fi Honeywell, machine à café intelligente Mr. Coffee, Lutron, L’assistant vocal favorise en effet l’usage d’un service par fonction : en interagissant sans écran, par la seule voix, difficile de zapper constamment entre un Spotify et un Deezer ou entre Lyft et Uber. L’internaute devant son écran devait opérer un choix conscient pour un site ou une app. : dans une interface vocale, ce choix disparaît.

Selon une étude de Capgemini *:

  • c’est la tranche des 33-45 ans qui a le plus d’appétence pour les assistants vocaux ;
  • 28% des personnes qui ne sont pas encore équipées d’un assistant vocal se déclarent disposées à interagir davantage en mode vocal avec une marque après une expérience positive et sont même prêtes à dépenser 5% de plus ;
  • 24% des personnes interrogées privilégieraient volontiers l’assistance vocale plutôt qu’un site Internet :

*(étude du Digital Transformation Institute de Capgemini, pour laquelle plus de 5 000 consommateurs ont été interrogés aux États-Unis, au Royaume-Uni, en France et en Allemagne).

Mais faites attention aux assistants vocaux:

le New York Times révélait qu’un logiciel espion Alphonso, qui se cachait sur 250 jeux téléchargeables sur le magasin en ligne d’Android (mais également  sur l’Apple Store), enregistrait ce que les gens regardaient à la télé. Ces informations étaient ensuite envoyées à des agences qui ciblent spécifiquement les consommateurs. Le tout à l’insu des possesseurs de Smartphone.

La Quadrature du Net rappelait que les bandes d’enregistrement vocales basées sur des données récoltées par Cortana, l’assistant vocal de Microsoft, étaient non seulement conservées – au moins en partie – mais qu’en plus elles étaient potentiellement réécoutées et traitées par des êtres humains. Les assistants vocaux sont présentés comme un outil de modernité parce qu’ils faciliteraient les recherches sur le web et l’usage d’autres technologies dans la maison (lumières, télévision, musique…). Ils symbolisent également une société de la vitesse où chaque petit geste doit faire l’usage d’une technologie.

Prospective

Aujourd’hui, les assistants vocaux comprennent en moyenne 90% des requêtes qui leur sont adressées. Le cap des 95%, synonyme d’une adoption massive, devrait être franchi en 2020.

Ces technologies ouvrent de nouvelles perspectives pour des marchés très lucratifs, notamment le e-commerce, la vente des données personnelles enregistrées 24 heures sur 24 via les recherches vocales, mais aussi la mise en place de publicités qui seront à l’avenir de plus en plus intrusives, puisqu’elles pourront à terme passer via les enceintes.

  • 21
  •  
  •  
  •  
  • 1
  •  
  •  
  •  
  •  
  •  
    22
    Partages

Reply

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.