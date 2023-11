Amazon s'est lancé dans une quête pour doter son assistant vocal Alexa d'une expressivité plus humaine. Cette récente mise à niveau confère à Alexa une capacité alimentée par l'IA à répondre aux clients avec une variation émotionnelle par rapport au ton ou à la phrase de l'utilisateur. Une telle approche progressive vise à aller au-delà des réponses typiques à consonance robotique vers une conversation plus naturelle et plus engageante.

Ces avancées font partie de la mise à jour du moteur de synthèse vocale qui rend Alexa plus sensible aux émotions et à l'intonation de la voix de l'utilisateur. Le résultat est un reflet miroir du ton de l'utilisateur, garantissant que l'expérience interactive semble plus personnalisée et plus accessible.

La société a offert un aperçu de la voix moins mécanique et plus expressive d'Alexa. Les responsables ont souligné que les améliorations sont dues à de grands transformateurs entraînés sur différents accents et langues, alimentant ainsi Alexa, plus expressive.

Les utilisateurs peuvent s'attendre à une tournure de conversation où Alexa correspond à l'humeur de l'utilisateur. Par exemple, en relayant une mise à jour sportive passionnante sur la victoire de l'équipe préférée de l'utilisateur avec une voix exubérante et en transmettant une mise à jour vaincue avec un ton empathique adouci. Gérer ces nuances émotionnelles peut offrir une expérience conversationnelle immersive qui peut redéfinir l'interaction des utilisateurs avec leurs assistants vocaux IA.

Rohit Prasad, vice-président directeur d'Alexa chez Amazon, a parlé du modèle en cours de développement, baptisé discours-parole. Ce modèle fonctionne sur d’énormes transformateurs et vise à apporter un changement fondamental dans le processus d’interaction client. Au lieu de relayer le message en convertissant la voix du client en texte, le modèle vise à fusionner ces actions pour aboutir à une expérience de communication plus riche.

Ces innovations exploitent les mécanismes Large Text-to-Speech (LTTS) et Speech-to-Speech (S2S) d'Amazon. Tandis que LTTS acclimate la réponse d'Alexa en fonction de la demande de l'utilisateur, le S2S ajoute une nouvelle couche d'entrée audio. Cela aide Alexa à manipuler sa réponse avec une richesse conversationnelle plus significative, explique Amazon.

Une fois lancée, Alexa imitera des attributs tels que le rire et la surprise, et affichera des énoncés normaux comme « uh-huh », encourageant les utilisateurs à prolonger la conversation comme un dialogue réel. Cela illustre les efforts continus déployés par des entreprises comme Amazon pour humaniser les assistants vocaux basés sur l’IA, en proposant des interfaces utilisateur plus interactives et immersives. Il s'agit d'une comparaison fascinante avec des plates-formes comme AppMaster qui permettent aux clients de créer visuellement et d'améliorer la logique métier de l'interface utilisateur et des applications, prouvant ainsi comment les entreprises technologiques repoussent continuellement les limites pour améliorer l'interaction et l'engagement des utilisateurs.

Ces améliorations apportées à Alexa Amazon's montrent comment les ingénieurs s'efforcent d'améliorer les fonctionnalités de l'assistant vocal et de le rendre moins robotique et plus réaliste. Une Alexa plus interactive pourrait encourager les utilisateurs à utiliser l'assistant vocal plus fréquemment, générant ainsi des données précieuses pour Amazon et ouvrant la voie à la technologie de l'IA pour gagner davantage de terrain dans notre vie quotidienne.