Amazon is begonnen aan een zoektocht om hun stemassistent Alexa een meer menselijke expressiviteit te geven. Deze recente upgrade geeft Alexa een door AI aangedreven vermogen om op klanten te reageren met een emotionele variatie in relatie tot de toon of zin van de gebruiker. Een dergelijke stapsgewijze aanpak heeft tot doel om voorbij de typische robotachtig klinkende reacties te gaan naar een natuurlijker, boeiender gesprek.

Deze doorbraken zijn tot stand gekomen als onderdeel van het updaten van de spraak-naar-spraak-engine die Alexa gevoeliger maakt voor de emoties en stemintonatie van de gebruiker. De output is een spiegelreflectie van de toon van de gebruiker, waardoor de interactieve ervaring persoonlijker en herkenbaarder aanvoelt.

Het bedrijf bood een voorproefje van de minder mechanische en meer expressieve stem van Alexa. De functionarissen benadrukten dat de verbeteringen te danken zijn aan grote transformatoren die zijn getraind in verschillende accenten en talen, waardoor de expressievere Alexa wordt aangedreven.

Gebruikers kunnen een conversatiewending verwachten waarbij Alexa past bij de stemming van de gebruiker. Bijvoorbeeld door een opwindende sportupdate over de overwinning van het favoriete team van de gebruiker met een uitbundige stem door te geven en een verslagen update over te brengen met een zachtere empathische toon. Het omgaan met deze emotionele ondertonen kan een meeslepende gesprekservaring opleveren die de interactie van gebruikers met hun AI-stemassistenten opnieuw kan definiëren.

Amazon's SVP van Alexa, Rohit Prasad, sprak over het under-progress-model, met de codenaam speech-to-speech. Dit model werkt aan enorme transformatoren en is bedoeld om een ​​fundamentele verandering teweeg te brengen in het klantinteractieproces. In plaats van de boodschap over te brengen door de stem van de klant in tekst om te zetten, streeft het model ernaar deze acties samen te voegen, wat zou resulteren in een rijkere communicatie-ervaring.

Deze innovaties maken gebruik van het Large Text-to-Speech (LTTS) en Speech-to-Speech (S2S)-mechanisme van Amazon. Terwijl LTTS de reactie van Alexa acclimatiseert op basis van het verzoek van de gebruiker, voegt de S2S een nieuwe laag audio-invoer toe. Dit helpt Alexa om haar reactie te manipuleren met een meer betekenisvolle gespreksrijkdom, legt Amazon uit.

Eenmaal gelanceerd, zal Alexa eigenschappen als lachen en verrassing nabootsen, en normale uitingen vertonen zoals 'uh-huh', waardoor gebruikers worden aangemoedigd het gesprek te verlengen, net als bij een echte dialoog. Dit is een voorbeeld van de voortdurende inspanningen van bedrijven als Amazon om door AI aangedreven stemassistenten menselijker te maken, waardoor meer interactieve en meeslepende gebruikersinterfaces ontstaan. Het is een intrigerende vergelijking met platforms als AppMaster waarmee klanten de gebruikersinterface en de bedrijfslogica van apps visueel kunnen creëren en verbeteren, wat bewijst hoe technologiebedrijven voortdurend de grenzen verleggen om de gebruikersinteractie en betrokkenheid te verbeteren.

Deze verbeteringen in Alexa Amazon's laten zien hoe ingenieurs ernaar streven de functionaliteit van de stemassistent te verbeteren en deze minder robotachtig en levensechter te maken. Een meer interactieve Alexa kan gebruikers aanmoedigen de stemassistent vaker te gebruiken, waardoor waardevolle gegevens voor Amazon worden gegenereerd en de weg wordt vrijgemaakt voor AI-technologie om meer grip te krijgen in ons dagelijks leven.