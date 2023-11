Amazon podjął wysiłki, aby nadać swojej asystentce głosowej Alexie ekspresję bardziej ludzką. Dzięki tej niedawnej aktualizacji Alexa może reagować na potrzeby klientów w przypadku zmian emocjonalnych związanych z tonem lub frazą użytkownika. Takie stopniowe podejście ma na celu wyjście poza typowe reakcje brzmiące jak roboty i przejście do bardziej naturalnej, wciągającej rozmowy.

Te przełomowe odkrycia nastąpiły w ramach aktualizacji silnika zamiany mowy na mowę, dzięki któremu Alexa jest bardziej wrażliwa na emocje użytkownika i intonację głosu. Wynik jest lustrzanym odbiciem tonu użytkownika, dzięki czemu interaktywne wrażenia są bardziej spersonalizowane i powiązane.

Firma rzuciła okiem na mniej mechaniczny i bardziej wyrazisty głos Alexy. Urzędnicy podkreślili, że ulepszenia wynikają z dużych transformatorów wyszkolonych w zakresie różnych akcentów i języków, co napędza bardziej ekspresyjną Alexę.

Użytkownicy mogą przewidzieć zwrot akcji, w którym Alexa dopasuje się do nastroju użytkownika. Na przykład poprzez przekazywanie ekscytujących wiadomości sportowych na temat zwycięstwa ulubionej drużyny użytkownika za pomocą energicznego głosu i przekazywanie wiadomości o porażce za pomocą miękkiego, empatycznego tonu. Radzenie sobie z tymi podtekstami emocjonalnymi może zapewnić wciągające doświadczenie konwersacyjne, które może na nowo zdefiniować interakcję użytkowników z asystentami głosowymi AI.

Rohit Prasad, wiceprezes Amazona w firmie Alexa, mówił o modelu, który nie jest jeszcze w fazie rozwoju, o kryptonimie „mowa na mowę”. Model ten działa na ogromnych transformatorach i ma na celu dokonanie zasadniczej zmiany w procesie interakcji z klientem. Zamiast przekazywać komunikat poprzez konwersję głosu klienta na tekst, model ma na celu połączenie tych działań, co zaowocuje bogatszą komunikacją.

Innowacje te wykorzystują mechanizmy Amazon Large Text-to-Speech (LTTS) i Speech-to-Speech (S2S). Podczas gdy LTTS dostosowuje reakcję Alexy do żądań użytkownika, S2S dodaje nową warstwę sygnału dźwiękowego. Pomaga to Alexie manipulować jej odpowiedzią, zapewniając bardziej znaczące bogactwo konwersacji, wyjaśnia Amazon.

Po uruchomieniu Alexa będzie naśladować takie cechy, jak śmiech i zdziwienie, oraz będzie wydawać normalne wypowiedzi, takie jak „aha”, zachęcając użytkowników do przedłużania rozmowy tak, jak w przypadku dialogu w prawdziwym życiu. Stanowi to przykład ciągłych wysiłków firm takich jak Amazon na rzecz humanizacji asystentów głosowych wykorzystujących sztuczną inteligencję, zapewniając bardziej interaktywne i wciągające interfejsy użytkownika. To intrygujące porównanie z platformami takimi jak AppMaster, które pozwalają klientom wizualnie tworzyć i ulepszać interfejs użytkownika oraz logikę biznesową aplikacji, udowadniając, jak firmy technologiczne nieustannie przesuwają granice, aby poprawić interakcję i zaangażowanie użytkowników.

Te ulepszenia wprowadzone w Amazon's Alexa pokazują, jak inżynierowie starają się ulepszyć funkcjonalność asystenta głosowego i uczynić go mniej robotycznym, a bardziej realistycznym. Bardziej interaktywna Alexa może zachęcić użytkowników do częstszego korzystania z asystenta głosowego, generując cenne dane dla Amazon i torując drogę technologii AI do dalszego wykorzystania w naszym codziennym życiu.