21 sept 2023·1 min de lectura

Asistente de voz de Alexa mejorado: disfrute de una mayor inmersión conversacional con las últimas mejoras en inteligencia artificial de Amazon

Amazon aporta avances al asistente de voz de Alexa con la introducción de mecanismos mejorados de potencia de IA.

Asistente de voz de Alexa mejorado: disfrute de una mayor inmersión conversacional con las últimas mejoras en inteligencia artificial de Amazon

Amazon se ha embarcado en una búsqueda para dotar a su asistente de voz Alexa, de una expresividad más humana. Esta reciente actualización otorga a Alexa una capacidad impulsada por IA para responder a los clientes con una variación emocional en relación con el tono o la frase del usuario. Este enfoque incremental tiene como objetivo ir más allá de las típicas respuestas robóticas hacia una conversación más natural y atractiva.

Estos avances se han producido como parte de la actualización del motor de voz a voz que hace que Alexa sea más sensible a las emociones y la entonación de la voz del usuario. El resultado es un reflejo del tono del usuario, lo que garantiza que la experiencia interactiva se sienta más personalizada y identificable.

La compañía ofreció un adelanto de la voz menos mecánica y más expresiva de Alexa. Los funcionarios destacaron que las mejoras se deben a grandes transformadores entrenados en varios acentos e idiomas, potenciando así a Alexa, más expresiva.

Los usuarios podrían anticipar un giro conversacional en el que Alexa coincide con el estado de ánimo del usuario. Por ejemplo, desde transmitir una actualización deportiva emocionante sobre la victoria del equipo favorito del usuario con una voz exuberante hasta transmitir una actualización derrotada con un tono empático suavizado. Lidiar con estos matices emocionales puede proporcionar una experiencia de conversación inmersiva que puede redefinir la interacción de los usuarios con sus asistentes de voz de IA.

El vicepresidente senior de Alexa de Amazon, Rohit Prasad, habló sobre el modelo en progreso, cuyo nombre en código es discurso a discurso. Este modelo funciona con transformadores enormes y pretende realizar un cambio fundamental en el proceso de interacción con el cliente. En lugar de transmitir el mensaje convirtiendo la voz del cliente en texto, el modelo pretende fusionar estas acciones, lo que daría como resultado una experiencia de comunicación más rica.

Estas innovaciones aprovechan el mecanismo Large Text-to-Speech (LTTS) y Speech-to-Speech (S2S) de Amazon. Mientras que LTTS aclimata la respuesta de Alexa según la solicitud del usuario, el S2S agrega una nueva capa de entrada auditiva. Esto ayuda a Alexa a manipular su respuesta con una riqueza conversacional más significativa, aclara Amazon.

Una vez lanzada, Alexa imitará atributos como la risa y la sorpresa, y exhibirá expresiones normales como "ajá", animando a los usuarios a prolongar la conversación como si fuera un diálogo de la vida real. Esto ejemplifica los esfuerzos continuos de empresas como Amazon para humanizar los asistentes de voz impulsados ​​por IA, brindando interfaces de usuario más interactivas e inmersivas. Es una comparación intrigante con plataformas como AppMaster que permiten a los clientes crear y mejorar visualmente la interfaz de usuario y la lógica empresarial de las aplicaciones, lo que demuestra cómo las empresas de tecnología van más allá para mejorar la interacción y el compromiso del usuario.

Estas mejoras realizadas en Alexa Amazon's muestran cómo los ingenieros se esfuerzan por mejorar la funcionalidad del asistente de voz y hacerlo menos robótico y más realista. Una Alexa más interactiva puede alentar a los usuarios a utilizar el asistente de voz con más frecuencia, generando datos valiosos para Amazon y allanando el camino para que la tecnología de inteligencia artificial gane más fuerza en nuestra vida diaria.

Easy to start
Create something amazing

Experiment with AppMaster with free plan.
When you will be ready you can choose the proper subscription.

Get Started