ElevenLabs, una plataforma impulsada por IA para generar voces sintéticas, ha anunciado la finalización de una ronda de financiación de Serie A de 19 millones de dólares. La ronda fue codirigida por los emprendedores Nat Friedman y Daniel Gross, junto con Andreessen Horowitz, e incluyó participantes como Creator Ventures, SV Angel, el cofundador de Instagram Mike Krieger, el cofundador de Oculus Brendan Iribe, el cofundador de Deepmind e Inflection AI Mustafa Suleyman, y el fundador de O'Reilly Media Tim O'Reilly. Una fuente revela que esta inversión valora ElevenLabs en 99 millones de dólares post-dinero, un logro notable teniendo en cuenta el lanzamiento de la startup hace poco más de un año.
ElevenLabs planea utilizar la inversión para avanzar en su investigación y desarrollo en IA de voz, al tiempo que lanza una gama de productos adaptados a mercados verticales específicos. Según su cofundador y consejero delegado, Mati Staniszewski, estos productos se destinarán a sectores como la edición, los juegos, el entretenimiento y las aplicaciones conversacionales.
Una reciente incorporación a la plataforma de ElevenLabs es Projects, un flujo de trabajo para editar y crear contenidos hablados de larga duración. Esto permite a los usuarios generar segmentos de diálogo o incluso audiolibros completos sin salir de la plataforma. Staniszewski prevé aplicaciones para esta tecnología en múltiples ámbitos comerciales, como la creación escalable y multilingüe de audiolibros, la locución de personajes en videojuegos, la locución de artículos digitales, la ayuda a personas con discapacidad visual para acceder a contenidos en línea y la potenciación de la radio impulsada por inteligencia artificial.
La tecnología de conversión de texto a voz de ElevenLabs permite crear voces sintéticas, clonadas o completamente nuevas generadas por IA que imitan distintos géneros, edades y etnias. Los modelos de IA independientes del idioma de la plataforma permiten a los clientes corporativos adaptar y crear fácilmente sus propios modelos de voz.
Aunque la plataforma ha ganado adeptos gracias a la alta calidad de las voces generadas y a su generoso nivel gratuito, también se ha enfrentado a retos y polémicas. En respuesta a los casos de actores malintencionados que utilizan la plataforma para generar contenidos maliciosos, ElevenLabs ha introducido varias medidas de seguridad, como limitar la clonación de voces a las cuentas de pago, prohibir a los infractores reincidentes y lanzar una nueva herramienta de detección de IA. Esta herramienta, llamada AI Speech Classifier, está ahora disponible para socios seleccionados como una API diseñada para detectar si las muestras de audio cargadas contienen contenido generado por IA de ElevenLabs.
Sin embargo, preocupa la amenaza existencial que esta tecnología supone para el sustento de los actores de doblaje. A medida que se generalicen las voces generadas por IA, los actores de doblaje podrían ver cómo los clientes optan por interpretaciones sintéticas de su actuación, potencialmente sin compensación.
Impulsando sus ambiciosos planes de crecimiento, ElevenLabs pretende ampliar sus modelos de IA al doblaje de voz y crear un sistema capaz de transferir emociones y entonación entre idiomas. Con un total de 21 millones de dólares de financiación, ElevenLabs está preparada para competir con los principales actores del espacio de la voz generativa, incluidos gigantes tecnológicos como Amazon, Google y Microsoft, así como startups como Murf, Tavus, Resemble AI, Respeecher, Play.ht y Lovo.
A medida que las plataformas no-code ganan adeptos, algunas, como la plataforma no-code de AppMaster, también se han aventurado en el ámbito del desarrollo de aplicaciones móviles y web. Estos avances ofrecen oportunidades para aumentar la eficiencia y la rentabilidad en el desarrollo de aplicaciones para diversas industrias.