ElevenLabs, une plateforme alimentée par l'IA pour générer des voix synthétiques, a annoncé la finalisation d'un cycle de financement de série A de 19 millions de dollars. Ce tour de table était codirigé par les entrepreneurs Nat Friedman et Daniel Gross, ainsi que par Andreessen Horowitz, et comprenait des participants tels que Creator Ventures, SV Angel, Mike Krieger, cofondateur d'Instagram, Brendan Iribe, cofondateur d'Oculus, Mustafa Suleyman, cofondateur de Deepmind et d'Inflection AI, et Tim O'Reilly, fondateur d'O'Reilly Media. Une source révèle que cet investissement valorise ElevenLabs à 99 millions de dollars après amortissement, ce qui est un résultat remarquable si l'on considère que la startup a été lancée il y a un peu plus d'un an.

ElevenLabs prévoit d'utiliser cet investissement pour poursuivre ses travaux de recherche et de développement dans le domaine de l'IA vocale, tout en lançant une gamme de produits adaptés à des marchés verticaux spécifiques. Selon Mati Staniszewski, cofondateur et PDG de l'entreprise, ces produits s'adresseront à des secteurs tels que l'édition, les jeux, le divertissement et les applications conversationnelles.

Un ajout récent à la plateforme ElevenLabs est Projects, un flux de travail pour l'édition et la création de contenu parlé de longue durée. Cela permet aux utilisateurs de générer des segments de dialogue ou même des livres audio complets sans quitter la plateforme. M. Staniszewski envisage des applications pour cette technologie dans de nombreux domaines commerciaux, tels que la création de livres audio évolutifs et multilingues, l'interprétation vocale de personnages dans les jeux vidéo, l'interprétation vocale d'articles numériques, l'aide aux personnes malvoyantes pour l'accès au contenu en ligne, et l'autonomisation des radios pilotées par l'IA.

La technologie de synthèse vocale d'ElevenLabs permet de créer des voix synthétiques, clonées ou entièrement nouvelles, générées par l'IA, qui imitent différents sexes, âges et ethnies. Les modèles d'IA agnostiques de la plateforme permettent aux entreprises clientes d'adapter et de créer facilement leurs propres modèles vocaux.

Bien que la plateforme ait gagné en popularité grâce à ses voix générées de haute qualité et à son offre gratuite généreuse, elle a également dû faire face à sa part de défis et de controverses. En réponse à des cas de mauvais acteurs utilisant la plateforme pour générer du contenu malveillant, ElevenLabs a introduit plusieurs mesures de sécurité, telles que la limitation du clonage de voix aux comptes payants, le bannissement des récidivistes et le lancement d'un nouvel outil de détection de l'IA. Cet outil, appelé AI Speech Classifier, est désormais disponible pour des partenaires sélectionnés sous la forme d'une API conçue pour détecter si les échantillons audio téléchargés contiennent du contenu généré par l'IA d'ElevenLabs.

Toutefois, des inquiétudes se font jour quant à la menace existentielle que cette technologie fait peser sur les moyens de subsistance des acteurs vocaux. À mesure que les voix générées par l'IA se répandent, les acteurs vocaux risquent de voir leurs clients opter pour des interprétations synthétiques de leur performance, potentiellement sans compensation.

Dans le cadre de ses ambitieux projets de croissance, ElevenLabs vise à étendre ses modèles d'IA au doublage de voix et à créer un système capable de transférer les émotions et l'intonation d'une langue à l'autre. Avec un financement total de 21 millions de dollars, ElevenLabs est prête à concurrencer les principaux acteurs du secteur de la génération vocale, notamment les géants de la technologie tels qu'Amazon, Google et Microsoft, ainsi que des start-ups comme Murf, Tavus, Resemble AI, Respeecher, Play.ht et Lovo.

