ElevenLabs, oparta na sztucznej inteligencji platforma do generowania syntetycznych głosów, ogłosiła zakończenie rundy finansowania serii A o wartości 19 milionów dolarów. Runda była współprowadzona przez przedsiębiorców Nata Friedmana i Daniela Grossa, wraz z Andreessen Horowitz, i obejmowała takich uczestników, jak Creator Ventures, SV Angel, współzałożyciel Instagrama Mike Krieger, współzałożyciel Oculusa Brendan Iribe, współzałożyciel Deepmind i Inflection AI Mustafa Suleyman oraz założyciel O'Reilly Media Tim O'Reilly. Źródło ujawnia, że ta inwestycja wycenia ElevenLabs na 99 milionów dolarów po pieniądzach, co jest godnym uwagi osiągnięciem, biorąc pod uwagę uruchomienie startupu nieco ponad rok temu.

ElevenLabs planuje wykorzystać inwestycję do dalszych badań i rozwoju w zakresie sztucznej inteligencji głosowej, jednocześnie wprowadzając na rynek szereg produktów dostosowanych do konkretnych branż. Według współzałożyciela i dyrektora generalnego, Matiego Staniszewskiego, produkty te będą przeznaczone dla branż takich jak wydawnictwa, gry, rozrywka i aplikacje konwersacyjne.

Najnowszym dodatkiem do platformy ElevenLabs jest Projects, przepływ pracy do edycji i tworzenia długich treści mówionych. Umożliwia to użytkownikom generowanie segmentów dialogowych, a nawet kompletnych audiobooków bez opuszczania platformy. Staniszewski przewiduje zastosowania tej technologii w wielu domenach komercyjnych, takich jak skalowalne i wielojęzyczne tworzenie audiobooków, podkładanie głosu postaciom w grach wideo, podkładanie głosu artykułom cyfrowym, wspieranie osób niedowidzących w dostępie do treści online oraz wzmacnianie radia opartego na sztucznej inteligencji.

Technologia zamiany tekstu na mowę ElevenLabs pozwala na tworzenie syntetycznych, sklonowanych lub całkowicie nowych głosów generowanych przez sztuczną inteligencję, które naśladują różne płcie, wiek i pochodzenie etniczne. Modele AI platformy niezależne od języka umożliwiają klientom korporacyjnym łatwe dostosowywanie i tworzenie własnych zastrzeżonych modeli mowy.

Chociaż platforma zyskała znaczną popularność dzięki wysokiej jakości generowanym głosom i hojnemu bezpłatnemu poziomowi, stanęła również w obliczu wyzwań i kontrowersji. W odpowiedzi na przypadki złych aktorów wykorzystujących platformę do generowania złośliwych treści, ElevenLabs wprowadziło kilka środków bezpieczeństwa, takich jak ograniczenie klonowania głosu do płatnych kont, banowanie powtarzających się naruszeń i uruchomienie nowego narzędzia do wykrywania AI. Narzędzie to, o nazwie AI Speech Classifier, jest teraz dostępne dla wybranych partnerów jako interfejs API zaprojektowany do wykrywania, czy przesłane próbki audio zawierają treści wygenerowane przez AI z ElevenLabs.

Pojawiają się jednak obawy dotyczące egzystencjalnego zagrożenia, jakie technologia ta stanowi dla utrzymania aktorów głosowych. W miarę jak głosy generowane przez sztuczną inteligencję stają się coraz bardziej powszechne, aktorzy głosowi mogą być świadkami, jak klienci decydują się na syntetyczne interpretacje ich występów, potencjalnie bez wynagrodzenia.

Podsycając swoje ambitne plany rozwoju, ElevenLabs zamierza rozszerzyć swoje modele sztucznej inteligencji na dubbing głosowy i stworzyć system zdolny do przenoszenia emocji i intonacji między językami. Dzięki finansowaniu w wysokości 21 milionów dolarów, ElevenLabs jest przygotowany do konkurowania z głównymi graczami w generatywnej przestrzeni głosowej, w tym gigantami technologicznymi, takimi jak Amazon, Google i Microsoft, a także startupami takimi jak Murf, Tavus, Resemble AI, Respeecher, Play.ht i Lovo.

