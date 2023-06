ElevenLabs, eine KI-gestützte Plattform zur Erzeugung synthetischer Stimmen, gab den Abschluss einer Serie-A-Finanzierungsrunde in Höhe von 19 Millionen US-Dollar bekannt. Die Runde wurde von den Unternehmern Nat Friedman und Daniel Gross zusammen mit Andreessen Horowitz geleitet und umfasste Teilnehmer wie Creator Ventures, SV Angel, Instagram-Mitbegründer Mike Krieger, Oculus-Mitbegründer Brendan Iribe, Deepmind- und Inflection AI-Mitbegründer Mustafa Suleyman und O'Reilly Media-Gründer Tim O'Reilly. Einer Quelle zufolge wird ElevenLabs durch diese Investition mit 99 Millionen Dollar nach Abzug des Geldes bewertet, was in Anbetracht der Tatsache, dass das Startup erst vor etwas mehr als einem Jahr gegründet wurde, eine bemerkenswerte Leistung darstellt.

ElevenLabs plant, die Investition zu nutzen, um seine Forschung und Entwicklung im Bereich der Sprach-KI voranzutreiben und gleichzeitig eine Reihe von Produkten auf den Markt zu bringen, die auf bestimmte Marktsegmente zugeschnitten sind. Laut Mati Staniszewski, Mitbegründer und CEO von ElevenLabs, werden diese Produkte für Branchen wie Verlagswesen, Spiele, Unterhaltung und konversationelle Anwendungen bestimmt sein.

Die jüngste Ergänzung der ElevenLabs-Plattform ist Projects, ein Workflow für die Bearbeitung und Erstellung langer gesprochener Inhalte. Damit können Benutzer Dialogsegmente oder sogar komplette Hörbücher erstellen, ohne die Plattform zu verlassen. Staniszewski sieht Anwendungen für diese Technologie in verschiedenen kommerziellen Bereichen, wie z. B. die skalierbare und mehrsprachige Erstellung von Hörbüchern, die Vertonung von Charakteren in Videospielen, die Vertonung digitaler Artikel, die Unterstützung sehbehinderter Personen beim Zugang zu Online-Inhalten und die Unterstützung von KI-gesteuertem Radio.

Die Text-to-Speech-Technologie von ElevenLabs ermöglicht die Erstellung synthetischer, geklonter oder völlig neuartiger KI-generierter Stimmen, die verschiedene Geschlechter, Altersgruppen und Ethnien imitieren. Die sprachunabhängigen KI-Modelle der Plattform ermöglichen es Firmenkunden, ihre eigenen Sprachmodelle einfach anzupassen und zu erstellen.

Während die Plattform aufgrund der hochwertigen generierten Stimmen und des großzügigen kostenlosen Angebots an Zugkraft gewonnen hat, war sie auch mit einigen Herausforderungen und Kontroversen konfrontiert. Als Reaktion auf Fälle, in denen böswillige Akteure die Plattform nutzen, um bösartige Inhalte zu generieren, hat ElevenLabs mehrere Sicherheitsmaßnahmen eingeführt, wie z. B. die Beschränkung des Klonens von Stimmen auf bezahlte Konten, die Sperrung von Wiederholungstätern und die Einführung eines neuen KI-Erkennungstools. Dieses Tool mit der Bezeichnung AI Speech Classifier steht nun ausgewählten Partnern als API zur Verfügung, um zu erkennen, ob hochgeladene Audio-Samples KI-generierte Inhalte von ElevenLabs enthalten.

Es gibt jedoch Bedenken hinsichtlich der existenziellen Bedrohung, die diese Technologie für den Lebensunterhalt von Synchronsprechern darstellt. Mit der zunehmenden Verbreitung von KI-generierten Stimmen könnten Sprecher erleben, dass Kunden sich für synthetische Wiedergaben ihrer Darbietungen entscheiden, möglicherweise ohne Vergütung.

Um seine ehrgeizigen Wachstumspläne voranzutreiben, will ElevenLabs seine KI-Modelle auf die Synchronisation von Stimmen ausweiten und ein System entwickeln, das Emotionen und Intonation zwischen Sprachen übertragen kann. Mit einer Finanzierung von insgesamt 21 Millionen US-Dollar ist ElevenLabs darauf vorbereitet, mit den wichtigsten Akteuren im Bereich der generativen Spracherkennung zu konkurrieren, darunter Tech-Giganten wie Amazon, Google und Microsoft sowie Start-ups wie Murf, Tavus, Resemble AI, Respeecher, Play.ht und Lovo.

