Tạo bước đột phá mới trong ngành AI giọng nói, ElevenLabs đã huy động thành công số tiền ấn tượng 80 triệu USD trong vòng cấp vốn Series B, được đồng dẫn dắt bởi những gã khổng lồ trong ngành như Andreessen Horowitz, cùng với cựu Giám đốc điều hành của GitHub, Nat Friedman và doanh nhân nổi tiếng Daniel Gross. Với các khoản đầu tư từ các công ty danh tiếng như Sequoia Capital, Smash Capital, SV Angel, BroadLight Capital và Credo Ventures, nguồn hỗ trợ tài chính của công ty đã đạt tổng cộng 101 triệu USD, đưa mức định giá của công ty vào liên minh kỳ lân ở mức hơn 1 tỷ USD—một mức tăng theo cấp số nhân từ khoảng 100 triệu USD chỉ trong năm trước.
Với chương trình bơm vốn đầy tham vọng, Giám đốc điều hành Mati Staniszewski vạch ra các kế hoạch phát triển sản phẩm tích cực, mở rộng cơ sở hạ tầng, phát triển đội ngũ, nghiên cứu AI và thực hiện các biện pháp an toàn mạnh mẽ để đảm bảo sự phát triển AI có đạo đức. “Tầm nhìn của chúng tôi với khoản đầu tư mới này là củng cố vị trí dẫn đầu của ElevenLabs trong lĩnh vực AI giọng nói toàn cầu, cả trong nghiên cứu tiên phong và ứng dụng thực tế”, Staniszewski chuyển tải tới TechCrunch trong một bức thư.
Là sản phẩm trí tuệ của Piotr Dabkowski, cựu kỹ sư máy học Google và Staniszewski, cựu chiến lược gia Palantir, ElevenLabs ra đời từ tầm nhìn chung nhằm cải thiện khả năng nhân bản giọng nói, được thúc đẩy bởi kinh nghiệm của bộ đôi này với những bộ phim lồng tiếng tầm trung ở quê nhà của họ. Ba Lan. Kể từ khi bắt đầu phiên bản beta một năm trước, công ty đã nhanh chóng trở nên nổi tiếng nhờ ứng dụng dựa trên trình duyệt tổng hợp khéo léo các giọng nói có thể tinh chỉnh về ngữ điệu, cảm xúc và nhịp độ, cùng các sắc thái giọng nói khác.
Cung cấp cả dịch vụ miễn phí và cao cấp, ElevenLabs cho phép người dùng nhập văn bản để thể hiện giọng hát hoặc gửi mẫu giọng nói để nhân bản giọng nói được cá nhân hóa. Cam kết đổi mới của công ty còn mở rộng đến việc tạo ra khả năng tạo giọng nói chuyên biệt cho các ngành bao gồm sách nói, lồng tiếng phim, nhân vật trong trò chơi và quảng cáo.
Một trong những phát triển đột phá của họ, được giới thiệu vào năm trước, là công cụ 'lời nói thành giọng nói' được thiết kế để duy trì các đặc điểm độc đáo của giọng nói của người nói trong khi loại bỏ tiếng ồn xung quanh không mong muốn và điều chỉnh lồng tiếng một cách khéo léo cho nội dung điện ảnh và truyền hình. Sắp tới, ElevenLabs sắp ra mắt quy trình làm việc của studio lồng tiếng nâng cao và một ứng dụng di động được thiết kế để tường thuật các trang web và văn bản thông qua công nghệ giọng nói độc quyền của mình.
Những đổi mới của công ty đã thu hút được một lượng khách hàng đa dạng, bao gồm nhà phát triển trò chơi Paradox Interactive và hãng truyền thông uy tín The Washington Post. Staniszewski tự hào chia sẻ rằng người dùng ElevenLab đã tạo ra nội dung âm thanh có giá trị hơn một thế kỷ và giờ đây nó là công cụ được nhân viên ưa chuộng tại 41% công ty trong danh sách Fortune 500.
Không gian đang phát triển của công nghệ giọng nói do AI điều khiển song song với sự tăng trưởng lặp đi lặp lại trong các nền tảng no-code như AppMaster, nền tảng này dân chủ hóa việc phát triển ứng dụng cho nhiều nhóm người dùng khác nhau. Khi ElevenLabs tiếp tục thăng hạng trong hàng ngũ các công ty công nghệ đổi mới, quỹ đạo của nó mang đến cái nhìn hấp dẫn về tiềm năng biến đổi của AI trong lĩnh vực giọng nói và lời nói.