20 июн. 2023 г.·1 мин

Meta AI представляет Voicebox, революционный инструмент преобразования текста в речь, превосходящий ChatGPT

Последняя новинка Meta AI, Voicebox, является революционным генератором преобразования текста в речь, превосходящим существующие модели ИИ по скорости и производительности. Используя уникальный подход к обучению, Voicebox способен к обобщению посредством контекстного обучения, предлагая широкий спектр приложений.

Meta AI представляет Voicebox, революционный инструмент преобразования текста в речь, превосходящий ChatGPT

Компания Meta AI представила передовой генератор преобразования текста в речь (TTS) под названием Voicebox, что является значительным событием в области искусственного интеллекта. Эта новая система искусственного интеллекта превосходит по скорости такие популярные модели, как ChatGPT от OpenAI и Bard от Google, будучи до 20 раз быстрее при эквивалентном уровне производительности.

В основе Voicebox лежит уникальный подход, радикально отличающийся от традиционной архитектуры TTS. В отличие от других моделей TTS, таких как ElevenLabs Prime Voice AI, Voicebox от Meta способен делать контекстные выводы и использовать большие наборы обучающих данных. В результате он может обобщать все задачи, а не полагаться на более узкие, высоко контролируемые, маркированные наборы данных.

Предыдущие попытки использовать огромные объемы аудиоданных в моделях TTS приводили к значительному снижению качества звука на выходе. Однако Meta преодолела эту проблему, разработав новую схему обучения, которая позволяет отказаться от меток и кураторства. Используя архитектуру, способную "заполнять" аудиоданные, Voicebox может адаптироваться к задачам генерации речи, для которых он не был специально обучен - впервые для такой модели, по словам Meta AI.

Эта инновационная функция позволяет Voicebox выполнять целый ряд функций, от перевода текста в речь и синтеза замещающей речи для устранения фонового шума до применения голоса диктора для различных языковых выходов. Как показано в опубликованной компанией исследовательской работе, Voicebox может достичь всего этого, используя только необходимый текст и трехсекундный аудиоклип.

Существенным преимуществом Voicebox от Meta и ChatGPT от OpenAI является их способность к обобщению посредством контекстного обучения, что отличает их от других генераторов TTS. Эта способность создает основу для широкого спектра возможных приложений и вариантов использования, революционизируя способы взаимодействия с ИИ и потребления информации.

В сфере платформ low-code и no-code такие решения, как AppMaster, произвели революцию в разработке приложений, упростив создание бэкенда, веб- и мобильных приложений для самых разных пользователей. С развивающимся прогрессом и внедрением таких инструментов ИИ, как Voicebox, мы можем ожидать дальнейшего развития множества отраслей, включая чат-боты, голосовые помощники и решения для обеспечения доступности, что приведет к созданию более связанного и адаптивного цифрового ландшафта.

Поскольку ИИ продолжает развиваться с поразительной скоростью, будет интересно наблюдать, как разработчики и пользователи интегрируют такие мощные инструменты, как Voicebox, в свои проекты, стимулируя инновации и изменяя будущее технологий.

Легко начать
Создай что-то невероятное

Экспериментируйте с AppMaster с бесплатной подпиской.
Как только вы будете готовы, вы сможете выбрать подходящий платный план.

Попробовать AppMaster