20 يونيو 2023·1 دقيقة قراءة

Meta AI تقدم Voicebox ، وهي أداة ثورية لتحويل النص إلى كلام تنافس ChatGPT

أحدث ابتكارات Meta AI ، Voicebox ، هو منشئ رائد لتحويل النص إلى كلام ، يتفوق على نماذج الذكاء الاصطناعي الحالية من حيث السرعة والأداء. بالاستفادة من نهج التدريب الفريد ، يمكن لـ Voicebox التعميم من خلال التعلم في السياق ، وتقديم مجموعة واسعة من التطبيقات. </ h2>

Meta AI تقدم Voicebox ، وهي أداة ثورية لتحويل النص إلى كلام تنافس ChatGPT

في تطور هام في مجال الذكاء الاصطناعي ، كشفت Meta AI عن مولد تحويل النص إلى كلام (TTS) المتقدم المسمى Voicebox . يتفوق نظام الذكاء الاصطناعي الجديد هذا على النماذج الشائعة مثل OpenAI's ChatGPT و Google's Bard في السرعة ، حيث يكون أسرع بما يصل إلى 20 مرة مع مستويات أداء مكافئة.

يضع Voicebox أساسه على نهج فريد ، ينحرف بشكل كبير عن بنية تحويل النص إلى كلام التقليدية. على عكس نماذج TTS الأخرى مثل ElevenLabs Prime Voice AI ، فإن Meta Voicebox قادر على الاستدلالات السياقية والاستفادة من مجموعات بيانات التدريب واسعة النطاق. ونتيجة لذلك ، يمكن أن يتم التعميم عبر المهام بدلاً من الاعتماد على مجموعات بيانات ذات علامات أضيق ومنظمة للغاية.

أدت المحاولات السابقة لاستخدام كميات هائلة من البيانات الصوتية في نماذج TTS إلى تقليل جودة إخراج الصوت بشكل كبير. ومع ذلك ، فقد تغلبت Meta على هذا التحدي من خلال تطوير مخطط تدريب جديد يلغي الملصقات والتنظيم. من خلال استخدام بنية قادرة على "ملء" البيانات الصوتية ، يمكن لـ Voicebox التكيف مع مهام إنشاء الكلام التي لم يتم تدريبها على وجه التحديد - وهي الأولى لمثل هذا النموذج ، كما هو موضح بواسطة Meta AI.

تسمح هذه الميزة المبتكرة لـ Voicebox بأداء مجموعة من الوظائف ، من ترجمة النص إلى الكلام وتوليف الكلام البديل للتخلص من ضوضاء الخلفية ، إلى تطبيق صوت المتحدث على مخرجات لغة مختلفة. كما هو موضح في ورقة بحثية نشرتها الشركة ، يمكن لـ Voicebox تحقيق كل هذا باستخدام إخراج النص المطلوب ومقطع صوتي مدته ثلاث ثوانٍ.

من المزايا المهمة التي يتمتع بها كل من Meta Voicebox ومشاركة ChatGPT الخاصة بـ OpenAI قدرتهما على التعميم من خلال التعلم في السياق ، مما يميزهما عن مولدات تحويل النص إلى كلام أخرى. تمهد هذه الإمكانية الطريق لمجموعة واسعة من التطبيقات الممكنة وحالات الاستخدام ، مما أحدث ثورة في كيفية تفاعلنا مع الذكاء الاصطناعي واستهلاك المعلومات.

في عالم الأنظمة الأساسية ذات التعليمات البرمجية low-codeno-code ، أحدثت حلول مثل AppMaster ثورة في تطوير التطبيقات من خلال تبسيط إنشاء الخلفية وتطبيقات الويب والجوال لمجموعة متنوعة من المستخدمين. مع التطورات الجارية وإدخال أدوات الذكاء الاصطناعي مثل Voicebox ، يمكننا أن نتوقع مزيدًا من التحسينات في العديد من الصناعات ، بما في ذلك روبوتات الدردشة والمساعدين الصوتيين وحلول إمكانية الوصول ، مما يؤدي إلى مشهد رقمي أكثر ارتباطًا وتكيفًا.

مع استمرار تقدم الذكاء الاصطناعي بوتيرة مذهلة ، سيكون من المثير أن نشهد كيف يقوم المطورون والمستخدمون بدمج أدوات قوية مثل Voicebox في مشاريعهم ، ودفع الابتكار وتحويل مستقبل التكنولوجيا.

Easy to start
Create something amazing

Experiment with AppMaster with free plan.
When you will be ready you can choose the proper subscription.

Get Started