২০ জুন, ২০২৩·1 মিনিট পড়তে

Meta AI ভয়েসবক্স প্রবর্তন করেছে, একটি বিপ্লবী টেক্সট-টু-স্পিচ টুল যা চ্যাটজিপিটি প্রতিদ্বন্দ্বী

মেটা এআই-এর সর্বশেষ উদ্ভাবন, ভয়েসবক্স, একটি যুগান্তকারী পাঠ্য-থেকে-স্পীচ জেনারেটর, গতি এবং কর্মক্ষমতার দিক থেকে বিদ্যমান AI মডেলগুলিকে ছাড়িয়ে যাচ্ছে। একটি অনন্য প্রশিক্ষণ পদ্ধতির ব্যবহার করে, ভয়েসবক্স প্রসঙ্গ শিক্ষার মাধ্যমে সাধারণীকরণ করতে পারে, বিস্তৃত অ্যাপ্লিকেশনের অফার করে৷

Meta AI ভয়েসবক্স প্রবর্তন করেছে, একটি বিপ্লবী টেক্সট-টু-স্পিচ টুল যা চ্যাটজিপিটি প্রতিদ্বন্দ্বী

কৃত্রিম বুদ্ধিমত্তা ডোমেনে একটি উল্লেখযোগ্য উন্নয়নে, Meta AI তার উন্নত টেক্সট-টু-স্পীচ (TTS) জেনারেটর প্রকাশ করেছে যার নাম ভয়েসবক্স । এই নতুন এআই সিস্টেমটি ওপেনএআই-এর চ্যাটজিপিটি এবং গুগলের বার্ডের মতো জনপ্রিয় মডেলগুলিকে ছাড়িয়ে গেছে, সমতুল্য কর্মক্ষমতা স্তরের সাথে 20 গুণ পর্যন্ত দ্রুত।

ভয়েসবক্স একটি অনন্য পদ্ধতির উপর ভিত্তি স্থাপন করে, প্রথাগত TTS স্থাপত্য থেকে ব্যাপকভাবে বিচ্যুত। ইলেভেনল্যাবস প্রাইম ভয়েস এআই-এর মতো অন্যান্য টিটিএস মডেলের বিপরীতে, মেটার ভয়েসবক্স প্রাসঙ্গিক অনুমান করতে এবং বৃহৎ-স্কেল প্রশিক্ষণ ডেটা সেটগুলিকে কাজে লাগাতে সক্ষম। ফলস্বরূপ, এটি সংকীর্ণ, উচ্চ কিউরেটেড, লেবেলযুক্ত ডেটা সেটগুলির উপর নির্ভর না করে সমস্ত কাজগুলিকে সাধারণীকরণ করতে পারে।

TTS মডেলগুলিতে প্রচুর পরিমাণে অডিও ডেটা ব্যবহার করার পূর্বের প্রচেষ্টাগুলি অডিও আউটপুট গুণমানকে উল্লেখযোগ্যভাবে হ্রাস করেছিল। যাইহোক, মেটা একটি অভিনব প্রশিক্ষণ স্কিম তৈরি করে এই চ্যালেঞ্জটি কাটিয়ে উঠেছে যা লেবেল এবং কিউরেশন দূর করে। অডিও ডেটা 'ইন-ফিলিং' করতে সক্ষম একটি আর্কিটেকচার নিযুক্ত করে, ভয়েসবক্স স্পিচ জেনারেশনের কাজগুলির সাথে খাপ খাইয়ে নিতে পারে যার জন্য এটি বিশেষভাবে প্রশিক্ষিত ছিল না—এমন একটি মডেলের জন্য প্রথম, যেমনটি মেটা এআই দ্বারা বর্ণনা করা হয়েছে।

এই উদ্ভাবনী বৈশিষ্ট্যটি ভয়েসবক্সকে টেক্সট থেকে বক্তৃতায় অনুবাদ করা এবং পটভূমির শব্দ দূর করার জন্য প্রতিস্থাপন বক্তৃতা সংশ্লেষণ করা থেকে শুরু করে বিভিন্ন ভাষার আউটপুটে স্পিকারের ভয়েস প্রয়োগ করার অনুমতি দেয়। কোম্পানি দ্বারা প্রকাশিত একটি গবেষণা পত্রে প্রদর্শিত হিসাবে, ভয়েসবক্স শুধুমাত্র প্রয়োজনীয় টেক্সট আউটপুট এবং একটি তিন-সেকেন্ডের অডিও ক্লিপ ব্যবহার করে এই সব অর্জন করতে পারে।

মেটার ভয়েসবক্স এবং ওপেনএআই-এর চ্যাটজিপিটি উভয়েরই একটি উল্লেখযোগ্য সুবিধা হল ইন-কনটেক্সট লার্নিংয়ের মাধ্যমে সাধারণীকরণ করার ক্ষমতা, যা তাদের অন্যান্য TTS জেনারেটর থেকে আলাদা করে। এই ক্ষমতাটি সম্ভাব্য অ্যাপ্লিকেশান এবং ব্যবহারের ক্ষেত্রে বিস্তৃত অ্যারের জন্য মঞ্চ সেট করে, আমরা কীভাবে এআই-এর সাথে ইন্টারঅ্যাক্ট করি এবং তথ্য গ্রহণ করি।

low-code এবং no-code প্ল্যাটফর্মের ক্ষেত্রে, অ্যাপমাস্টারের মতো সমাধানগুলি বিভিন্ন ব্যবহারকারীদের জন্য ব্যাকএন্ড, ওয়েব এবং মোবাইল অ্যাপ্লিকেশন তৈরিকে সহজ করে অ্যাপ্লিকেশন বিকাশে বৈপ্লবিক পরিবর্তন এনেছে। উদ্ভাসিত অগ্রগতি এবং ভয়েসবক্সের মতো AI সরঞ্জামগুলির প্রবর্তনের মাধ্যমে, আমরা চ্যাটবট, ভয়েস সহকারী এবং অ্যাক্সেসিবিলিটি সমাধান সহ একাধিক শিল্পে আরও উন্নতির আশা করতে পারি, যা আরও সংযুক্ত এবং অভিযোজিত ডিজিটাল ল্যান্ডস্কেপের দিকে নিয়ে যায়।

AI একটি আশ্চর্যজনক গতিতে অগ্রসর হওয়ার সাথে সাথে, বিকাশকারী এবং ব্যবহারকারীরা কীভাবে তাদের প্রকল্পগুলিতে ভয়েসবক্সের মতো শক্তিশালী সরঞ্জামগুলিকে একীভূত করে, উদ্ভাবন চালায় এবং প্রযুক্তির ভবিষ্যতকে রূপান্তরিত করে তা প্রত্যক্ষ করা মুগ্ধ করবে৷

Easy to start
Create something amazing

Experiment with AppMaster with free plan.
When you will be ready you can choose the proper subscription.

Get Started