OpenAI, কৃত্রিম বুদ্ধিমত্তার একটি বিশিষ্ট খেলোয়াড়, তার সম্মানিত সহকারী, ChatGPT এর ক্ষমতা প্রসারিত করছে। মূলত একটি টেক্সট-ভিত্তিক সার্চ টুল হিসাবে ডিজাইন করা হয়েছে, ChatGPT এখন ভয়েস এবং ইমেজ প্রসেসিং ক্ষমতাকে প্রস্ফুটিত করবে, এর ব্যবহারকারীদের জন্য আরও ইন্টারেক্টিভ অভিজ্ঞতা তৈরি করবে।
প্রায় নয় মাস আগে এর প্রবর্তনের পর থেকে, ChatGPT প্রযুক্তির বর্ণালীতে একটি বড় ঘটনা হয়ে উঠেছে। এটি প্রবন্ধ রচনা করার, কবিতা তৈরি করার এবং সাধারণ পাঠ্য সংকেত থেকে বিস্তৃত পাঠ্য সংক্ষিপ্ত করার ক্ষমতার জন্য গভীরভাবে প্রশংসিত। যাইহোক, এআই সহকারী এখন আরও বেশি আকর্ষক হয়ে উঠতে প্রস্তুত। এটি এখন ব্যবহারকারীদের কাছে তার কান ধার দেবে, ভোকাল মিথস্ক্রিয়া করার অনুমতি দেবে।
ব্যবহারকারীরা ChatGPT এর সাথে ভয়েস সংলাপে যুক্ত হওয়ার সুযোগ পাবেন। উদাহরণস্বরূপ, সহকারীকে ব্যবহারকারীর কাছ থেকে মৌখিক ইঙ্গিত দ্বারা নির্দেশিত একটি তাত্ক্ষণিক ঘুমের সময় গল্প বর্ণনা করতে বলা যেতে পারে। সহজ প্রশ্নগুলিও সাহায্যের জন্য নির্দেশিত হতে পারে, এবং উত্তরগুলি কথ্য ভাষায় প্রদান করা হবে।
উপরন্তু, ছবি ভিত্তিক অনুসন্ধান বৈশিষ্ট্য উপলব্ধ করা হয়েছে. ব্যবহারকারীরা একটি ছবি আপলোড করতে পারেন এবং ChatGPT আপলোড করা আইটেমটি সনাক্ত করতে বা ব্যাখ্যা করতে বা একটি নির্দিষ্ট লক্ষ্য অর্জনের জন্য নির্দেশাবলীর অনুরোধ করতে পারেন।
ChatGPT এর ভয়েস ইন্টারঅ্যাকশনের ক্ষমতাগুলি একটি উচ্চতর টেক্সট-টু-স্পিচ মডেল দ্বারা সূক্ষ্ম-টিউন করা হয়েছে যা পাঠ্য থেকে মানুষের মতো কণ্ঠস্বর এবং একটি সংক্ষিপ্ত বক্তৃতার নমুনা তৈরি করতে পারে। OpenAI প্রকাশ করেছে যে এটি পাঁচটি একচেটিয়া ভয়েস তৈরি করতে দক্ষ ভয়েস অভিনেতাদের সাথে সহযোগিতা করেছে। সংস্থার ওপেন-সোর্স হুইস্পার স্পিচ রিকগনিশন সিস্টেম বক্তৃতাকে পাঠ্যে রূপান্তর করার জন্য অন্তর্নিহিত প্রযুক্তি হিসাবে কাজ করে।
একটি উত্তেজনাপূর্ণ উন্নয়নে, Spotify একটি লঞ্চ অংশীদার হিসাবে পা দিয়েছে। এটি পডকাস্টারদের জন্য একটি মূল্যবান বৈশিষ্ট্য চালু করেছে যা তাদের মূল ভয়েস টোন বজায় রেখে ইংরেজি থেকে স্প্যানিশ, ফ্রেঞ্চ বা জার্মান ভাষায় তাদের শো প্রতিলিপি করতে দেয়। তবুও, OpenAI প্রকাশ করে যে এই প্রযুক্তিতে অ্যাক্সেস সর্বজনীন নয়। এটি শুধুমাত্র প্রাথমিক লঞ্চের জন্য ড্যাক্স শেপার্ড, মনিকা প্যাডম্যান, লেক্স ফ্রিডম্যান, বিল সিমন্স এবং স্টিভেন বার্টলেট সহ পডকাস্টারদের জন্য উপলব্ধ।
একটি ব্লগ পোস্টে, OpenAI তার নতুন ভয়েস প্রযুক্তির সাথে সম্পৃক্ত সম্ভাব্য ঝুঁকিগুলি স্বীকার করেছে, দুর্বৃত্তদের দ্বারা প্রতারণা বা ভুল উপস্থাপনের সম্ভাবনা সম্পর্কিত। এইভাবে, এটি নিশ্চিত করছে যে এটির মুক্তি নিয়ে কোনও বিতর্ক সৃষ্টি হবে না।
এই নতুন বৈশিষ্ট্যগুলির উন্মোচন পরবর্তী পাক্ষিকের জন্য পরিকল্পনা করা হয়েছে। তারা প্রাথমিকভাবে প্লাস এবং এন্টারপ্রাইজ গ্রাহকদের কাছে অ্যাক্সেসযোগ্য হবে। ভয়েস বৈশিষ্ট্যগুলি উপভোগ করতে, ব্যবহারকারীদের অ্যাপের 'সেটিংস'-এ নেভিগেট করতে হবে, 'নতুন বৈশিষ্ট্য' নির্বাচন করতে হবে, ভয়েস কথোপকথনে অপ্ট-ইন করতে হবে, উপরের-ডান কোণায় অবস্থিত হেডফোন বোতামে আলতো চাপুন এবং অবশেষে, বেছে নিন পছন্দের ভয়েস।
শুরুতে, শুধুমাত্র ChatGPT অ্যান্ড্রয়েড এবং iOS অ্যাপ ব্যবহারকারীরা অপ্ট-ইন বিটা ভিত্তিতে ভয়েস কথোপকথনের অভিজ্ঞতা নিতে পারবেন। ইমেজ-ভিত্তিক অনুসন্ধান বৈশিষ্ট্য, যাইহোক, ডিফল্টরূপে সমস্ত প্ল্যাটফর্ম জুড়ে উপলব্ধ হবে।
AppMaster মতো অনেক no-code প্ল্যাটফর্ম, এই উন্নত ChatGPT অদূর ভবিষ্যতে পাওয়া যাবে এমন অ্যাপ্লিকেশনের বিস্তৃত পরিসর দেখার জন্য অধীর আগ্রহে অপেক্ষা করছে। কোনো কোড ছাড়াই এন্টারপ্রাইজ সফ্টওয়্যার তৈরি করতে প্রায়ই উচ্চতর ইন্টারঅ্যাক্টিভিটি এবং ব্যবহারকারীর অভিজ্ঞতা বৃদ্ধির জন্য এই ধরনের পরিশীলিত AI সহায়তার প্রয়োজন হয়।