২৬ সেপ, ২০২৩·1 মিনিট পড়তে

OpenAI মৌখিক কথোপকথন এবং চিত্র শনাক্তকরণ ক্ষমতা সহ ChatGPT এর কার্যকারিতা বাড়ায়

প্রযুক্তি জায়ান্ট, OpenAI, তার অত্যন্ত জনপ্রিয় AI সহকারী ChatGPT-এর জন্য আকর্ষণীয় নতুন বৈশিষ্ট্য ঘোষণা করেছে৷

OpenAI মৌখিক কথোপকথন এবং চিত্র শনাক্তকরণ ক্ষমতা সহ ChatGPT এর কার্যকারিতা বাড়ায়

OpenAI, কৃত্রিম বুদ্ধিমত্তার একটি বিশিষ্ট খেলোয়াড়, তার সম্মানিত সহকারী, ChatGPT এর ক্ষমতা প্রসারিত করছে। মূলত একটি টেক্সট-ভিত্তিক সার্চ টুল হিসাবে ডিজাইন করা হয়েছে, ChatGPT এখন ভয়েস এবং ইমেজ প্রসেসিং ক্ষমতাকে প্রস্ফুটিত করবে, এর ব্যবহারকারীদের জন্য আরও ইন্টারেক্টিভ অভিজ্ঞতা তৈরি করবে।

প্রায় নয় মাস আগে এর প্রবর্তনের পর থেকে, ChatGPT প্রযুক্তির বর্ণালীতে একটি বড় ঘটনা হয়ে উঠেছে। এটি প্রবন্ধ রচনা করার, কবিতা তৈরি করার এবং সাধারণ পাঠ্য সংকেত থেকে বিস্তৃত পাঠ্য সংক্ষিপ্ত করার ক্ষমতার জন্য গভীরভাবে প্রশংসিত। যাইহোক, এআই সহকারী এখন আরও বেশি আকর্ষক হয়ে উঠতে প্রস্তুত। এটি এখন ব্যবহারকারীদের কাছে তার কান ধার দেবে, ভোকাল মিথস্ক্রিয়া করার অনুমতি দেবে।

ব্যবহারকারীরা ChatGPT এর সাথে ভয়েস সংলাপে যুক্ত হওয়ার সুযোগ পাবেন। উদাহরণস্বরূপ, সহকারীকে ব্যবহারকারীর কাছ থেকে মৌখিক ইঙ্গিত দ্বারা নির্দেশিত একটি তাত্ক্ষণিক ঘুমের সময় গল্প বর্ণনা করতে বলা যেতে পারে। সহজ প্রশ্নগুলিও সাহায্যের জন্য নির্দেশিত হতে পারে, এবং উত্তরগুলি কথ্য ভাষায় প্রদান করা হবে।

উপরন্তু, ছবি ভিত্তিক অনুসন্ধান বৈশিষ্ট্য উপলব্ধ করা হয়েছে. ব্যবহারকারীরা একটি ছবি আপলোড করতে পারেন এবং ChatGPT আপলোড করা আইটেমটি সনাক্ত করতে বা ব্যাখ্যা করতে বা একটি নির্দিষ্ট লক্ষ্য অর্জনের জন্য নির্দেশাবলীর অনুরোধ করতে পারেন।

ChatGPT এর ভয়েস ইন্টারঅ্যাকশনের ক্ষমতাগুলি একটি উচ্চতর টেক্সট-টু-স্পিচ মডেল দ্বারা সূক্ষ্ম-টিউন করা হয়েছে যা পাঠ্য থেকে মানুষের মতো কণ্ঠস্বর এবং একটি সংক্ষিপ্ত বক্তৃতার নমুনা তৈরি করতে পারে। OpenAI প্রকাশ করেছে যে এটি পাঁচটি একচেটিয়া ভয়েস তৈরি করতে দক্ষ ভয়েস অভিনেতাদের সাথে সহযোগিতা করেছে। সংস্থার ওপেন-সোর্স হুইস্পার স্পিচ রিকগনিশন সিস্টেম বক্তৃতাকে পাঠ্যে রূপান্তর করার জন্য অন্তর্নিহিত প্রযুক্তি হিসাবে কাজ করে।

একটি উত্তেজনাপূর্ণ উন্নয়নে, Spotify একটি লঞ্চ অংশীদার হিসাবে পা দিয়েছে। এটি পডকাস্টারদের জন্য একটি মূল্যবান বৈশিষ্ট্য চালু করেছে যা তাদের মূল ভয়েস টোন বজায় রেখে ইংরেজি থেকে স্প্যানিশ, ফ্রেঞ্চ বা জার্মান ভাষায় তাদের শো প্রতিলিপি করতে দেয়। তবুও, OpenAI প্রকাশ করে যে এই প্রযুক্তিতে অ্যাক্সেস সর্বজনীন নয়। এটি শুধুমাত্র প্রাথমিক লঞ্চের জন্য ড্যাক্স শেপার্ড, মনিকা প্যাডম্যান, লেক্স ফ্রিডম্যান, বিল সিমন্স এবং স্টিভেন বার্টলেট সহ পডকাস্টারদের জন্য উপলব্ধ।

একটি ব্লগ পোস্টে, OpenAI তার নতুন ভয়েস প্রযুক্তির সাথে সম্পৃক্ত সম্ভাব্য ঝুঁকিগুলি স্বীকার করেছে, দুর্বৃত্তদের দ্বারা প্রতারণা বা ভুল উপস্থাপনের সম্ভাবনা সম্পর্কিত। এইভাবে, এটি নিশ্চিত করছে যে এটির মুক্তি নিয়ে কোনও বিতর্ক সৃষ্টি হবে না।

এই নতুন বৈশিষ্ট্যগুলির উন্মোচন পরবর্তী পাক্ষিকের জন্য পরিকল্পনা করা হয়েছে। তারা প্রাথমিকভাবে প্লাস এবং এন্টারপ্রাইজ গ্রাহকদের কাছে অ্যাক্সেসযোগ্য হবে। ভয়েস বৈশিষ্ট্যগুলি উপভোগ করতে, ব্যবহারকারীদের অ্যাপের 'সেটিংস'-এ নেভিগেট করতে হবে, 'নতুন বৈশিষ্ট্য' নির্বাচন করতে হবে, ভয়েস কথোপকথনে অপ্ট-ইন করতে হবে, উপরের-ডান কোণায় অবস্থিত হেডফোন বোতামে আলতো চাপুন এবং অবশেষে, বেছে নিন পছন্দের ভয়েস।

শুরুতে, শুধুমাত্র ChatGPT অ্যান্ড্রয়েড এবং iOS অ্যাপ ব্যবহারকারীরা অপ্ট-ইন বিটা ভিত্তিতে ভয়েস কথোপকথনের অভিজ্ঞতা নিতে পারবেন। ইমেজ-ভিত্তিক অনুসন্ধান বৈশিষ্ট্য, যাইহোক, ডিফল্টরূপে সমস্ত প্ল্যাটফর্ম জুড়ে উপলব্ধ হবে।

AppMaster মতো অনেক no-code প্ল্যাটফর্ম, এই উন্নত ChatGPT অদূর ভবিষ্যতে পাওয়া যাবে এমন অ্যাপ্লিকেশনের বিস্তৃত পরিসর দেখার জন্য অধীর আগ্রহে অপেক্ষা করছে। কোনো কোড ছাড়াই এন্টারপ্রাইজ সফ্টওয়্যার তৈরি করতে প্রায়ই উচ্চতর ইন্টারঅ্যাক্টিভিটি এবং ব্যবহারকারীর অভিজ্ঞতা বৃদ্ধির জন্য এই ধরনের পরিশীলিত AI সহায়তার প্রয়োজন হয়।

Easy to start
Create something amazing

Experiment with AppMaster with free plan.
When you will be ready you can choose the proper subscription.

Get Started