OpenAI, कृत्रिम बुद्धिमत्ता में एक प्रमुख खिलाड़ी, अपने सम्मानित सहायक, ChatGPT की क्षमताओं का विस्तार कर रहा है। मूल रूप से एक टेक्स्ट-आधारित खोज उपकरण के रूप में डिज़ाइन किया गया, ChatGPT अब आवाज और छवि प्रसंस्करण क्षमताओं को प्रदर्शित करेगा, जो अपने उपयोगकर्ताओं के लिए अधिक इंटरैक्टिव अनुभव तैयार करेगा।
लगभग नौ महीने पहले इसकी शुरुआत के बाद से, ChatGPT प्रौद्योगिकी स्पेक्ट्रम में एक बड़ी घटना बन गई है। निबंध लिखने, कविताएँ बनाने और सरल पाठ संकेतों से व्यापक पाठों को सारांशित करने की इसकी क्षमता के लिए इसकी बहुत सराहना की जाती है। हालाँकि, AI असिस्टेंट अब और भी अधिक आकर्षक बनने के लिए तैयार है। अब यह उपयोगकर्ताओं को अपने कान देगा, जिससे मुखर बातचीत की अनुमति मिलेगी।
उपयोगकर्ताओं को ChatGPT के साथ ध्वनि संवाद में शामिल होने का अवसर मिलेगा। उदाहरण के लिए, सहायक को उपयोगकर्ता के मौखिक संकेतों द्वारा निर्देशित एक अचानक सोते समय की कहानी सुनाने के लिए कहा जा सकता है। सहायता के लिए सरल प्रश्न भी पूछे जा सकते हैं और उत्तर मौखिक भाषा में दिए जाएंगे।
इसके अतिरिक्त, छवि-आधारित खोज सुविधाएँ उपलब्ध कराई गई हैं। उपयोगकर्ता एक छवि अपलोड कर सकते हैं और ChatGPT अपलोड किए गए आइटम को पहचानने या समझाने या किसी विशिष्ट लक्ष्य को प्राप्त करने के लिए निर्देशों का अनुरोध करने के लिए कह सकते हैं।
ChatGPT की आवाज इंटरेक्शन की क्षमताओं को एक बेहतर टेक्स्ट-टू-स्पीच मॉडल द्वारा ठीक किया गया है जो टेक्स्ट और एक छोटे भाषण नमूने से मानव जैसी आवाजें उत्पन्न कर सकता है। OpenAI खुलासा किया कि उसने पांच विशिष्ट आवाजें तैयार करने के लिए कुशल आवाज अभिनेताओं के साथ सहयोग किया है। संगठन का ओपन-सोर्स व्हिस्पर वाक् पहचान प्रणाली वाक् को पाठ में परिवर्तित करने के लिए अंतर्निहित तकनीक के रूप में कार्य करती है।
एक रोमांचक विकास में, Spotify ने लॉन्च पार्टनर के रूप में कदम रखा है। इसने पॉडकास्टरों के लिए एक मूल्यवान सुविधा पेश की है जो उन्हें अपनी मूल आवाज टोन को बनाए रखते हुए अपने शो को अंग्रेजी से स्पेनिश, फ्रेंच या जर्मन में ट्रांसक्रिप्ट करने की अनुमति देती है। फिर भी, OpenAI खुलासा किया कि इस तकनीक तक पहुंच सार्वभौमिक नहीं है। शुरुआती लॉन्च के लिए यह केवल डैक्स शेपर्ड, मोनिका पैडमैन, लेक्स फ्रिडमैन, बिल सिमंस और स्टीवन बार्टलेट सहित चुनिंदा पॉडकास्टरों के लिए उपलब्ध है।
एक ब्लॉग पोस्ट में, OpenAI दुष्ट तत्वों द्वारा धोखाधड़ी या गलत बयानी की संभावना के संबंध में अपनी नई वॉयस तकनीक से जुड़े संभावित जोखिमों को स्वीकार किया। इस प्रकार, वह यह सुनिश्चित कर रही है कि इसकी रिलीज पर कोई विवाद न खड़ा हो।
इन नई सुविधाओं के अनावरण की योजना अगले पखवाड़े में बनाई गई है। शुरुआत में वे प्लस और एंटरप्राइज सब्सक्राइबर्स के लिए उपलब्ध होंगे। वॉयस सुविधाओं का आनंद लेने के लिए, उपयोगकर्ताओं को ऐप पर 'सेटिंग्स' पर नेविगेट करना होगा, 'नई सुविधाओं' का चयन करना होगा, वॉयस वार्तालाप के लिए ऑप्ट-इन करना होगा, शीर्ष-दाएं कोने पर स्थित हेडफोन बटन को टैप करना होगा और अंत में, को चुनना होगा। पसंदीदा आवाज़.
शुरुआत के लिए, केवल ChatGPT एंड्रॉइड और आईओएस ऐप उपयोगकर्ता ऑप्ट-इन बीटा आधार पर ध्वनि वार्तालाप का अनुभव कर पाएंगे। हालाँकि, छवि-आधारित खोज सुविधा डिफ़ॉल्ट रूप से सभी प्लेटफ़ॉर्म पर उपलब्ध हो जाएगी।
AppMaster जैसे कई no-code प्लेटफ़ॉर्म निकट भविष्य में इस उन्नत ChatGPT प्राप्त होने वाले अनुप्रयोगों की विस्तृत श्रृंखला को देखने का उत्सुकता से इंतजार कर रहे हैं। बिना किसी कोड के एंटरप्राइज़ सॉफ़्टवेयर बनाने के लिए अक्सर बेहतर इंटरैक्टिविटी और उपयोगकर्ता अनुभव को बढ़ाने के लिए ऐसी परिष्कृत एआई सहायता की आवश्यकता होती है।