26 सित॰ 2023·1 मिनट पढ़ने में

ओपनएआई मौखिक बातचीत और छवि पहचान क्षमताओं के साथ चैटजीपीटी की कार्यक्षमता को बढ़ाता है

प्रौद्योगिकी दिग्गज, ओपनएआई ने अपने बेहद लोकप्रिय एआई सहायक चैटजीपीटी के लिए रोमांचक नई सुविधाओं की घोषणा की है।

OpenAI, कृत्रिम बुद्धिमत्ता में एक प्रमुख खिलाड़ी, अपने सम्मानित सहायक, ChatGPT की क्षमताओं का विस्तार कर रहा है। मूल रूप से एक टेक्स्ट-आधारित खोज उपकरण के रूप में डिज़ाइन किया गया, ChatGPT अब आवाज और छवि प्रसंस्करण क्षमताओं को प्रदर्शित करेगा, जो अपने उपयोगकर्ताओं के लिए अधिक इंटरैक्टिव अनुभव तैयार करेगा।

लगभग नौ महीने पहले इसकी शुरुआत के बाद से, ChatGPT प्रौद्योगिकी स्पेक्ट्रम में एक बड़ी घटना बन गई है। निबंध लिखने, कविताएँ बनाने और सरल पाठ संकेतों से व्यापक पाठों को सारांशित करने की इसकी क्षमता के लिए इसकी बहुत सराहना की जाती है। हालाँकि, AI असिस्टेंट अब और भी अधिक आकर्षक बनने के लिए तैयार है। अब यह उपयोगकर्ताओं को अपने कान देगा, जिससे मुखर बातचीत की अनुमति मिलेगी।

उपयोगकर्ताओं को ChatGPT के साथ ध्वनि संवाद में शामिल होने का अवसर मिलेगा। उदाहरण के लिए, सहायक को उपयोगकर्ता के मौखिक संकेतों द्वारा निर्देशित एक अचानक सोते समय की कहानी सुनाने के लिए कहा जा सकता है। सहायता के लिए सरल प्रश्न भी पूछे जा सकते हैं और उत्तर मौखिक भाषा में दिए जाएंगे।

इसके अतिरिक्त, छवि-आधारित खोज सुविधाएँ उपलब्ध कराई गई हैं। उपयोगकर्ता एक छवि अपलोड कर सकते हैं और ChatGPT अपलोड किए गए आइटम को पहचानने या समझाने या किसी विशिष्ट लक्ष्य को प्राप्त करने के लिए निर्देशों का अनुरोध करने के लिए कह सकते हैं।

ChatGPT की आवाज इंटरेक्शन की क्षमताओं को एक बेहतर टेक्स्ट-टू-स्पीच मॉडल द्वारा ठीक किया गया है जो टेक्स्ट और एक छोटे भाषण नमूने से मानव जैसी आवाजें उत्पन्न कर सकता है। OpenAI खुलासा किया कि उसने पांच विशिष्ट आवाजें तैयार करने के लिए कुशल आवाज अभिनेताओं के साथ सहयोग किया है। संगठन का ओपन-सोर्स व्हिस्पर वाक् पहचान प्रणाली वाक् को पाठ में परिवर्तित करने के लिए अंतर्निहित तकनीक के रूप में कार्य करती है।

एक रोमांचक विकास में, Spotify ने लॉन्च पार्टनर के रूप में कदम रखा है। इसने पॉडकास्टरों के लिए एक मूल्यवान सुविधा पेश की है जो उन्हें अपनी मूल आवाज टोन को बनाए रखते हुए अपने शो को अंग्रेजी से स्पेनिश, फ्रेंच या जर्मन में ट्रांसक्रिप्ट करने की अनुमति देती है। फिर भी, OpenAI खुलासा किया कि इस तकनीक तक पहुंच सार्वभौमिक नहीं है। शुरुआती लॉन्च के लिए यह केवल डैक्स शेपर्ड, मोनिका पैडमैन, लेक्स फ्रिडमैन, बिल सिमंस और स्टीवन बार्टलेट सहित चुनिंदा पॉडकास्टरों के लिए उपलब्ध है।

एक ब्लॉग पोस्ट में, OpenAI दुष्ट तत्वों द्वारा धोखाधड़ी या गलत बयानी की संभावना के संबंध में अपनी नई वॉयस तकनीक से जुड़े संभावित जोखिमों को स्वीकार किया। इस प्रकार, वह यह सुनिश्चित कर रही है कि इसकी रिलीज पर कोई विवाद न खड़ा हो।

इन नई सुविधाओं के अनावरण की योजना अगले पखवाड़े में बनाई गई है। शुरुआत में वे प्लस और एंटरप्राइज सब्सक्राइबर्स के लिए उपलब्ध होंगे। वॉयस सुविधाओं का आनंद लेने के लिए, उपयोगकर्ताओं को ऐप पर 'सेटिंग्स' पर नेविगेट करना होगा, 'नई सुविधाओं' का चयन करना होगा, वॉयस वार्तालाप के लिए ऑप्ट-इन करना होगा, शीर्ष-दाएं कोने पर स्थित हेडफोन बटन को टैप करना होगा और अंत में, को चुनना होगा। पसंदीदा आवाज़.

शुरुआत के लिए, केवल ChatGPT एंड्रॉइड और आईओएस ऐप उपयोगकर्ता ऑप्ट-इन बीटा आधार पर ध्वनि वार्तालाप का अनुभव कर पाएंगे। हालाँकि, छवि-आधारित खोज सुविधा डिफ़ॉल्ट रूप से सभी प्लेटफ़ॉर्म पर उपलब्ध हो जाएगी।

AppMaster जैसे कई no-code प्लेटफ़ॉर्म निकट भविष्य में इस उन्नत ChatGPT प्राप्त होने वाले अनुप्रयोगों की विस्तृत श्रृंखला को देखने का उत्सुकता से इंतजार कर रहे हैं। बिना किसी कोड के एंटरप्राइज़ सॉफ़्टवेयर बनाने के लिए अक्सर बेहतर इंटरैक्टिविटी और उपयोगकर्ता अनुभव को बढ़ाने के लिए ऐसी परिष्कृत एआई सहायता की आवश्यकता होती है।

23 सित॰ 2024

1 min

FFDC 2024 रैप-अप: NYC में फ़्लटरफ़्लो डेवलपर्स कॉन्फ्रेंस से महत्वपूर्ण जानकारी

FFDC 2024 ने न्यूयॉर्क शहर को जगमगा दिया, जिसमें डेवलपर्स को फ़्लटरफ़्लो के साथ ऐप डेवलपमेंट में अत्याधुनिक जानकारी दी गई। विशेषज्ञों के नेतृत्व वाले सत्रों, विशेष अपडेट और बेजोड़ नेटवर्किंग के साथ, यह एक ऐसा कार्यक्रम था जिसे मिस नहीं किया जा सकता था!

संबंधित समाचार