माइक्रोसॉफ्ट ने प्रीव्यू में वेक्टर सर्च और पूर्ण रिलीज में वॉयस क्लोनिंग का अनावरण किया
माइक्रोसॉफ्ट के इंस्पायर सम्मेलन ने एआई-केंद्रित घोषणाओं को सामने लाया। वेक्टर खोज, जो अब एज़्योर कॉग्निटिव सर्च में पूर्वावलोकन में है, और वॉयस क्लोनिंग सुविधा सबसे अलग है। ये उपकरण डेटा खोज को परिष्कृत करने और वैयक्तिकृत प्राकृतिक भाषा प्रतिक्रियाएँ प्रदान करने का वादा करते हैं।

वार्षिक इंस्पायर कॉन्फ्रेंस के दौरान, टेक कोलोसस Microsoft अपने एज़्योर प्लेटफॉर्म की क्षमताओं को बढ़ाने के लिए अपेक्षित नए एआई-संचालित सुविधाओं के एक सेट का अनावरण किया। स्पॉटलाइट वेक्टर सर्च टूल पर था, जो अब एज़्योर कॉग्निटिव सर्च के माध्यम से पूर्वावलोकन प्रारूप में उपलब्ध है। अपने मूल में मशीन लर्निंग के साथ, वेक्टर सर्च एक त्वरित खोज अनुभव का वादा करता है, क्योंकि यह छवियों और पाठ जैसे असंरचित डेटा के सार और संबंधितता को समझने के लिए अपनी क्षमताओं का लाभ उठाता है।
वेक्टर खोज द्वारा नियोजित तकनीक - वैश्वीकरण - खोज के क्षेत्र में गति प्राप्त कर रही है। इसमें शब्दों या छवियों को वेक्टर नामक संख्याओं के समूह में बदलना शामिल है, जो उनके अर्थ का प्रतिनिधित्व करते हैं। यह संख्यात्मक प्रतिनिधित्व गणितीय प्रसंस्करण की अनुमति देता है और मशीनों को डेटा को समझने और व्यवस्थित करने की अनुमति देता है। नतीजतन, मशीनें 'वेक्टर स्पेस' के भीतर 'किंग' और 'क्वीन' जैसे समान शब्दों को पहचान सकती हैं, और लाखों शब्दों वाले डेटाबेस में तुरंत उनका पता लगा सकती हैं। वेक्टर खोज के लिए इस दृष्टिकोण को Qdrant, SeMI Technologies और अमेज़ॅन और Google जैसे अन्य तकनीकी दिग्गजों सहित कई कंपनियों द्वारा अपनाया गया है।
अपने प्रतिस्पर्धियों से खुद को अलग करने के लिए, माइक्रोसॉफ्ट के वेक्टर खोज दृष्टिकोण में शुद्ध वेक्टर खोज, हाइब्रिड रिकवरी और उन्नत रीरैंकिंग शामिल हैं। कंपनी का मानना है कि उसके वेक्टर सर्च टूल को प्राकृतिक भाषा में व्यक्तिगत प्रतिक्रिया देने, उत्पाद सुझाव देने और डेटा में पैटर्न की पहचान करने में मदद करने के लिए ऐप्स और सेवाओं में नियोजित किया जा सकता है। इसके अलावा, इस प्रणाली के लाभों में खोज-एकीकृत, चैट-आधारित ऐप्स का निर्माण, Azure AI विज़न के साथ छवियों को वेक्टर अभ्यावेदन में परिवर्तित करना और प्रक्रिया और वर्कफ़्लो स्वचालन में सहायता के लिए बड़े डेटा-सेट से प्रासंगिक जानकारी पुनर्प्राप्त करना शामिल है। वेक्टर खोज का एकीकरण आगे चलकर अन्य Azure संज्ञानात्मक खोज क्षमताओं तक फैलता है, उनमें से पहलूगत नेविगेशन और फ़िल्टर शामिल हैं।
एआई परिदृश्य को और अधिक रोशन करते हुए, माइक्रोसॉफ्ट दस्तावेज़ जेनरेटर एआई समाधान पेश कर रहा है। यह सुविधा Microsoft की मौजूदा AI-संचालित दस्तावेज़ प्रसंस्करण सेवाओं - Azure फॉर्म रिकॉग्नाइज़र सहित - को Azure OpenAI सेवा के साथ एकीकृत करती है। यह सेवा Microsoft की पूरी तरह से प्रबंधित, उद्यम-केंद्रित पेशकश का एक पहलू है जिसका उद्देश्य व्यवसायों को OpenAI से AI तकनीक प्रदान करना है। OpenAI के साथ Microsoft की चल रही व्यावसायिक साझेदारी तकनीक में नियंत्रण और शासन सुविधाओं को पूरक करने में सहायक रही है।
OpenAI के नवीनतम AI भाषा मॉडल पर कार्य करते हुए, दस्तावेज़ जेनरेटर AI समाधान रिपोर्ट को सारांशित करने, मान निकालने, ज्ञान निकालने और नए प्रकार के दस्तावेज़ तैयार करने जैसे कार्यों के लिए फ़ाइलों को संसाधित करता है। यह OpenAI के ChatGPT के समान, प्रतिक्रियाओं के लिए एक आधार के रूप में भी कार्य करता है। उदाहरण के लिए, दस्तावेज़ जनरेटिव एआई समाधान ग्राहकों को चालान, अनुबंध, बिल अपलोड करने की अनुमति देता है और कर्मचारियों को सेवा गारंटी और विशिष्ट लाइन आइटम के बारे में पूछताछ करने में सक्षम बनाता है। समाधान मूल सामग्री के लिंक के साथ उद्धरण प्रस्तुत करते हुए पाठ प्रारूप, छवियों या तालिकाओं में उत्तर भी प्रदान करता है।
माइक्रोसॉफ्ट ने कहा कि दस्तावेज़ जेनरेटर एआई समाधान की क्षमताओं का लाभ दस्तावेज़ों और सामग्री निर्माण गतिविधियों के साथ प्राकृतिक भाषा में बातचीत के लिए उठाया जा सकता है। इनमें समाचार पत्र, ब्लॉग पोस्ट, सारांश, कैप्शन आदि शामिल हैं। माइक्रोसॉफ्ट का कहना है कि समाधान बुद्धिमान दस्तावेज़ चैट क्षमताओं, लेखन सहायता, व्यापक खोज कार्यक्षमता, क्वेरी समर्थन, दस्तावेज़ अनुवाद और बहुत कुछ जैसे कार्यों का समर्थन करता है। इन सभी जटिल और विविध दस्तावेज़ कार्यों को OpenAI के मॉडल द्वारा नियंत्रित किया जाता है।
एक लिंक किए गए खुलासे में, माइक्रोसॉफ्ट ने घोषणा की कि ओपनएआई का व्हिस्पर मॉडल, एक स्वचालित भाषण पहचान मॉडल, जल्द ही माइक्रोसॉफ्ट के एआई भाषण सेवाओं और एज़्योर ओपनएआई सेवा के परिवार में एकीकृत किया जाएगा। एंटरप्राइज़ ग्राहक ऑडियो सामग्री को ट्रांसक्रिप्ट और अनुवाद करने की क्षमता हासिल करने के साथ-साथ बड़े पैमाने पर बैच ट्रांसक्रिप्शन तैयार करने के लिए तैयार हैं।
इंस्पायर की अन्य प्रमुख घोषणाओं में, माइक्रोसॉफ्ट ने रियल-टाइम डायराइजेशन के लिए सार्वजनिक पूर्वावलोकन की पेशकश की घोषणा की, जो एक एआई-संचालित भाषण सेवा है जो यह पहचानने में सक्षम है कि वास्तविक समय में कई लोगों में से कौन बोल रहा है। इसके अलावा, माइक्रोसॉफ्ट ने कस्टम न्यूरल वॉयस की पहुंच को बढ़ाया, एक एआई उपकरण जो किसी अभिनेता की आवाज की बारीकी से नकल कर सकता है या मूल सिंथेटिक आवाज बना सकता है। पहले, इस सुविधा तक पहुंच प्रतिबंधित थी। हालाँकि, Microsoft को अब ग्राहकों को इस सुविधा का उपयोग करने के लिए आवेदन करने और अनुमोदन प्राप्त करने की आवश्यकता है। इसके अतिरिक्त, कस्टम न्यूरल वॉयस का उपयोग करने के लिए ग्राहकों को वॉयस टैलेंट की सहमति लेनी होगी और आचार संहिता से सहमत होना होगा।
Microsoft कस्टम न्यूरल वॉयस का उपयोग करके बनाई गई ऑडियो क्लिप की पहचान की सुविधा के लिए डिज़ाइन किए गए वॉटरमार्किंग और डिटेक्शन टूल भी प्रदान करता है। हालाँकि, ये उपकरण अकेले वॉयस क्लोनिंग तकनीक से जुड़े लाइसेंसिंग और सहमति के मुद्दों को निर्णायक रूप से हल नहीं कर सकते हैं। फिर भी माइक्रोसॉफ्ट ने फैसला किया है कि वह इस मामले से जुड़ी लड़ाई का हिस्सा नहीं बनेगी.
जबकि वेक्टर सर्च और कस्टम न्यूरल वॉयस जैसे उपकरण तकनीक की दुनिया को बदल रहे हैं, जी2 द्वारा No-code डेवलपमेंट प्लेटफॉर्म में हाई परफॉर्मर के रूप में पहचाने जाने वाले ऐपमास्टर जैसे प्लेटफॉर्म उन उपयोगकर्ताओं को आकर्षित कर रहे हैं जो न्यूनतम कोडिंग के साथ बैकएंड, वेब और मोबाइल एप्लिकेशन बनाना चाहते हैं। . तेजी से बदलते तकनीकी परिदृश्य में, यह देखना दिलचस्प होगा कि एआई कार्यक्षमताएं कैसे विकसित होती रहती हैं और हमारे भविष्य को आकार देती हैं।


