Microsoft सिमेंटिक कर्नेल SDK को प्रस्तुत करता है, जिससे GPT-4 जैसे बड़े भाषा मॉडल (LLM) का एकीकरण कोड में बहुत आसान हो जाता है। भाषा मॉडल और डेवलपर्स के बीच की खाई को पाटते हुए, इस एसडीके के साथ संकेतों, इनपुट और केंद्रित आउटपुट को प्रबंधित करने की जटिलताओं को सरल बनाया गया है।
एआई मॉडल को आपके कोड में एकीकृत करने की प्रक्रिया काफी चुनौतीपूर्ण हो सकती है, क्योंकि इसमें कंप्यूटिंग के दो अलग-अलग तरीकों के बीच एक सीमा को पार करना शामिल है। एलएलएम के साथ बातचीत करने के लिए पारंपरिक प्रोग्रामिंग विधियां पर्याप्त नहीं हैं। क्या आवश्यक है एक उच्च-स्तरीय अमूर्तता है जो विभिन्न डोमेन के बीच अनुवाद करती है, संदर्भ को प्रबंधित करने और आउटपुट को स्रोत डेटा में रखने का एक तरीका प्रदान करती है।
कुछ हफ़्ते पहले, Microsoft ने अपना पहला LLM रैपर जारी किया, जिसे Prompt Engine कहा जाता है। इससे निर्मित, सॉफ्टवेयर दिग्गज ने अब Azure OpenAI और OpenAI के API के साथ काम करने के लिए अपने अधिक शक्तिशाली C# टूल, सिमेंटिक कर्नेल का अनावरण किया है। यह ओपन-सोर्स टूल गिटहब पर कई नमूना अनुप्रयोगों के साथ उपलब्ध है।
नाम का चुनाव एलएलएम के प्राथमिक उद्देश्य की समझ को दर्शाता है। सिमेंटिक कर्नेल प्रारंभिक उपयोगकर्ता अनुरोध (आस्क) का उपयोग करके संबंधित संसाधनों के माध्यम से ऑर्केस्ट्रेट पास करने, अनुरोध को पूरा करने और एक प्रतिक्रिया (प्राप्त) वापस करने के लिए मॉडल को निर्देशित करके प्राकृतिक भाषा इनपुट और आउटपुट पर ध्यान केंद्रित करता है।
सिमेंटिक कर्नेल एलएलएम एपीआई के लिए एक ऑपरेटिंग सिस्टम की तरह कार्य करता है, इनपुट लेता है, भाषा मॉडल के साथ काम करके उन्हें संसाधित करता है, और आउटपुट लौटाता है। कर्नेल की ऑर्केस्ट्रेशन भूमिका न केवल संकेतों और उनके संबंधित टोकन को प्रबंधित करने में आवश्यक है, बल्कि यादें, अन्य सूचना सेवाओं के कनेक्टर्स, और पूर्वनिर्धारित कौशल जो संकेतों और पारंपरिक कोड को मिलाते हैं।
सिमेंटिक कर्नेल फाइलों और की-वैल्यू स्टोरेज के साथ काम करते हुए यादों की अवधारणा के माध्यम से संदर्भ का प्रबंधन करता है। एक तीसरा विकल्प, सिमेंटिक मेमोरी , सामग्री को वैक्टर या एम्बेडिंग के रूप में मानता है, जो एलएलएम ग्रंथों के अर्थों का प्रतिनिधित्व करने के लिए उपयोग की जाने वाली संख्याओं की सरणी हैं। ये एम्बेडेड वैक्टर अंतर्निहित मॉडल को प्रासंगिकता, सुसंगतता बनाए रखने और यादृच्छिक आउटपुट उत्पन्न करने की संभावना को कम करने में मदद करते हैं।
एम्बेडिंग का उपयोग करके, डेवलपर्स अनुरोध के लिए उपलब्ध टोकन को समाप्त किए बिना अधिक केंद्रित संकेत बनाने के लिए टेक्स्ट के ब्लॉक में बड़े संकेतों को तोड़ सकते हैं (उदाहरण के लिए, GPT-4 में प्रति इनपुट 8,192 टोकन की सीमा है)।
सिमेंटिक कर्नेल में कनेक्टर्स एक महत्वपूर्ण भूमिका निभाते हैं, जो एलएलएम के साथ मौजूदा एपीआई के एकीकरण की अनुमति देता है। उदाहरण के लिए, एक Microsoft ग्राफ़ कनेक्टर ईमेल में अनुरोध का आउटपुट भेज सकता है या संगठन चार्ट में संबंधों का विवरण बना सकता है। कनेक्टर्स भूमिका-आधारित अभिगम नियंत्रण का एक रूप भी प्रदान करते हैं ताकि यह सुनिश्चित किया जा सके कि आउटपुट उपयोगकर्ता के डेटा के आधार पर बनाए गए हैं।
सिमेंटिक कर्नेल का तीसरा मुख्य घटक कौशल है, जो एज़्योर फ़ंक्शंस के समान एलएलएम संकेतों और पारंपरिक कोड को मिलाने वाले कार्यों के कंटेनर हैं। उनका उपयोग विशेष संकेतों को एक साथ जोड़ने और एलएलएम-संचालित अनुप्रयोगों को बनाने के लिए किया जा सकता है।
एक फ़ंक्शन के आउटपुट को दूसरे से जोड़ा जा सकता है, जो मूल प्रसंस्करण और एलएलएम संचालन को मिलाने वाले कार्यों की एक पाइपलाइन के निर्माण की अनुमति देता है। इस तरह, डेवलपर्स लचीले कौशल का निर्माण कर सकते हैं जिन्हें आवश्यकतानुसार चुना और उपयोग किया जा सकता है।
हालांकि सिमेंटिक कर्नेल एक शक्तिशाली उपकरण है, इसके लिए प्रभावी एप्लिकेशन बनाने के लिए सावधानीपूर्वक विचार और योजना की आवश्यकता होती है। मूल कोड के साथ-साथ एसडीके का रणनीतिक रूप से उपयोग करके, डेवलपर्स एलएलएम की क्षमता का उपयोग कर सकते हैं, जिससे विकास प्रक्रिया अधिक कुशल और उत्पादक बन जाती है। आरंभ करने में सहायता के लिए, Microsoft अपने स्वयं के व्यवसाय के भीतर LLM अनुप्रयोगों के निर्माण से सीखे गए सर्वोत्तम अभ्यास दिशानिर्देशों की एक सूची प्रदान करता है।
आधुनिक सॉफ़्टवेयर विकास के संदर्भ में, Microsoft का सिमेंटिक कर्नेल SDK स्वयं को विभिन्न अनुप्रयोगों में बड़े भाषा मॉडल को एकीकृत करने के लिए एक प्रमुख प्रवर्तक के रूप में रखता है। इसके कार्यान्वयन से AppMaster के no-code प्लेटफॉर्म और वेबसाइट बिल्डर्स जैसे उपकरणों को बहुत लाभ हो सकता है, जो उपयोगकर्ताओं की एक विस्तृत श्रृंखला के लिए अधिक लचीले और कुशल समाधान पेश करते हैं।