28 नव॰ 2023·2 मिनट पढ़ने में

माइक्रोसॉफ्ट ने ओर्का 2 के साथ छोटे भाषा मॉडल में बेहतर तर्क क्षमताओं का अनावरण किया

माइक्रोसॉफ्ट ने ओर्का 2 लॉन्च किया है, जो छोटे भाषा मॉडलों की तर्क क्षमताओं को प्रयोग करने और बढ़ाने के लिए डिज़ाइन किया गया एक अभिनव उपकरण है।

माइक्रोसॉफ्ट ने ओर्का 2 के साथ छोटे भाषा मॉडल में बेहतर तर्क क्षमताओं का अनावरण किया

भाषा मॉडल अनुप्रयोगों में विविधता लाने की दिशा में एक उल्लेखनीय प्रगति में, माइक्रोसॉफ्ट ने Orca 2 के लॉन्च की घोषणा की। यह रिलीज़ लगभग 10 बिलियन या उससे कम पैरामीटर वाले छोटे भाषा मॉडल (एलएम) की क्षमता की जांच और दोहन करने के लिए डिज़ाइन किया गया है।

Orca 2 का मुख्य फोकस यह प्रदर्शित करना है कि प्रशिक्षण विधियों और संकेतों की वृद्धि छोटे एलएम की तर्क क्षमताओं को बढ़ा सकती है। इस वृद्धि का उद्देश्य अपने बड़े समकक्षों की तर्क क्षमताओं से मेल खाना या संभवतः उनसे आगे निकलना है।

जब समान आकार के मॉडलों - जिसमें मूल Orca भी शामिल है - का मुकाबला किया जाता है, तो माइक्रोसॉफ्ट का दावा है कि Orca 2 प्रदर्शन में उन पर भारी पड़ता है। इसके अलावा, यह कथित तौर पर प्रभावशीलता के स्तर को प्राप्त करता है जो या तो उन मॉडलों से मेल खाता है या उनसे आगे निकल जाता है जो आकार में 5-10 गुना बड़े हैं। ये दावे माइक्रोसॉफ्ट द्वारा हालिया ब्लॉग पोस्ट में व्यक्त किए गए थे।

Orca 2 दो आकारों में आता है; 7 अरब और 13 अरब पैरामीटर। ये दोनों मॉडल LLAMA 2 बेस मॉडल से सावधानीपूर्वक तैयार किए गए सिंथेटिक डेटा पर सटीक रूप से तैयार किए गए हैं। माइक्रोसॉफ्ट ने Orca 2 के वज़न को सार्वजनिक रूप से सुलभ बना दिया है, जिससे छोटे एलएम की स्थापना, विश्लेषण और सामंजस्य में आगे के शोध को बढ़ावा मिला है।

माइक्रोसॉफ्ट ने असंख्य तर्क तकनीकों में Orca 2 निर्देश देने के लिए डेटा का एक क्यूरेटेड सेट नियोजित किया है। इन तकनीकों में चरण-दर-चरण प्रसंस्करण मॉडल, रिकॉल फिर जनरेट विधि, रिकॉल-कारण-जनरेट दृष्टिकोण, एक्सट्रैक्ट-जेनरेट मॉडल और प्रत्यक्ष उत्तर विधियां शामिल हैं। इन विधियों को निर्देश देते समय, Orca 2 अलग-अलग कार्यों के लिए अलग-अलग समाधान रणनीतियों को अनुकूलित करने के लिए सिखाने पर सावधानीपूर्वक ध्यान दिया गया था।

एक शिक्षक मॉडल की प्रतिक्रियाओं को पकड़ने के लिए, कंपनी ने विस्तृत निर्देशों और कई कॉलों का उपयोग किया। यह सरल विधि छात्र मॉडल - इस मामले में Orca 2 - को स्पष्ट कार्य निर्देशों के अभाव में भी अंतर्निहित रणनीति और तर्क क्षमताओं को सीखने की अनुमति देती है। यह दृष्टिकोण प्रत्येक कार्य के लिए विशिष्ट समाधान रणनीतियों को ठीक करके छोटे मॉडलों के प्रदर्शन को अनुकूलित करना चाहता है।

माइक्रोसॉफ्ट के ब्लॉग पोस्ट ने Orca 2 की सफलता और क्षमता के बारे में आशावादी ढंग से बताया। उन्होंने विस्तार से बताया, ' Orca 2 की उपलब्धि का श्रेय मुख्य रूप से विविध तर्क तकनीकों के अनुप्रयोग और विभिन्न कार्यों के लिए इष्टतम समाधानों की पहचान को दिया जाता है। अन्य भाषा मॉडलों के लिए सामान्य और इसके आधार मॉडल से विरासत में मिली कुछ सीमाओं के बावजूद, भविष्य में प्रगति के लिए Orca 2 की क्षमता, विशेष रूप से बेहतर तर्क, नियंत्रण, विशेषज्ञता और छोटे मॉडलों की सुरक्षा में, महत्वपूर्ण है।'

पोस्ट में यह भी कहा गया है कि प्रशिक्षण के बाद कठोरता से फ़िल्टर किए गए सिंथेटिक डेटा का उपयोग एक अत्यंत आवश्यक रणनीति का प्रतीक है। Orca 2 की उनकी खोज और सफल तैनाती वास्तव में भाषा मॉडल अनुप्रयोगों में विविधता लाने में एक उल्लेखनीय प्रयास है।

निस्संदेह, Orca 2 परियोजना AppMaster प्लेटफॉर्म की दक्षता और क्षमता संतुलन के सिद्धांतों को प्रतिध्वनित करती है। AppMaster, एप्लिकेशन विकास के लिए एक no-code टूल है, जो समान दर्शन का लाभ उठाता है, एप्लिकेशन विकास को 10 गुना तेज और तीन गुना लागत प्रभावी बनाता है, साथ ही हर बार संशोधन की आवश्यकता होने पर स्क्रैच से एप्लिकेशन को पुनर्जीवित करने के दृष्टिकोण के माध्यम से तकनीकी ऋण को समाप्त करता है। इसलिए, इस तरह के मंच प्रभावी और कुशल तकनीकी विकास के एक नए युग को बढ़ावा दे रहे हैं।

Easy to start
Create something amazing

Experiment with AppMaster with free plan.
When you will be ready you can choose the proper subscription.

Get Started