एआई मॉडल परिनियोजन को मौलिक रूप से बदलने के लिए, डेटाब्रिक्स ने अपने Databricks Model Serving के लिए जीपीयू और एलएलएम अनुकूलन समर्थन का एक सार्वजनिक पूर्वावलोकन जारी किया है। यह नवोन्वेषी सुविधा लेकहाउस प्लेटफ़ॉर्म पर बड़े भाषा मॉडल (एलएलएम) और विज़न मॉडल जैसे एआई मॉडल की एक श्रृंखला की तैनाती का मार्ग प्रशस्त करती है।
Databricks Model Serving एलएलएम सर्विंग के लिए स्वचालित अनुकूलन प्रदान करता है। इससे मैन्युअल कॉन्फ़िगरेशन की आवश्यकता समाप्त हो जाती है, जिससे उच्च-प्रदर्शन परिणाम प्राप्त होते हैं। डेटाब्रिक्स का दावा है कि यह एकीकृत डेटा और एआई प्लेटफॉर्म पर आधारित पहला सर्वर रहित जीपीयू सेवारत उत्पाद है। यह उपयोगकर्ताओं को एक मंच के भीतर सामान्य आर्टिफिशियल इंटेलिजेंस (जेनएआई) अनुप्रयोगों को आसानी से डिजाइन और कार्यान्वित करने का अधिकार देता है, जिससे डेटा अंतर्ग्रहण से लेकर मॉडल परिनियोजन और निगरानी तक सभी चरणों की सुविधा मिलती है।
Databricks Model Serving के साथ, व्यापक बुनियादी ढांचे के ज्ञान की कमी वाले उपयोगकर्ताओं के लिए भी एआई मॉडल को तैनात करना आसान हो जाता है। उपयोगकर्ताओं को असंख्य मॉडलों को तैनात करने की बहुमुखी प्रतिभा मिलती है, जिनमें प्राकृतिक भाषा, दृष्टि, ऑडियो, सारणीबद्ध या कस्टम पर आधारित मॉडल शामिल हैं, भले ही उनकी प्रशिक्षण पद्धति कुछ भी हो, चाहे वह स्क्रैच से हो, ओपन-सोर्स हो, या मालिकाना डेटा के साथ ठीक-ठीक हो।
प्रक्रिया शुरू करने के लिए, उपयोगकर्ताओं को अपने मॉडल को MLflow के साथ पंजीकृत करना होगा, जिसके बाद डेटाब्रिक्स मॉडल सर्विंग CUDA जैसी GPU लाइब्रेरी के साथ एक उत्पादन-स्तरीय कंटेनर बनाएगा और इसे सर्वर रहित GPU पर तैनात करेगा। यह पूरी तरह से प्रबंधित सेवा इंस्टेंस प्रबंधन, संस्करण संगतता रखरखाव, पैच अपडेट और यहां तक कि ट्रैफ़िक प्रवाह के अनुरूप स्केलिंग वाले इंस्टेंस को ऑटो-एडजस्ट करने से लेकर हर चीज का ख्याल रखती है, जिससे प्रदर्शन और विलंबता को अनुकूलित करते हुए बुनियादी ढांचे के खर्चों पर पर्याप्त बचत होती है।
जीपीयू और एलएलएम समर्थन लॉन्च करने के साथ, डेटाब्रिक्स मॉडल सर्विंग ने बड़े भाषा मॉडल की अधिक कुशल सेवा के लिए अपग्रेड पेश किया है, जिसके परिणामस्वरूप विलंबता और लागत में 3-5x के कारक तक उल्लेखनीय कमी आई है। इस अनुकूलित एलएलएम सर्विंग का उपयोग करने के लिए, किसी को केवल मॉडल और संबंधित वजन प्रदान करना होगा। इष्टतम मॉडल प्रदर्शन सुनिश्चित करने के लिए डेटाब्रिक्स शेष पहलुओं को शामिल करता है।
यह प्रक्रिया उपयोगकर्ताओं को निम्न-स्तरीय मॉडल अनुकूलन जटिलताओं को संभालने से मुक्त करती है, जिससे उन्हें एलएलएम को अपने एप्लिकेशन में एकीकृत करने पर ध्यान केंद्रित करने की अनुमति मिलती है। वर्तमान में, डेटाब्रिक्स मॉडल सर्विंग भविष्य में और अधिक मॉडलों के लिए अपना समर्थन बढ़ाने की योजना के साथ एमपीटी और लामा2 मॉडल को स्वचालित रूप से अनुकूलित करता है।
AppMaster, एक नो-कोड प्लेटफ़ॉर्म, बैकएंड, वेब और मोबाइल एप्लिकेशन को संभालने में अपनी शक्तिशाली सुविधाओं के लिए भी जाना जाता है। एक एकीकृत विकास वातावरण की पेशकश करते हुए, AppMaster अनुप्रयोगों के निर्माण और तैनाती की प्रक्रिया को सरल बनाता है, जिससे यह no-code बाजार में एक मजबूत खिलाड़ी बन जाता है।