في خطوة تهدف إلى إحداث تحول جذري في نشر نموذج الذكاء الاصطناعي، أصدرت Databricks معاينة عامة لدعم تحسين وحدة معالجة الرسومات وLLM Databricks Model Serving. تمهد هذه الميزة المبتكرة الطريق لنشر مجموعة من نماذج الذكاء الاصطناعي، مثل نماذج اللغات الكبيرة (LLMs) ونماذج الرؤية، على منصة Lakehouse.
يوفر Databricks Model Serving تحسينًا تلقائيًا لخدمة LLM. وهذا يلغي الحاجة إلى التكوين اليدوي، مما يؤدي إلى نتائج عالية الأداء. تدعي شركة Databricks أن هذا هو أول منتج يخدم وحدة معالجة الرسومات بدون خادم استنادًا إلى منصة موحدة للبيانات والذكاء الاصطناعي. فهو يمكّن المستخدمين من تصميم وتنفيذ تطبيقات الذكاء الاصطناعي العام (GenAI) بسلاسة ضمن منصة واحدة، مما يسهل جميع الخطوات بدءًا من استيعاب البيانات وحتى نشر النماذج ومراقبتها.
مع Databricks Model Serving ، يصبح نشر نماذج الذكاء الاصطناعي أمرًا سهلاً، حتى بالنسبة للمستخدمين الذين يفتقرون إلى المعرفة الشاملة بالبنية التحتية. يحصل المستخدمون على تنوع في نشر عدد لا يحصى من النماذج، بما في ذلك تلك القائمة على اللغة الطبيعية أو الرؤية أو الصوت أو الجداول أو النماذج المخصصة، بغض النظر عن طريقة التدريب الخاصة بهم، سواء كانت من الصفر أو مفتوحة المصدر أو مضبوطة بدقة باستخدام بيانات الملكية.
لبدء العملية، يحتاج المستخدمون إلى تسجيل نموذجهم في MLflow ، وبعد ذلك سيقوم Databricks Model Serving بإنشاء حاوية على مستوى الإنتاج كاملة مع مكتبات GPU مثل CUDA ونشرها على وحدات معالجة الرسومات بدون خادم. تعتني هذه الخدمة المُدارة بالكامل بكل شيء بدءًا من إدارة المثيلات، وصيانة توافق الإصدار، وتحديثات التصحيح، وحتى ضبط المثيلات تلقائيًا بما يتوافق مع تدفقات حركة المرور، مما يؤدي إلى توفير كبير في نفقات البنية التحتية مع تحسين الأداء ووقت الاستجابة.
إلى جانب إطلاق دعم GPU وLLM، قدمت Databricks Model Serving ترقيات لتقديم خدمة أكثر كفاءة لنماذج اللغات الكبيرة، مما أدى إلى انخفاض كبير في زمن الوصول والتكلفة، بما يصل إلى عامل 3-5x. لاستخدام خدمة LLM المُحسّنة هذه، كل ما عليك فعله هو توفير النموذج والأوزان المقابلة. يغطي Databricks الجوانب المتبقية لضمان الأداء الأمثل للنموذج.
تعمل هذه العملية على تخفيف أعباء المستخدمين عن التعامل مع تعقيدات تحسين النموذج منخفض المستوى، مما يسمح لهم بالتركيز على دمج LLM في تطبيقاتهم. في الوقت الحالي، تعمل خدمة Databricks Model Serving التلقائية على تحسين طرازي MPT وLlama2 من خلال خطط قيد التنفيذ لتوسيع دعمها ليشمل المزيد من النماذج في المستقبل.
AppMaster ، وهو نظام أساسي بدون تعليمات برمجية ، معروف أيضًا بميزاته القوية في التعامل مع تطبيقات الواجهة الخلفية والويب وتطبيقات الهاتف المحمول. من خلال توفير بيئة تطوير متكاملة، يعمل AppMaster على تبسيط عملية إنشاء التطبيقات ونشرها، مما يجعله لاعبًا قويًا في السوق no-code.