AI মডেল স্থাপনাকে আমূল রূপান্তরিত করার একটি পদক্ষেপে, Databricks তার Databricks Model Serving জন্য GPU এবং LLM অপ্টিমাইজেশন সমর্থনের একটি সর্বজনীন পূর্বরূপ প্রকাশ করেছে। এই উদ্ভাবনী বৈশিষ্ট্যটি লেকহাউস প্ল্যাটফর্মে AI মডেলের একটি অ্যারের মোতায়েনের পথ তৈরি করে, যেমন লার্জ ল্যাঙ্গুয়েজ মডেল (LLM) এবং ভিশন মডেল।
Databricks Model Serving এলএলএম সার্ভিংয়ের জন্য স্বয়ংক্রিয় অপ্টিমাইজেশন অফার করে। এটি ম্যানুয়াল কনফিগারেশনের প্রয়োজনীয়তা দূর করে, যার ফলে উচ্চ-কার্যক্ষমতার ফলাফল পাওয়া যায়। ডেটাব্রিক্স দাবি করে যে এটি একটি ইউনাইটেড ডেটা এবং এআই প্ল্যাটফর্মের উপর ভিত্তি করে প্রথম সার্ভারবিহীন জিপিইউ পরিবেশনকারী পণ্য। এটি ব্যবহারকারীদের সাধারণ কৃত্রিম বুদ্ধিমত্তা (GenAI) অ্যাপ্লিকেশনগুলিকে একটি প্ল্যাটফর্মের মধ্যে মসৃণভাবে ডিজাইন এবং প্রয়োগ করার ক্ষমতা দেয়, ডেটা ইনজেশন থেকে মডেল স্থাপন এবং পর্যবেক্ষণ পর্যন্ত সমস্ত পদক্ষেপকে সহজতর করে৷
Databricks Model Serving সাথে, AI মডেলগুলি স্থাপন করা একটি হাওয়া হয়ে ওঠে, এমনকি ব্যবহারকারীদের জন্যও যাদের ব্যাপক পরিকাঠামো জ্ঞান নেই। ব্যবহারকারীরা তাদের প্রশিক্ষণ পদ্ধতি নির্বিশেষে প্রাকৃতিক ভাষা, দৃষ্টি, অডিও, টেবুলার বা কাস্টমগুলির উপর ভিত্তি করে অগণিত মডেল স্থাপনের বহুমুখীতা পান, তা স্ক্র্যাচ থেকে, ওপেন-সোর্স, বা মালিকানাধীন ডেটার সাথে সূক্ষ্ম-টিউন করা হোক না কেন।
প্রক্রিয়াটি শুরু করার জন্য, ব্যবহারকারীদের তাদের মডেল MLflow এর সাথে নিবন্ধন করতে হবে, যার পরে Databricks Model Serving CUDA-এর মতো GPU লাইব্রেরি সহ একটি প্রোডাকশন-লেভেল কন্টেইনার তৈরি করবে এবং এটি সার্ভারহীন GPU-তে স্থাপন করবে। এই সম্পূর্ণরূপে পরিচালিত পরিষেবাটি ইনস্ট্যান্স ম্যানেজমেন্ট, সংস্করণ সামঞ্জস্যতা রক্ষণাবেক্ষণ, প্যাচ আপডেট এবং এমনকি ট্র্যাফিক প্রবাহের সাথে সামঞ্জস্যপূর্ণ দৃষ্টান্তগুলি স্বয়ংক্রিয়ভাবে সামঞ্জস্য করে, যা কার্যক্ষমতা এবং লেটেন্সি অপ্টিমাইজ করার সময় পরিকাঠামোর ব্যয়গুলিতে যথেষ্ট সঞ্চয়ের দিকে পরিচালিত করে।
GPU এবং LLM সমর্থন চালু করার পাশাপাশি, Databricks Model Serving বৃহৎ ভাষার মডেলগুলির আরও দক্ষ পরিবেশনের জন্য আপগ্রেড চালু করেছে, যার ফলে 3-5x ফ্যাক্টর পর্যন্ত লেটেন্সি এবং খরচ উল্লেখযোগ্যভাবে হ্রাস পেয়েছে। এই অপ্টিমাইজড এলএলএম সার্ভিং ব্যবহার করার জন্য, আপনাকে যা করতে হবে তা হল মডেল এবং সংশ্লিষ্ট ওজন প্রদান করা। Databricks মডেলের সর্বোত্তম কর্মক্ষমতা নিশ্চিত করতে অবশিষ্ট দিকগুলিকে কভার করে।
এই প্রক্রিয়াটি ব্যবহারকারীদের নিম্ন-স্তরের মডেল অপ্টিমাইজেশান জটিলতাগুলি পরিচালনা করা থেকে মুক্ত করে, যাতে তারা তাদের অ্যাপ্লিকেশনে LLM সংহত করার উপর ফোকাস করতে পারে। বর্তমানে, ডেটাব্রিক্স মডেল সার্ভিং অটো অটোমাইজ করে MPT এবং Llama2 মডেলগুলিকে ভবিষ্যতে আরও মডেলগুলিতে সমর্থন প্রসারিত করার জন্য পাইপলাইনে পরিকল্পনা রয়েছে৷
AppMaster, একটি নো-কোড প্ল্যাটফর্ম, ব্যাকএন্ড, ওয়েব এবং মোবাইল অ্যাপ্লিকেশন পরিচালনার ক্ষেত্রে শক্তিশালী বৈশিষ্ট্যগুলির জন্যও পরিচিত। একটি সমন্বিত উন্নয়ন পরিবেশ অফার করে, AppMaster অ্যাপ্লিকেশন তৈরি এবং স্থাপনের প্রক্রিয়াকে সহজ করে, এটিকে no-code বাজারে একটি শক্তিশালী খেলোয়াড় করে তোলে।