০১ অক্টো, ২০২৩·1 মিনিট পড়তে

ডেটাব্রিক্স ডেটাব্রিক্স মডেল সার্ভিংয়ের জন্য GPU এবং LLM অপ্টিমাইজেশান সমর্থন উন্মোচন করে

Databricks Databricks মডেল সার্ভিংয়ের জন্য GPU এবং LLM অপ্টিমাইজেশান সমর্থনের একটি trailblazing সর্বজনীন পূর্বরূপ চালু করেছে৷

ডেটাব্রিক্স ডেটাব্রিক্স মডেল সার্ভিংয়ের জন্য GPU এবং LLM অপ্টিমাইজেশান সমর্থন উন্মোচন করে

AI মডেল স্থাপনাকে আমূল রূপান্তরিত করার একটি পদক্ষেপে, Databricks তার Databricks Model Serving জন্য GPU এবং LLM অপ্টিমাইজেশন সমর্থনের একটি সর্বজনীন পূর্বরূপ প্রকাশ করেছে। এই উদ্ভাবনী বৈশিষ্ট্যটি লেকহাউস প্ল্যাটফর্মে AI মডেলের একটি অ্যারের মোতায়েনের পথ তৈরি করে, যেমন লার্জ ল্যাঙ্গুয়েজ মডেল (LLM) এবং ভিশন মডেল।

Databricks Model Serving এলএলএম সার্ভিংয়ের জন্য স্বয়ংক্রিয় অপ্টিমাইজেশন অফার করে। এটি ম্যানুয়াল কনফিগারেশনের প্রয়োজনীয়তা দূর করে, যার ফলে উচ্চ-কার্যক্ষমতার ফলাফল পাওয়া যায়। ডেটাব্রিক্স দাবি করে যে এটি একটি ইউনাইটেড ডেটা এবং এআই প্ল্যাটফর্মের উপর ভিত্তি করে প্রথম সার্ভারবিহীন জিপিইউ পরিবেশনকারী পণ্য। এটি ব্যবহারকারীদের সাধারণ কৃত্রিম বুদ্ধিমত্তা (GenAI) অ্যাপ্লিকেশনগুলিকে একটি প্ল্যাটফর্মের মধ্যে মসৃণভাবে ডিজাইন এবং প্রয়োগ করার ক্ষমতা দেয়, ডেটা ইনজেশন থেকে মডেল স্থাপন এবং পর্যবেক্ষণ পর্যন্ত সমস্ত পদক্ষেপকে সহজতর করে৷

Databricks Model Serving সাথে, AI মডেলগুলি স্থাপন করা একটি হাওয়া হয়ে ওঠে, এমনকি ব্যবহারকারীদের জন্যও যাদের ব্যাপক পরিকাঠামো জ্ঞান নেই। ব্যবহারকারীরা তাদের প্রশিক্ষণ পদ্ধতি নির্বিশেষে প্রাকৃতিক ভাষা, দৃষ্টি, অডিও, টেবুলার বা কাস্টমগুলির উপর ভিত্তি করে অগণিত মডেল স্থাপনের বহুমুখীতা পান, তা স্ক্র্যাচ থেকে, ওপেন-সোর্স, বা মালিকানাধীন ডেটার সাথে সূক্ষ্ম-টিউন করা হোক না কেন।

প্রক্রিয়াটি শুরু করার জন্য, ব্যবহারকারীদের তাদের মডেল MLflow এর সাথে নিবন্ধন করতে হবে, যার পরে Databricks Model Serving CUDA-এর মতো GPU লাইব্রেরি সহ একটি প্রোডাকশন-লেভেল কন্টেইনার তৈরি করবে এবং এটি সার্ভারহীন GPU-তে স্থাপন করবে। এই সম্পূর্ণরূপে পরিচালিত পরিষেবাটি ইনস্ট্যান্স ম্যানেজমেন্ট, সংস্করণ সামঞ্জস্যতা রক্ষণাবেক্ষণ, প্যাচ আপডেট এবং এমনকি ট্র্যাফিক প্রবাহের সাথে সামঞ্জস্যপূর্ণ দৃষ্টান্তগুলি স্বয়ংক্রিয়ভাবে সামঞ্জস্য করে, যা কার্যক্ষমতা এবং লেটেন্সি অপ্টিমাইজ করার সময় পরিকাঠামোর ব্যয়গুলিতে যথেষ্ট সঞ্চয়ের দিকে পরিচালিত করে।

GPU এবং LLM সমর্থন চালু করার পাশাপাশি, Databricks Model Serving বৃহৎ ভাষার মডেলগুলির আরও দক্ষ পরিবেশনের জন্য আপগ্রেড চালু করেছে, যার ফলে 3-5x ফ্যাক্টর পর্যন্ত লেটেন্সি এবং খরচ উল্লেখযোগ্যভাবে হ্রাস পেয়েছে। এই অপ্টিমাইজড এলএলএম সার্ভিং ব্যবহার করার জন্য, আপনাকে যা করতে হবে তা হল মডেল এবং সংশ্লিষ্ট ওজন প্রদান করা। Databricks মডেলের সর্বোত্তম কর্মক্ষমতা নিশ্চিত করতে অবশিষ্ট দিকগুলিকে কভার করে।

এই প্রক্রিয়াটি ব্যবহারকারীদের নিম্ন-স্তরের মডেল অপ্টিমাইজেশান জটিলতাগুলি পরিচালনা করা থেকে মুক্ত করে, যাতে তারা তাদের অ্যাপ্লিকেশনে LLM সংহত করার উপর ফোকাস করতে পারে। বর্তমানে, ডেটাব্রিক্স মডেল সার্ভিং অটো অটোমাইজ করে MPT এবং Llama2 মডেলগুলিকে ভবিষ্যতে আরও মডেলগুলিতে সমর্থন প্রসারিত করার জন্য পাইপলাইনে পরিকল্পনা রয়েছে৷

AppMaster, একটি নো-কোড প্ল্যাটফর্ম, ব্যাকএন্ড, ওয়েব এবং মোবাইল অ্যাপ্লিকেশন পরিচালনার ক্ষেত্রে শক্তিশালী বৈশিষ্ট্যগুলির জন্যও পরিচিত। একটি সমন্বিত উন্নয়ন পরিবেশ অফার করে, AppMaster অ্যাপ্লিকেশন তৈরি এবং স্থাপনের প্রক্রিয়াকে সহজ করে, এটিকে no-code বাজারে একটি শক্তিশালী খেলোয়াড় করে তোলে।

Easy to start
Create something amazing

Experiment with AppMaster with free plan.
When you will be ready you can choose the proper subscription.

Get Started