০১ অক্টো, ২০২৩·1 মিনিট পড়তে

ডেটাব্রিক্স ডেটাব্রিক্স মডেল সার্ভিংয়ের জন্য GPU এবং LLM অপ্টিমাইজেশান সমর্থন উন্মোচন করে

Databricks Databricks মডেল সার্ভিংয়ের জন্য GPU এবং LLM অপ্টিমাইজেশান সমর্থনের একটি trailblazing সর্বজনীন পূর্বরূপ চালু করেছে৷

AI মডেল স্থাপনাকে আমূল রূপান্তরিত করার একটি পদক্ষেপে, Databricks তার Databricks Model Serving জন্য GPU এবং LLM অপ্টিমাইজেশন সমর্থনের একটি সর্বজনীন পূর্বরূপ প্রকাশ করেছে। এই উদ্ভাবনী বৈশিষ্ট্যটি লেকহাউস প্ল্যাটফর্মে AI মডেলের একটি অ্যারের মোতায়েনের পথ তৈরি করে, যেমন লার্জ ল্যাঙ্গুয়েজ মডেল (LLM) এবং ভিশন মডেল।

Databricks Model Serving এলএলএম সার্ভিংয়ের জন্য স্বয়ংক্রিয় অপ্টিমাইজেশন অফার করে। এটি ম্যানুয়াল কনফিগারেশনের প্রয়োজনীয়তা দূর করে, যার ফলে উচ্চ-কার্যক্ষমতার ফলাফল পাওয়া যায়। ডেটাব্রিক্স দাবি করে যে এটি একটি ইউনাইটেড ডেটা এবং এআই প্ল্যাটফর্মের উপর ভিত্তি করে প্রথম সার্ভারবিহীন জিপিইউ পরিবেশনকারী পণ্য। এটি ব্যবহারকারীদের সাধারণ কৃত্রিম বুদ্ধিমত্তা (GenAI) অ্যাপ্লিকেশনগুলিকে একটি প্ল্যাটফর্মের মধ্যে মসৃণভাবে ডিজাইন এবং প্রয়োগ করার ক্ষমতা দেয়, ডেটা ইনজেশন থেকে মডেল স্থাপন এবং পর্যবেক্ষণ পর্যন্ত সমস্ত পদক্ষেপকে সহজতর করে৷

Databricks Model Serving সাথে, AI মডেলগুলি স্থাপন করা একটি হাওয়া হয়ে ওঠে, এমনকি ব্যবহারকারীদের জন্যও যাদের ব্যাপক পরিকাঠামো জ্ঞান নেই। ব্যবহারকারীরা তাদের প্রশিক্ষণ পদ্ধতি নির্বিশেষে প্রাকৃতিক ভাষা, দৃষ্টি, অডিও, টেবুলার বা কাস্টমগুলির উপর ভিত্তি করে অগণিত মডেল স্থাপনের বহুমুখীতা পান, তা স্ক্র্যাচ থেকে, ওপেন-সোর্স, বা মালিকানাধীন ডেটার সাথে সূক্ষ্ম-টিউন করা হোক না কেন।

প্রক্রিয়াটি শুরু করার জন্য, ব্যবহারকারীদের তাদের মডেল MLflow এর সাথে নিবন্ধন করতে হবে, যার পরে Databricks Model Serving CUDA-এর মতো GPU লাইব্রেরি সহ একটি প্রোডাকশন-লেভেল কন্টেইনার তৈরি করবে এবং এটি সার্ভারহীন GPU-তে স্থাপন করবে। এই সম্পূর্ণরূপে পরিচালিত পরিষেবাটি ইনস্ট্যান্স ম্যানেজমেন্ট, সংস্করণ সামঞ্জস্যতা রক্ষণাবেক্ষণ, প্যাচ আপডেট এবং এমনকি ট্র্যাফিক প্রবাহের সাথে সামঞ্জস্যপূর্ণ দৃষ্টান্তগুলি স্বয়ংক্রিয়ভাবে সামঞ্জস্য করে, যা কার্যক্ষমতা এবং লেটেন্সি অপ্টিমাইজ করার সময় পরিকাঠামোর ব্যয়গুলিতে যথেষ্ট সঞ্চয়ের দিকে পরিচালিত করে।

GPU এবং LLM সমর্থন চালু করার পাশাপাশি, Databricks Model Serving বৃহৎ ভাষার মডেলগুলির আরও দক্ষ পরিবেশনের জন্য আপগ্রেড চালু করেছে, যার ফলে 3-5x ফ্যাক্টর পর্যন্ত লেটেন্সি এবং খরচ উল্লেখযোগ্যভাবে হ্রাস পেয়েছে। এই অপ্টিমাইজড এলএলএম সার্ভিং ব্যবহার করার জন্য, আপনাকে যা করতে হবে তা হল মডেল এবং সংশ্লিষ্ট ওজন প্রদান করা। Databricks মডেলের সর্বোত্তম কর্মক্ষমতা নিশ্চিত করতে অবশিষ্ট দিকগুলিকে কভার করে।

এই প্রক্রিয়াটি ব্যবহারকারীদের নিম্ন-স্তরের মডেল অপ্টিমাইজেশান জটিলতাগুলি পরিচালনা করা থেকে মুক্ত করে, যাতে তারা তাদের অ্যাপ্লিকেশনে LLM সংহত করার উপর ফোকাস করতে পারে। বর্তমানে, ডেটাব্রিক্স মডেল সার্ভিং অটো অটোমাইজ করে MPT এবং Llama2 মডেলগুলিকে ভবিষ্যতে আরও মডেলগুলিতে সমর্থন প্রসারিত করার জন্য পাইপলাইনে পরিকল্পনা রয়েছে৷

AppMaster, একটি নো-কোড প্ল্যাটফর্ম, ব্যাকএন্ড, ওয়েব এবং মোবাইল অ্যাপ্লিকেশন পরিচালনার ক্ষেত্রে শক্তিশালী বৈশিষ্ট্যগুলির জন্যও পরিচিত। একটি সমন্বিত উন্নয়ন পরিবেশ অফার করে, AppMaster অ্যাপ্লিকেশন তৈরি এবং স্থাপনের প্রক্রিয়াকে সহজ করে, এটিকে no-code বাজারে একটি শক্তিশালী খেলোয়াড় করে তোলে।

২৩ সেপ, ২০২৪

6 min

FFDC 2024 Wrap-Up: NYC-তে FlutterFlow ডেভেলপারস কনফারেন্সের মূল অন্তর্দৃষ্টি

FFDC 2024 নিউ ইয়র্ক সিটিকে আলোকিত করেছে, ফ্লুটারফ্লো-এর মাধ্যমে ডেভেলপারদের অ্যাপ ডেভেলপমেন্টে অত্যাধুনিক অন্তর্দৃষ্টি এনেছে। বিশেষজ্ঞ-নেতৃত্বাধীন সেশন, একচেটিয়া আপডেট, এবং অতুলনীয় নেটওয়ার্কিং সহ, এটি এমন একটি ইভেন্ট ছিল যা মিস করা যাবে না!

সম্পর্কিত খবর