Grow with AppMaster Grow with AppMaster.
Become our partner arrow ico

স্থিতিশীলতা AI প্রতিশ্রুতিশীল ভিডিও জেনারেশন মডেলগুলি উন্মোচন করেছে

স্থিতিশীলতা AI প্রতিশ্রুতিশীল ভিডিও জেনারেশন মডেলগুলি উন্মোচন করেছে

Stability AI, টেক স্পেসের একটি নেতৃস্থানীয় নাম, তাদের স্টেবল ভিডিও ডিফিউশন (SVD) লঞ্চ করার মাধ্যমে ভিডিও প্রজন্মের জগতে তার যুগান্তকারী প্রবেশ করেছে৷ এই অসাধারণ পদক্ষেপের সাথে, তারা দুটি অত্যন্ত উন্নত AI মডেল প্রদর্শন করেছে - SVD এবং SVD–XT, যা স্থির ছবি থেকে ছোট ভিডিও ক্লিপ তৈরি করার জন্য ডিজাইন করা হয়েছে।

যাইহোক, এখন পর্যন্ত, এই অত্যাধুনিক মডেলগুলি শুধুমাত্র গবেষণার উদ্দেশ্যে উন্মুক্ত। কোম্পানির মতে, SVD এবং SVD–XT উভয়ই উচ্চ-বিশ্বস্ততার ফলাফল অনুমোদন করে যা অন্যান্য বিদ্যমান কৃত্রিম ভিডিও জেনারেটরের কর্মক্ষমতাকে প্রতিদ্বন্দ্বী বা সম্ভাব্যভাবে ছাড়িয়ে যায়।

Stability AI লক্ষ্য হল এই ইমেজ-টু-ভিডিও মডেলগুলিকে সূক্ষ্ম-টিউন করার ক্ষেত্রে ব্যবহারকারীর প্রতিক্রিয়া থেকে উপকৃত হওয়া, গবেষণার পূর্বরূপের অংশ হিসাবে সেগুলিকে ওপেন-সোর্স করা। এই প্রচেষ্টা শেষ পর্যন্ত এই মডেলগুলি বাণিজ্যিকভাবে প্রয়োগ করার জন্য পথ প্রশস্ত করার জন্য কোম্পানির অভিপ্রায়কে নির্দেশ করে।

একটি কোম্পানির ব্লগ পোস্টে বিস্তারিত বলা হয়েছে যে SVD এবং SVD-XT সুপ্ত প্রসারণ মডেল নিয়োগ করে যা 576 x 1024 ভিডিও তৈরি করে, একটি কন্ডিশনার ফ্রেম হিসাবে একটি একক স্থির চিত্র ব্যবহার করে। যদিও আউটপুট ভিডিওগুলি সময়কালের মধ্যে সংক্ষিপ্ত - চার সেকেন্ডে সর্বোচ্চ - এই মডেলগুলি প্রতি সেকেন্ডে তিন ফ্রেম থেকে 30 ফ্রেম প্রতি সেকেন্ডের গতিতে সামগ্রী তৈরি করতে পারে৷ বিশেষত, SVD মডেলটি একটি স্থির চিত্র থেকে 14টি ফ্রেম আহরণের জন্য ক্যালিব্রেট করা হয়, যখন SVD-XT 25টি ফ্রেম তৈরি করার ক্ষমতা রাখে।

SVD তৈরি করতে, Stability AI আনুমানিক 600 মিলিয়ন নমুনা সমন্বিত একটি বিশাল, সতর্কতার সাথে তৈরি করা ভিডিও লাইব্রেরির উপর নির্ভর করে। কোম্পানী ডাটাবেসে সংকলিত নমুনাগুলিকে একটি প্রাথমিক মডেলকে প্রশিক্ষণের জন্য ব্যবহার করে, যা পরবর্তীতে চিত্র-টু-ভিডিও এবং পাঠ্য-থেকে-ভিডিও রূপান্তরের মতো ডাউনস্ট্রিম কাজগুলি পরিচালনা করার জন্য একটি ছোট, উচ্চ-ডিফ ডেটাসেট ব্যবহার করে পরিমার্জন করা হয়েছিল, যা এটিকে পূর্বাভাস দিতে সক্ষম করে। একটি একক কন্ডিশনার ইমেজ থেকে ফ্রেমের একটি ক্রম।

Stability AI দ্বারা প্রকাশিত একটি শ্বেতপত্র মাল্টি-ভিউ সংশ্লেষণ তৈরি করার জন্য একটি ডিফিউশন মডেলকে পরিমার্জিত করার জন্য একটি ভিত্তি হিসাবে SVD-এর সম্ভাব্যতাকে ব্যাখ্যা করে, এইভাবে একটি একক স্থির চিত্র থেকে একটি বস্তুর বেশ কয়েকটি সামঞ্জস্যপূর্ণ দৃষ্টিভঙ্গি তৈরি করতে সক্ষম করে।

কোম্পানির ব্লগ পোস্ট অনুসারে এটি শিক্ষা, বিনোদন এবং বিপণনের মতো বিভিন্ন ক্ষেত্রে সম্ভাব্য ব্যবহারের সুযোগের আধিক্য খুলে দেয়।

কোম্পানির প্রকাশের একটি উল্লেখযোগ্য নোট হল যে মানব পর্যালোচকদের দ্বারা পরিচালিত একটি বাহ্যিক মূল্যায়ন প্রকাশ করেছে যে SVD-এর আউটপুট রানওয়ে এবং পিকা ল্যাবসের মতো প্রতিযোগীদের দ্বারা উত্পাদিত প্রিমিয়ার ক্লোজড টেক্সট-টু-ভিডিও মডেলগুলির গুণমানকে ছাড়িয়ে গেছে।

প্রাথমিক সাফল্য সত্ত্বেও, Stability AI স্বীকার করে যে বর্তমান মডেলগুলিতে অনেক সীমাবদ্ধতা রয়েছে। উদাহরণস্বরূপ, এই মডেলগুলিতে মাঝে মাঝে ফটোরিয়্যালিস্টিক আউটপুটের অভাব থাকে, স্থির ভিডিও তৈরি করা হয় বা সঠিকভাবে মানুষের চিত্রগুলি প্রতিলিপি করার সাথে লড়াই করা হয়।

কিন্তু এটা শুধুমাত্র ভিডিও জেনারেশনে তাদের উদ্যোগের সূচনা। বর্তমান রিসার্চ প্রিভিউ-এর ডেটা বিদ্যমান ফাঁকগুলি চিহ্নিত করে এবং ভিডিওগুলিতে পাঠ্য প্রম্পট বা পাঠ্য রেন্ডারিং সমর্থন করার মতো নতুন বৈশিষ্ট্যগুলি প্রবর্তন করে এই মডেলগুলিকে বিকশিত করতে সাহায্য করবে, বাণিজ্যিক অ্যাপ্লিকেশনের জন্য প্রস্তুত করে৷

বিজ্ঞাপন, শিক্ষা এবং বিনোদন সহ কিন্তু সীমাবদ্ধ নয় এমন সেক্টরগুলিকে জুড়ে থাকা বিভিন্ন অ্যাপ্লিকেশনের সম্ভাবনার সাথে, অ্যাপমাস্টারের মতো প্ল্যাটফর্মগুলি, মোবাইল এবং ওয়েব অ্যাপ্লিকেশনগুলি সহজে তৈরি করার সরঞ্জামগুলির সাহায্যে ব্যবহারকারীদের ক্ষমতায়নের জন্য বিখ্যাত, স্থিতিশীল ভিডিও ডিফিউশন একটি দরকারী ইন্টিগ্রেশন খুঁজে পেতে পারে।

কোম্পানী ধারণা করে যে এই মডেলগুলির উন্মুক্ত তদন্তের ফলাফলগুলি আরও উদ্বেগ (যেমন পক্ষপাত) চিহ্নিত করবে এবং পরবর্তীতে একটি নিরাপদ স্থাপনার সুবিধার্থে সহায়তা করবে।

ইতিমধ্যে, বিভিন্ন ধরণের মডেল তৈরি করার পরিকল্পনা চলছে যা স্থিতিশীল প্রসারণ দ্বারা নির্মিত বেসকে শক্তিশালী এবং প্রসারিত করবে।

যাইহোক, কখন এই উন্নতিগুলি ব্যবহারকারীদের জন্য উপলব্ধ হবে তা অনিশ্চিত।

সম্পর্কিত পোস্ট

BubbleCon 2024-এ AppMaster: No-Code Trends অন্বেষণ
BubbleCon 2024-এ AppMaster: No-Code Trends অন্বেষণ
AppMaster NYC-তে BubbleCon 2024-এ অংশগ্রহণ করেছে, অন্তর্দৃষ্টি অর্জন করেছে, নেটওয়ার্ক প্রসারিত করছে এবং নো-কোড ডেভেলপমেন্ট স্পেসে উদ্ভাবন চালানোর সুযোগ অন্বেষণ করেছে।
FFDC 2024 Wrap-Up: NYC-তে FlutterFlow ডেভেলপারস কনফারেন্সের মূল অন্তর্দৃষ্টি
FFDC 2024 Wrap-Up: NYC-তে FlutterFlow ডেভেলপারস কনফারেন্সের মূল অন্তর্দৃষ্টি
FFDC 2024 নিউ ইয়র্ক সিটিকে আলোকিত করেছে, ফ্লুটারফ্লো-এর মাধ্যমে ডেভেলপারদের অ্যাপ ডেভেলপমেন্টে অত্যাধুনিক অন্তর্দৃষ্টি এনেছে। বিশেষজ্ঞ-নেতৃত্বাধীন সেশন, একচেটিয়া আপডেট, এবং অতুলনীয় নেটওয়ার্কিং সহ, এটি এমন একটি ইভেন্ট ছিল যা মিস করা যাবে না!
2024-এর প্রযুক্তি ছাঁটাই: উদ্ভাবনকে প্রভাবিত করছে অব্যাহত তরঙ্গ
2024-এর প্রযুক্তি ছাঁটাই: উদ্ভাবনকে প্রভাবিত করছে অব্যাহত তরঙ্গ
টেসলা এবং অ্যামাজনের মতো জায়ান্ট সহ 254টি কোম্পানিতে 60,000 চাকরি কাটার সাথে, 2024 সালে প্রযুক্তি ছাঁটাইয়ের একটি অব্যাহত তরঙ্গ উদ্ভাবনের ল্যান্ডস্কেপকে নতুন আকার দিতে দেখা যাচ্ছে।
বিনামূল্যে শুরু করুন
এটি নিজে চেষ্টা করার জন্য অনুপ্রাণিত?

AppMaster এর শক্তি বোঝার সর্বোত্তম উপায় হল এটি নিজের জন্য দেখা। বিনামূল্যে সাবস্ক্রিপশন সহ কয়েক মিনিটের মধ্যে আপনার নিজের অ্যাপ্লিকেশন তৈরি করুন

জীবনে আপনার আইডিয়া আনুন