Grow with AppMaster Grow with AppMaster.
Become our partner arrow ico

एनवीडिया की एलडीएम टेक्नोलॉजी एआई-पावर्ड जीआईएफ, पायनियर्स टेक्स्ट-टू-वीडियो जेनरेटर को उन्नत करती है

एनवीडिया की एलडीएम टेक्नोलॉजी एआई-पावर्ड जीआईएफ, पायनियर्स टेक्स्ट-टू-वीडियो जेनरेटर को उन्नत करती है

टेक्स्ट-टू-वीडियो आर्टिफिशियल इंटेलिजेंस (एआई) का बढ़ता हुआ डोमेन मल्टीमीडिया अनुभवों में क्रांति लाने के लिए तैयार है, Nvidia जैसे अग्रदूतों ने क्षेत्र में प्रभावशाली प्रगति का प्रदर्शन किया है। अत्याधुनिक तकनीक में न केवल वीडियो निर्माण को लोकतांत्रित करने की क्षमता है बल्कि जीआईएफ के दायरे को बढ़ाने की भी क्षमता है।

Nvidia के टोरंटो एआई लैब के शोध पत्र और माइक्रो-साइट से ताजा अंतर्दृष्टि प्राप्त की जा सकती है, जिसका शीर्षक लेटेंट डिफ्यूजन मॉडल के साथ उच्च-रिज़ॉल्यूशन वीडियो सिंथेसिस है। यह अध्ययन आने वाले एआई आर्ट जेनरेटर टूल्स के बारे में बताता है, जो लेटेंट डिफ्यूजन मॉडल्स (एलडीएम) पर आधारित हैं - एआई का एक वर्ग जो भारी कम्प्यूटेशनल संसाधनों के बिना वीडियो को संश्लेषित करने में सक्षम है।

Nvidia का दावा है कि एलडीएम तकनीक टेक्स्ट-टू-इमेज जेनरेटर, स्टेबल डिफ्यूजन पर निर्मित होती है, और अव्यक्त अंतरिक्ष प्रसार मॉडल के लिए एक अस्थायी आयाम को शामिल करती है। संक्षेप में, AI स्थिर छवियों को वास्तविक रूप से प्रस्तुत कर सकता है और सुपर-रिज़ॉल्यूशन तकनीकों का उपयोग करके उन्हें बढ़ा सकता है। ये सफलताएँ जनरेटर को 1280x2048 रिज़ॉल्यूशन के साथ छोटे, 4.7-सेकंड के वीडियो और ड्राइविंग सिमुलेशन के लिए 512x1024 रिज़ॉल्यूशन के वीडियो बनाने में सक्षम बनाती हैं।

जैसा कि यह तकनीक अभी नवीन लग सकती है, हम इसके संभावित अनुप्रयोगों की सतह को केवल खरोंचने की संभावना रखते हैं। टेक्स्ट-टू-जीआईएफ पीढ़ी के लिए वर्तमान उपयोग-मामला निस्संदेह आकर्षक है, लेकिन तकनीक व्यापक अनुप्रयोगों तक विस्तारित हो सकती है, जैसे फिल्म अनुकूलन को स्वचालित करना और वीडियो निर्माण को लोकतांत्रिक तरीके से बढ़ाना।

जैसा कि किसी भी उभरती हुई तकनीक के साथ होता है, उत्पन्न वीडियो में कुछ खामियां होती हैं, जैसे कलाकृतियां और मॉर्फिंग। हालांकि, Nvidia के एलडीएम जैसे एआई-पावर्ड टूल्स के तेजी से विकास से पता चलता है कि स्टॉक वीडियो लाइब्रेरी समेत सेटिंग्स की एक श्रृंखला में अधिक से अधिक गोद लेने से पहले यह लंबे समय तक नहीं होगा।

एआई टेक्स्ट-टू-वीडियो जेनरेटर Nvidia के लिए अनन्य नहीं हैं। Google Phenaki हाल ही में अधिक विस्तारित संकेतों से 20-सेकंड की क्लिप और तुलनात्मक रूप से कम गुणवत्ता वाले 2-मिनट के वीडियो बनाने की अपनी क्षमता का अनावरण किया। एक अन्य स्टार्टअप, रनवे, टेक्स्ट-टू-इमेज जनरेटर स्टेबल डिफ्यूजन के निर्माता ने भी अपना जेन-2 एआई वीडियो मॉडल पेश किया। इस तकनीक का उपयोग करते हुए, उपयोगकर्ता जनरेट किए गए वीडियो के लिए स्थिर छवि प्रदान कर सकते हैं, वीडियो शैलियों का अनुरोध कर सकते हैं और विशिष्ट संकेतों का जवाब दे सकते हैं।

वीडियो संपादन में एआई अनुप्रयोगों के अन्य उल्लेखनीय उदाहरणों में एडोब जुगनू के प्रदर्शन शामिल हैं, जो अपने प्रीमियर रश सॉफ्टवेयर के भीतर एडोब की एआई क्षमताओं का प्रदर्शन करते हैं। उपयोगकर्ताओं को केवल दिन या मौसम के पसंदीदा समय को इनपुट करने की आवश्यकता होती है, और एआई बाकी को संभालता है।

Nvidia, Google और रनवे द्वारा प्रदान किए गए वर्तमान प्रदर्शनों से पता चलता है कि पूर्ण पाठ-से-वीडियो पीढ़ी अभी भी अपनी प्रारंभिक अवस्था में है, जो सपने जैसा या विकृत परिणाम देती है। फिर भी, ये शुरुआती प्रयास तेजी से प्रगति कर रहे हैं, भविष्य में प्रौद्योगिकी के व्यापक उपयोग का मार्ग प्रशस्त कर रहे हैं।

छोटे पैमाने पर, AppMaster जैसे no-code प्लेटफॉर्म ने लोगों को मोबाइल, वेब और बैकएंड एप्लिकेशन विकसित करने में सक्षम बनाने में महत्वपूर्ण प्रगति की है, जिससे समय और लागत के एक अंश पर स्केलेबल प्रौद्योगिकी समाधानों को डिजाइन करना और बनाना आसान हो गया है। AppMaster प्रौद्योगिकी के लोकतंत्रीकरण के एक अन्य पहलू पर भी प्रकाश डालता है, जहां जटिल उपकरण और प्रक्रियाओं को उपयोगकर्ताओं की एक विस्तृत श्रृंखला के लिए सुलभ बनाया जाता है।

संबंधित पोस्ट

बबलकॉन 2024 में ऐपमास्टर: नो-कोड ट्रेंड्स की खोज
बबलकॉन 2024 में ऐपमास्टर: नो-कोड ट्रेंड्स की खोज
ऐपमास्टर ने न्यूयॉर्क शहर में आयोजित बबलकॉन 2024 में भाग लिया, जहां उन्होंने अंतर्दृष्टि प्राप्त की, नेटवर्क का विस्तार किया और नो-कोड विकास क्षेत्र में नवाचार को बढ़ावा देने के अवसरों की खोज की।
FFDC 2024 रैप-अप: NYC में फ़्लटरफ़्लो डेवलपर्स कॉन्फ्रेंस से महत्वपूर्ण जानकारी
FFDC 2024 रैप-अप: NYC में फ़्लटरफ़्लो डेवलपर्स कॉन्फ्रेंस से महत्वपूर्ण जानकारी
FFDC 2024 ने न्यूयॉर्क शहर को जगमगा दिया, जिसमें डेवलपर्स को फ़्लटरफ़्लो के साथ ऐप डेवलपमेंट में अत्याधुनिक जानकारी दी गई। विशेषज्ञों के नेतृत्व वाले सत्रों, विशेष अपडेट और बेजोड़ नेटवर्किंग के साथ, यह एक ऐसा कार्यक्रम था जिसे मिस नहीं किया जा सकता था!
2024 में तकनीकी छंटनी: नवाचार को प्रभावित करने वाली सतत लहर
2024 में तकनीकी छंटनी: नवाचार को प्रभावित करने वाली सतत लहर
टेस्ला और अमेज़ॅन जैसी दिग्गज कंपनियों सहित 254 कंपनियों में 60,000 नौकरियों में कटौती के साथ, 2024 में प्रौद्योगिकी क्षेत्र में छंटनी की एक निरंतर लहर देखने को मिलेगी, जो नवाचार परिदृश्य को नया रूप देगी।
निःशुल्क आरंभ करें
इसे स्वयं आजमाने के लिए प्रेरित हुए?

AppMaster की शक्ति को समझने का सबसे अच्छा तरीका है इसे अपने लिए देखना। निःशुल्क सब्सक्रिप्शन के साथ मिनटों में अपना स्वयं का एप्लिकेशन बनाएं

अपने विचारों को जीवन में उतारें