Grow with AppMaster Grow with AppMaster.
Become our partner arrow ico

تعمل تقنية LDM من Nvidia على رفع صور GIF المدعومة بالذكاء الاصطناعي ، ومولدات تحويل النص إلى الفيديو الرائدة </ h2>

تعمل تقنية LDM من Nvidia على رفع صور GIF المدعومة بالذكاء الاصطناعي ، ومولدات تحويل النص إلى الفيديو الرائدة </ h2>

يستعد المجال المزدهر للذكاء الاصطناعي لتحويل النص إلى فيديو (AI) لإحداث ثورة في تجارب الوسائط المتعددة ، حيث أظهر رواد مثل Nvidia تطورات رائعة في هذا المجال. لا تمتلك التكنولوجيا المتطورة فقط القدرة على إضفاء الطابع الديمقراطي على إنشاء الفيديو ولكن أيضًا لتوسيع نطاق صور GIF.

يمكن استخلاص رؤى جديدة من الورقة البحثية والموقع المصغر لمختبر تورونتو للذكاء الاصطناعي من Nvidia ، بعنوان تركيب فيديو عالي الدقة مع نماذج الانتشار الكامنة . تتعمق الدراسة في أدوات إنشاء الفن بالذكاء الاصطناعي القادمة والمرتكزة على نماذج الانتشار الكامن (LDMs) - فئة من الذكاء الاصطناعي قادرة على توليف مقاطع الفيديو دون إرهاق الموارد الحسابية.

تؤكد Nvidia أن تقنية LDM تعتمد على مولد تحويل النص إلى صورة ، الانتشار المستقر ، وتضم بُعدًا زمنيًا لنموذج انتشار الفضاء الكامن. في الأساس ، يمكن للذكاء الاصطناعي تقديم صور ثابتة بشكل واقعي ورفع مستواها باستخدام تقنيات فائقة الدقة. تمكن هذه الاختراقات المولد من إنشاء مقاطع فيديو أقصر مدتها 4.7 ثانية بدقة 1280 × 2048 ومقاطع فيديو أطول بدقة 512 × 1024 لمحاكاة القيادة.

على الرغم من أن هذه التقنية قد تبدو مبتكرة في الوقت الحالي ، فمن المحتمل أننا نخدش سطح تطبيقاتها المحتملة فقط. إن حالة الاستخدام الحالية لتوليد تحويل النص إلى GIF رائعة بلا شك ، لكن التكنولوجيا يمكن أن تمتد إلى تطبيقات أوسع ، مثل أتمتة تعديلات الفيلم وتعزيز إنشاء الفيديو بشكل ديمقراطي.

كما هو الحال مع أي تقنية مزدهرة ، هناك بعض العيوب في مقاطع الفيديو التي تم إنشاؤها ، مثل القطع الأثرية والتحول. ومع ذلك ، فإن التطور السريع للأدوات التي تعمل بالذكاء الاصطناعي مثل LDMs من Nvidia يشير إلى أنه لن يمر وقت طويل قبل أن تجد اعتمادًا أكبر في مجموعة من الإعدادات ، بما في ذلك مكتبات الفيديو المخزنة.

مولدات تحويل النص إلى فيديو بالذكاء الاصطناعي ليست حصرية لشركة Nvidia. كشفت Google Phenaki مؤخرًا عن قدرتها على إنتاج مقاطع مدتها 20 ثانية من مطالبات أطول ومقطع فيديو مدته دقيقتان بجودة أقل نسبيًا. كما قدمت شركة ناشئة أخرى ، Runway ، التي ابتكرت منشئ تحويل النص إلى صورة Stable Diffusion ، نموذج الفيديو Gen-2 AI الخاص بها. باستخدام هذه التقنية ، يمكن للمستخدمين توفير صورة ثابتة للفيديو الذي تم إنشاؤه وطلب أنماط الفيديو والاستجابة لمطالبات محددة.

تشمل الأمثلة البارزة الأخرى لتطبيقات الذكاء الاصطناعي في تحرير الفيديو عروض Adobe Firefly ، والتي تعرض قدرات Adobe AI داخل برنامج Premiere Rush الخاص بها. يحتاج المستخدمون ببساطة إلى إدخال الوقت المفضل من اليوم أو الموسم ، ويتولى الذكاء الاصطناعي الباقي.

توضح العروض الحالية التي قدمتها Nvidia و Google و Runway أن إنشاء النص الكامل لتحويل النص إلى فيديو لا يزال في مراحله الأولى ، مما يؤدي إلى نتائج مشوهة أو تشبه الحلم. ومع ذلك ، فإن هذه المساعي المبكرة تدفع التقدم السريع ، مما يمهد الطريق لاستخدام التكنولوجيا على نطاق أوسع في المستقبل.

على نطاق أصغر ، قطعت الأنظمة الأساسية no-code مثل AppMaster خطوات كبيرة في تمكين الأشخاص من تطوير تطبيقات الهاتف المحمول والويب والخلفية ، مما يسهل تصميم وإنشاء حلول تقنية قابلة للتطوير في جزء بسيط من الوقت والتكلفة. يسلط AppMaster الضوء أيضًا على جانب آخر من إضفاء الطابع الديمقراطي على التكنولوجيا ، حيث يتم إتاحة الأدوات والعمليات المعقدة لمجموعة واسعة من المستخدمين.

المنشورات ذات الصلة

AppMaster في BubbleCon 2024: استكشاف اتجاهات عدم استخدام التعليمات البرمجية
AppMaster في BubbleCon 2024: استكشاف اتجاهات عدم استخدام التعليمات البرمجية
شاركت AppMaster في مؤتمر BubbleCon 2024 في مدينة نيويورك، واكتسبت رؤى، وقامت بتوسيع الشبكات، واستكشاف الفرص لتعزيز الابتكار في مجال التطوير بدون أكواد.
ملخص مؤتمر FlutterFlow للمطورين لعام 2024: رؤى رئيسية من مؤتمر FlutterFlow للمطورين في مدينة نيويورك
ملخص مؤتمر FlutterFlow للمطورين لعام 2024: رؤى رئيسية من مؤتمر FlutterFlow للمطورين في مدينة نيويورك
أضاء مؤتمر FFDC 2024 مدينة نيويورك، حيث قدم للمطورين رؤى متطورة في تطوير التطبيقات باستخدام FlutterFlow. مع الجلسات التي يقودها الخبراء والتحديثات الحصرية والتواصل الذي لا مثيل له، كان حدثًا لا ينبغي تفويته!
تسريحات العاملين في قطاع التكنولوجيا في عام 2024: الموجة المستمرة التي تؤثر على الابتكار
تسريحات العاملين في قطاع التكنولوجيا في عام 2024: الموجة المستمرة التي تؤثر على الابتكار
مع خفض 60 ألف وظيفة في 254 شركة، بما في ذلك شركات عملاقة مثل تيسلا وأمازون، سيشهد عام 2024 موجة مستمرة من تسريح العمال في قطاع التكنولوجيا لإعادة تشكيل مشهد الابتكار.
ابدأ مجانًا
من وحي تجربة هذا بنفسك؟

أفضل طريقة لفهم قوة AppMaster هي رؤيتها بنفسك. اصنع تطبيقك الخاص في دقائق مع اشتراك مجاني

اجعل أفكارك تنبض بالحياة