تعلن شركة OpenAI، الشركة الرائدة في مجال الذكاء الاصطناعي المتقدم، عن طرح نسختها المطورة DALL-E 3. يدمج هذا الإصدار المتقدم لأداة تحويل النص إلى صورة الخاصة بالشركة ChatGPT ، برنامج الدردشة الآلي المعتمد على الذكاء الاصطناعي السائد في OpenAI، لتبسيط وتعديل عملية المطالبة بالصور.
تعمل أدوات توليد الصور الرئيسية المعتمدة على الذكاء الاصطناعي في الوقت الحالي على تحويل المطالبات أو أوصاف الصور إلى مجموعة من الأعمال الفنية ذات أنماط متعددة، بدءًا من الصور الواقعية وحتى الخيالية. ومع ذلك، فإن التحدي يكمن في تطوير موجه مناسب، وهو ما حفز ظهور "الهندسة السريعة" كمهنة جديرة بالثناء.
أحدث DALL-E 3 ثورة في هذه العملية من خلال تطبيق ChatGPT للمساعدة في تحسين المطالبات. يمكن للمشتركين في ChatGPT Plus و ChatGPT Enterprise الاستفادة من هذه الأداة عن طريق إرسال طلبات الصور الخاصة بهم وضبطها من خلال المناقشات مع chatbot. ومن خلال القيام بذلك، فإنهم يتلقون النتائج المكررة مباشرة داخل تطبيق الدردشة.
يتمتع ChatGPT بالقدرة على توسيع المطالبات القصيرة التي تصل إلى بضع كلمات، مما يجعلها أكثر وصفية وتوفر توجيهات محسنة لنموذج DALL-E 3. هذه ليست الميزة الوحيدة التي تأتي مع DALL-E 3؛ كما أنه ينشئ صورًا عالية الجودة تمثل المطالبات بشكل أفضل. يُلاحظ هذا بشكل خاص عند التعامل مع المطالبات الأطول والتعامل مع المحتويات التي هزت سابقًا نماذج توليد الصور مثل المحتوى النصي والأيدي البشرية.
يقدم الإصدار المحدث أيضًا آليات جديدة لتقليل التحيز الخوارزمي وتعزيز السلامة، وفقًا لـ OpenAI. على سبيل المثال، سيتم رفض الطلبات التي تطلب صورًا بأسلوب الفنانين الحاليين أو تمثيلات لأفراد مشهورين. علاوة على ذلك، يتمتع الفنانون الآن بخيار اختيار عدم استخدام كل أو أجزاء معينة من أعمالهم الفنية في تدريب عمليات التسليم المستقبلية لنماذج تحويل النص إلى صورة الخاصة بـ OpenAI. هذا القرار جدير بالملاحظة بشكل خاص في ضوء الدعاوى القضائية المعلقة التي تواجهها شركة OpenAI وبعض منافسيها بسبب الاستخدام المزعوم للأعمال الفنية المحمية بحقوق الطبع والنشر من الفنانين لتدريب نماذج صور الذكاء الاصطناعي الخاصة بهم.
ويتزامن الكشف عن DALL-E 3 مع المنافسة المتزايدة في مجال الذكاء الاصطناعي، وخاصة في مجال تركيب الصور. يعمل المنافسون مثل Midjourney وStability AI باستمرار على تحسين نماذج توليد الصور الخاصة بهم، مع إبقاء OpenAI على أهبة الاستعداد.
من المقرر طرح DALL-E 3 لمستخدمي ChatGPT المميزين في أكتوبر، يليه مختبرات الأبحاث وعملاء API. ظلت OpenAI صامتة فيما يتعلق بخططها لإطلاق أداة ويب مجانية مشابهة لنماذج DALL-E السابقة.
مثل هذه التطورات في إنشاء صور الذكاء الاصطناعي يمكن أن تفيد الأنظمة الأساسية no-code مثل AppMaster. ومن خلال أداته القوية no-code ، يمكن لمستخدمي AppMaster دمج إمكانات الذكاء الاصطناعي من المستوى التالي، مما يسهل عملية إنشاء التطبيق وتطوير الواجهة الخلفية. إذا تم دمجها بشكل صحيح، فقد يفتح ذلك إمكانيات جديدة لتصميم التطبيقات المرئية، وكلها متاحة من خلال حلول no-code.