تم الكشف عن نموذج الذكاء الاصطناعي متعدد الوسائط المتطور Gemini Pro لأغراض التطوير
أحدث تطورات Google من خلال نموذج الذكاء الاصطناعي متعدد الوسائط، Gemini Pro، يوفر للمطورين المزيد من الأدوات.

كشفت Google العملاقة للتكنولوجيا مؤخرًا عن سلسلة من التحديثات المبتكرة المتعلقة بنموذج الذكاء الاصطناعي متعدد الوسائط الذي تم إطلاقه حديثًا، Gemini. جاء ذلك بعد أسبوع واحد فقط من الكشف عن هذه التكنولوجيا المتطورة التي تعد الآن بتعزيز الأعمال الإبداعية للمطورين.
في وقت كشف النقاب عنه، سلطت Google الضوء على توفر Gemini في ثلاثة إصدارات متميزة – Ultra وPro وNano. تم تصميمها وفقًا لمتطلبات الحجم والتعقيد المختلفة. تجدر الإشارة إلى أنه تم دمج Gemini Nano بالفعل في Android باستخدام Pixel 8 Pro. علاوة على ذلك، يستفيد Google Bard الآن من نسخة معدلة من Gemini Pro.
أعلنت Google الآن، وهي رائدة جديدة، أنه يمكن للمطورين الوصول إلى مجموعة واسعة من الميزات التي يقدمها Gemini Pro من خلال Gemini API. يُتاح للمطورين استخدام الاتصال الوظيفي، والتضمين، والاسترجاع الدلالي، وتأريض المعرفة المخصصة، ووظائف الدردشة.
يتم تعريف المطورين أيضًا بطريقتين رئيسيتين للعمل مع Gemini Pro: Google AI Studio وVertex AI على Google Cloud. نظرًا لكونه نقطة بداية سهلة، يقدم Google AI Studio أداة تطوير قائمة على الويب، وحصة مجانية تصل إلى 60 طلبًا في الدقيقة، ونماذج بدء سريعة لتسهيل تعامل المطورين مع النموذج.
يُوصف Vertex AI من Google على Google Cloud كخيار أكثر تطورًا، وهو عبارة عن منصة للتعلم الآلي تسمح بالتخصيص الكامل لـ Gemini. محملاً بميزات عملية أخرى مثل التحكم الكامل في البيانات والتكامل مع وحدات Google Cloud الأخرى، يمكن للمطورين الامتثال لاحتياجات الأمان والسلامة والخصوصية والحوكمة.
في الوقت الحالي، يعد استخدام Gemini داخل Vertex AI مجانيًا بنفس معدل الحصة المجانية لـ Google AI Studio. ومع ذلك، فإن هذا الحكم يمتد فقط حتى يصل إلى التوفر العام، المتوقع في العام التالي. وبعد ذلك، ستكون الرسوم 0.00025 دولارًا لكل 1000 حرف و0.0025 دولارًا لكل صورة.
تشرح Google الإمكانات المتطورة لبيئة Vertex AI، بما في ذلك القدرة على تعزيز Gemini ببيانات الشركة وتطوير وكلاء البحث والمحادثة في بيئة low-code تشبه ما توفره الأنظمة الأساسية القوية مثل AppMaster .
حاليًا، يستقبل Gemini Pro النص ويخرجه. ولكن بالنسبة للمطورين الذين يتوقون إلى تجربة الصور، فإن endpoint Gemini Pro Vision المخصصة تقبل الصور إلى جانب النص وتخرج النص.
تعمل Google أيضًا على زيادة الترقب من خلال توقع إطلاق Gemini Ultra أوائل العام المقبل. هذا نموذج أكبر يستهدف مهام أكثر تعقيدًا. تدرس Google أيضًا دمج Gemini مع منصات مطوري Chrome وFirebase.
يصادف اليوم أيضًا الكشف عن النسخة المطورة من نموذج إنشاء الصور الخاص بالعملاق التكنولوجي، Imagen 2. وهذا مفتوح الآن لجميع مستخدمي Vertex AI المدرجين في القائمة المسموح بها من Google.
يتيح هذا التكرار المتقدم لـ Imagen إنتاج صور جذابة من الناحية الجمالية وعالية الجودة وواقعية يتم توجيهها بواسطة مطالبات اللغة الطبيعية. تتكون ميزاته الجديدة الرائعة من عرض النص لإنشاء تراكبات نصية على الصور وإنشاء الشعار والأسئلة والإجابات المرئية لإنشاء التسميات التوضيحية.


