Grow with AppMaster Grow with AppMaster.
Become our partner arrow ico

تعمل تقنية OpenAI على تعزيز وظائف ChatGPT من خلال المحادثة اللفظية وإمكانيات التعرف على الصور

تعمل تقنية OpenAI على تعزيز وظائف ChatGPT من خلال المحادثة اللفظية وإمكانيات التعرف على الصور

تعمل OpenAI ، وهي لاعب بارز في مجال الذكاء الاصطناعي، على توسيع قدرات مساعدها الموقر ChatGPT. تم تصميم ChatGPT في الأصل كأداة بحث تعتمد على النصوص، وسيتباهى الآن بقدرات معالجة الصوت والصور، مما يخلق تجربة أكثر تفاعلية لمستخدميه.

منذ طرحه منذ تسعة أشهر تقريبًا، أصبح ChatGPT ظاهرة كبيرة في مجال التكنولوجيا. إنه موضع تقدير كبير لقدرته على تأليف المقالات وإنشاء القصائد وتلخيص نصوص واسعة النطاق من خلال إشارات نصية بسيطة. ومع ذلك، أصبح مساعد الذكاء الاصطناعي الآن أكثر جاذبية. وسوف يمد الآن آذانه للمستخدمين، مما يسمح بالتفاعلات الصوتية.

سيحصل المستخدمون على فرصة المشاركة في حوار صوتي مع ChatGPT. على سبيل المثال، يمكن أن يُطلب من المساعد أن يروي قصة مرتجلة قبل النوم مسترشداً بإشارات لفظية من المستخدم. يمكن أيضًا توجيه أسئلة بسيطة إلى المساعدة، وسيتم تسليم الإجابات باللغة المنطوقة.

بالإضافة إلى ذلك، تم توفير ميزات البحث المستندة إلى الصور. يمكن للمستخدمين تحميل صورة ومطالبة ChatGPT بتحديد أو شرح العنصر الذي تم تحميله أو طلب توجيهات لتحقيق هدف محدد.

تم تحسين إمكانيات التفاعل الصوتي لـ ChatGPT من خلال نموذج تحويل النص إلى كلام متفوق يمكنه إنتاج أصوات تشبه الأصوات البشرية من النص وعينة كلام قصيرة. كشفت OpenAI أنها تعاونت مع ممثلين صوتيين ماهرين لإنتاج خمسة أصوات حصرية. يعمل نظام التعرف على الكلام Whisper مفتوح المصدر الخاص بالمؤسسة بمثابة التقنية الأساسية لتحويل الكلام إلى نص.

وفي تطور مثير، تدخلت Spotify كشريك الإطلاق. لقد قدم ميزة قيمة لمنشئي البودكاست تسمح لهم بنسخ عروضهم من الإنجليزية إلى الإسبانية أو الفرنسية أو الألمانية مع الحفاظ على نغمة صوتهم الأصلية. ومع ذلك، تكشف OpenAI أن الوصول إلى هذه التكنولوجيا ليس عالميًا. إنه متاح فقط لمجموعة مختارة من مقدمي البودكاست بما في ذلك Dax Shepard وMonica Padman وLex Fridman وBill Simmons وSteven Bartlett للإطلاق الأولي.

وفي منشور على مدونة، أقرت OpenAI بالمخاطر المحتملة المرتبطة بتقنيتها الصوتية الجديدة، فيما يتعلق باحتمال الاحتيال أو التحريف من قبل عناصر مارقة. ولذلك فهي تحرص على عدم إثارة أي جدل بشأن صدوره.

ومن المقرر الكشف عن هذه الميزات الجديدة خلال الأسبوعين المقبلين. ستكون متاحة لمشتركي Plus وEnterprise في البداية. للاستمتاع بالميزات الصوتية، يتعين على المستخدمين الانتقال إلى "الإعدادات" في التطبيق، وتحديد "ميزات جديدة"، والاشتراك في المحادثات الصوتية، والنقر على زر سماعة الرأس الموجود في الزاوية العلوية اليمنى، وأخيرًا، اختيار الزر الصوت المفضل.

في البداية، لن يتمكن سوى مستخدمي تطبيق ChatGPT Android وiOS من تجربة المحادثات الصوتية على أساس الاشتراك التجريبي. ومع ذلك، ستصبح ميزة البحث المستندة إلى الصور متاحة عبر جميع الأنظمة الأساسية افتراضيًا.

العديد من المنصات no-code ، مثل AppMaster ، تنتظر بفارغ الصبر رؤية النطاق الواسع من التطبيقات التي سينتجها ChatGPT المحسن في المستقبل القريب. غالبًا ما يتطلب إنشاء برامج مؤسسية بدون تعليمات برمجية مثل هذه المساعدة المتطورة من الذكاء الاصطناعي لتحقيق تفاعل فائق وتحسين تجربة المستخدم.

المنشورات ذات الصلة

تم الكشف عن: دور Google المبكر في إنشاء أول تطبيق Android على Twitter
تم الكشف عن: دور Google المبكر في إنشاء أول تطبيق Android على Twitter
اكتشف القصة غير المروية لمساهمة Google المهمة في التطوير الأولي لتطبيقات التواصل الاجتماعي الرئيسية مثل Twitter لنظام Android.
أخبار مثيرة: نحن ننتقل إلى الخطاب!
أخبار مثيرة: نحن ننتقل إلى الخطاب!
مجتمع AppMaster ينتقل إلى الخطاب
أخبار مثيرة: نحن ننتقل إلى الخطاب!
أخبار مثيرة: نحن ننتقل إلى الخطاب!
مجتمع AppMaster ينتقل إلى الخطاب
سامسونج تكشف النقاب عن هاتف Galaxy A55 الذي يتميز بأمان مبتكر وتصميم متميز
سامسونج تكشف النقاب عن هاتف Galaxy A55 الذي يتميز بأمان مبتكر وتصميم متميز
تعمل سامسونج على توسيع تشكيلتها متوسطة المدى من خلال تقديم هاتفي Galaxy A55 وA35، اللذين يتميزان بأمان Knox Vault وعناصر تصميم مطورة، مما يضفي على هذا القطاع صفات رائدة.
ابدأ مجانًا
من وحي تجربة هذا بنفسك؟

أفضل طريقة لفهم قوة AppMaster هي رؤيتها بنفسك. اصنع تطبيقك الخاص في دقائق مع اشتراك مجاني

اجعل أفكارك تنبض بالحياة