تعمل OpenAI ، وهي لاعب بارز في مجال الذكاء الاصطناعي، على توسيع قدرات مساعدها الموقر ChatGPT. تم تصميم ChatGPT في الأصل كأداة بحث تعتمد على النصوص، وسيتباهى الآن بقدرات معالجة الصوت والصور، مما يخلق تجربة أكثر تفاعلية لمستخدميه.
منذ طرحه منذ تسعة أشهر تقريبًا، أصبح ChatGPT ظاهرة كبيرة في مجال التكنولوجيا. إنه موضع تقدير كبير لقدرته على تأليف المقالات وإنشاء القصائد وتلخيص نصوص واسعة النطاق من خلال إشارات نصية بسيطة. ومع ذلك، أصبح مساعد الذكاء الاصطناعي الآن أكثر جاذبية. وسوف يمد الآن آذانه للمستخدمين، مما يسمح بالتفاعلات الصوتية.
سيحصل المستخدمون على فرصة المشاركة في حوار صوتي مع ChatGPT. على سبيل المثال، يمكن أن يُطلب من المساعد أن يروي قصة مرتجلة قبل النوم مسترشداً بإشارات لفظية من المستخدم. يمكن أيضًا توجيه أسئلة بسيطة إلى المساعدة، وسيتم تسليم الإجابات باللغة المنطوقة.
بالإضافة إلى ذلك، تم توفير ميزات البحث المستندة إلى الصور. يمكن للمستخدمين تحميل صورة ومطالبة ChatGPT بتحديد أو شرح العنصر الذي تم تحميله أو طلب توجيهات لتحقيق هدف محدد.
تم تحسين إمكانيات التفاعل الصوتي لـ ChatGPT من خلال نموذج تحويل النص إلى كلام متفوق يمكنه إنتاج أصوات تشبه الأصوات البشرية من النص وعينة كلام قصيرة. كشفت OpenAI أنها تعاونت مع ممثلين صوتيين ماهرين لإنتاج خمسة أصوات حصرية. يعمل نظام التعرف على الكلام Whisper مفتوح المصدر الخاص بالمؤسسة بمثابة التقنية الأساسية لتحويل الكلام إلى نص.
وفي تطور مثير، تدخلت Spotify كشريك الإطلاق. لقد قدم ميزة قيمة لمنشئي البودكاست تسمح لهم بنسخ عروضهم من الإنجليزية إلى الإسبانية أو الفرنسية أو الألمانية مع الحفاظ على نغمة صوتهم الأصلية. ومع ذلك، تكشف OpenAI أن الوصول إلى هذه التكنولوجيا ليس عالميًا. إنه متاح فقط لمجموعة مختارة من مقدمي البودكاست بما في ذلك Dax Shepard وMonica Padman وLex Fridman وBill Simmons وSteven Bartlett للإطلاق الأولي.
وفي منشور على مدونة، أقرت OpenAI بالمخاطر المحتملة المرتبطة بتقنيتها الصوتية الجديدة، فيما يتعلق باحتمال الاحتيال أو التحريف من قبل عناصر مارقة. ولذلك فهي تحرص على عدم إثارة أي جدل بشأن صدوره.
ومن المقرر الكشف عن هذه الميزات الجديدة خلال الأسبوعين المقبلين. ستكون متاحة لمشتركي Plus وEnterprise في البداية. للاستمتاع بالميزات الصوتية، يتعين على المستخدمين الانتقال إلى "الإعدادات" في التطبيق، وتحديد "ميزات جديدة"، والاشتراك في المحادثات الصوتية، والنقر على زر سماعة الرأس الموجود في الزاوية العلوية اليمنى، وأخيرًا، اختيار الزر الصوت المفضل.
في البداية، لن يتمكن سوى مستخدمي تطبيق ChatGPT Android وiOS من تجربة المحادثات الصوتية على أساس الاشتراك التجريبي. ومع ذلك، ستصبح ميزة البحث المستندة إلى الصور متاحة عبر جميع الأنظمة الأساسية افتراضيًا.
العديد من المنصات no-code ، مثل AppMaster ، تنتظر بفارغ الصبر رؤية النطاق الواسع من التطبيقات التي سينتجها ChatGPT المحسن في المستقبل القريب. غالبًا ما يتطلب إنشاء برامج مؤسسية بدون تعليمات برمجية مثل هذه المساعدة المتطورة من الذكاء الاصطناعي لتحقيق تفاعل فائق وتحسين تجربة المستخدم.