OpenAI ซึ่งเป็นผู้เล่นที่โดดเด่นในด้านปัญญาประดิษฐ์ กำลังขยายขีดความสามารถของ ChatGPT ผู้ช่วยที่นับถือ เดิมทีได้รับการออกแบบให้เป็นเครื่องมือค้นหาแบบข้อความ ปัจจุบัน ChatGPT จะแสดงความสามารถในการประมวลผลเสียงและภาพ สร้างประสบการณ์เชิงโต้ตอบมากขึ้นสำหรับผู้ใช้
นับตั้งแต่เปิดตัวเมื่อประมาณเก้าเดือนที่แล้ว ChatGPT ได้กลายเป็นปรากฏการณ์ใหญ่ในกลุ่มเทคโนโลยี ชื่นชมความสามารถในการเขียนเรียงความ สร้างบทกวี และสรุปข้อความที่กว้างขวางจากตัวชี้นำข้อความธรรมดา อย่างไรก็ตาม ขณะนี้ผู้ช่วย AI ได้รับการตั้งค่าให้มีส่วนร่วมมากยิ่งขึ้น ตอนนี้จะให้ผู้ใช้รับฟังเพื่อให้สามารถโต้ตอบด้วยเสียงได้
ผู้ใช้จะได้รับโอกาสในการสนทนาด้วยเสียงด้วย ChatGPT ตัวอย่างเช่น ระบบอาจขอให้ผู้ช่วยบรรยายนิทานก่อนนอนอย่างกะทันหันโดยอาศัยสัญญาณวาจาจากผู้ใช้ คำถามง่ายๆ สามารถส่งตรงไปยังความช่วยเหลือได้ และคำตอบจะถูกส่งเป็นภาษาพูด
นอกจากนี้ยังมีฟีเจอร์การค้นหาตามรูปภาพให้บริการอีกด้วย ผู้ใช้สามารถอัปโหลดรูปภาพและขอให้ ChatGPT ระบุหรืออธิบายรายการที่อัปโหลดหรือขอคำแนะนำในการบรรลุเป้าหมายเฉพาะ
ความสามารถในการโต้ตอบด้วยเสียงของ ChatGPT ได้รับการปรับแต่งอย่างละเอียดด้วยโมเดลการอ่านออกเสียงข้อความที่เหนือชั้น ซึ่งสามารถสร้างเสียงที่เหมือนมนุษย์จากข้อความและตัวอย่างคำพูดสั้นๆ OpenAI เปิดเผยว่าได้ร่วมมือกับนักพากย์ที่มีทักษะเพื่อสร้างเสียงพิเศษ 5 เสียง ระบบรู้จำคำพูด Whisper แบบโอเพ่นซอร์สขององค์กรทำหน้าที่เป็นเทคโนโลยีพื้นฐานสำหรับการแปลงคำพูดเป็นข้อความ
ในการพัฒนาที่น่าตื่นเต้น Spotify ได้ก้าวเข้ามาเป็นพันธมิตรในการเปิดตัว ได้นำเสนอฟีเจอร์อันทรงคุณค่าสำหรับพอดแคสต์ซึ่งช่วยให้พวกเขาสามารถถอดเสียงรายการจากภาษาอังกฤษเป็นภาษาสเปน ฝรั่งเศส หรือเยอรมัน โดยที่ยังคงรักษาโทนเสียงต้นฉบับเอาไว้ อย่างไรก็ตาม OpenAI เปิดเผยว่าการเข้าถึงเทคโนโลยีนี้ไม่เป็นสากล มีให้บริการสำหรับพอดแคสต์ที่เลือกเท่านั้น ได้แก่ Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons และ Steven Bartlett สำหรับการเปิดตัวครั้งแรก
ในบล็อกโพสต์ OpenAI รับทราบถึงความเสี่ยงที่อาจเกิดขึ้นที่เกี่ยวข้องกับเทคโนโลยีเสียงใหม่ ซึ่งเกี่ยวข้องกับความน่าจะเป็นของการฉ้อโกงหรือการบิดเบือนความจริงโดยองค์ประกอบอันธพาล ดังนั้นจึงทำให้แน่ใจว่าจะไม่ก่อให้เกิดความขัดแย้งใดๆ เกี่ยวกับการเปิดตัว
การเปิดตัวคุณสมบัติใหม่เหล่านี้มีการวางแผนไว้สำหรับสัปดาห์หน้า พวกเขาจะสามารถเข้าถึงได้โดยสมาชิก Plus และ Enterprise ในขั้นต้น หากต้องการเพลิดเพลินกับฟีเจอร์เสียง ผู้ใช้จะต้องไปที่ 'การตั้งค่า' บนแอป เลือก 'ฟีเจอร์ใหม่' เลือกใช้การสนทนาด้วยเสียง แตะปุ่มหูฟังที่อยู่มุมขวาบน และสุดท้าย เลือก เสียงที่ต้องการ
ขั้นแรก เฉพาะผู้ใช้แอป ChatGPT สำหรับ Android และ iOS เท่านั้นที่จะสามารถสัมผัสประสบการณ์การสนทนาด้วยเสียงแบบเลือกรับรุ่นเบต้าได้ อย่างไรก็ตาม คุณลักษณะการค้นหาตามรูปภาพจะพร้อมใช้งานในทุกแพลตฟอร์มตามค่าเริ่มต้น
แพลตฟอร์ม no-code จำนวนมาก เช่น AppMaster ต่างตั้งตารอที่จะเห็นแอปพลิเคชันที่หลากหลายซึ่ง ChatGPT ที่ปรับปรุงแล้วนี้จะได้รับในอนาคตอันใกล้นี้ การสร้างซอฟต์แวร์ระดับองค์กรโดยไม่ต้องใช้โค้ด มักต้องการความช่วยเหลือจาก AI ที่ซับซ้อนเพื่อการโต้ตอบที่เหนือกว่าและการปรับปรุงประสบการณ์ผู้ใช้