Yapay zeka alanında öne çıkan oyunculardan OpenAI, değerli asistanı ChatGPT yeteneklerini genişletiyor. Başlangıçta metin tabanlı bir arama aracı olarak tasarlanan ChatGPT, artık ses ve görüntü işleme yeteneklerini sergileyerek kullanıcıları için daha etkileşimli bir deneyim yaratacak.
Yaklaşık dokuz ay önceki tanıtımından bu yana ChatGPT teknoloji yelpazesinde büyük bir fenomen haline geldi. Makale yazma, şiir oluşturma ve basit metin ipuçlarından kapsamlı metinleri özetleme yeteneği nedeniyle derinden takdir edilmektedir. Ancak yapay zeka asistanı artık daha da ilgi çekici olacak. Artık sesli etkileşimlere izin vererek kulaklarını kullanıcılara verecek.
Kullanıcılar ChatGPT ile sesli diyalog kurma fırsatına sahip olacaklar. Örneğin asistandan, kullanıcıdan gelen sözlü ipuçlarının rehberliğinde doğaçlama bir uyku vakti hikayesi anlatması istenebilir. Yardıma basit sorular da yöneltilebilir ve yanıtlar konuşulan dilde iletilecektir.
Ayrıca görsel tabanlı arama özellikleri de kullanıma sunuldu. Kullanıcılar bir resim yükleyebilir ve ChatGPT yüklenen öğeyi tanımlamasını veya açıklamasını isteyebilir veya belirli bir hedefe ulaşmak için yol tarifi isteyebilir.
ChatGPT ses etkileşimi yetenekleri, metinden ve kısa bir konuşma örneğinden insan benzeri sesler üretebilen üstün bir metinden konuşmaya modeliyle ince ayar yapılmıştır. OpenAI beş özel ses oluşturmak için yetenekli seslendirme sanatçılarıyla işbirliği yaptığını açıkladı. Kuruluşun açık kaynaklı Whisper konuşma tanıma sistemi, konuşmayı metne dönüştürmenin temelini oluşturan teknoloji olarak hizmet ediyor.
Heyecan verici bir gelişmeyle Spotify lansman ortağı olarak devreye girdi. Podcast yayıncılarına, orijinal ses tonlarını korurken programlarını İngilizce'den İspanyolca, Fransızca veya Almanca'ya aktarmalarına olanak tanıyan değerli bir özellik sundu. Yine de OpenAI, bu teknolojiye erişimin evrensel olmadığını açıklıyor. İlk lansman için yalnızca Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons ve Steven Bartlett gibi belirli podcast yayıncıları tarafından kullanılabilir.
Bir blog yazısında OpenAI, yeni ses teknolojisiyle ilişkili dolandırıcılık veya hileli unsurlar tarafından yanlış beyan olasılığıyla ilgili potansiyel riskleri kabul etti. Böylece piyasaya sürülmesiyle ilgili herhangi bir tartışmaya yol açmamaya dikkat ediyor.
Bu yeni özelliklerin önümüzdeki iki hafta içinde tanıtılması planlanıyor. Başlangıçta Plus ve Enterprise abonelerinin erişimine açık olacaklar. Sesli özelliklerin keyfini çıkarmak için kullanıcıların uygulamadaki 'ayarlar'a gitmesi, 'yeni özellikler'i seçmesi, sesli görüşmelere katılması, sağ üst köşede bulunan kulaklık düğmesine dokunması ve son olarak tercih edilen ses.
Başlangıç olarak, beta sürümünde yalnızca ChatGPT Android ve iOS uygulaması kullanıcıları sesli görüşmeleri deneyimleyebilecek. Ancak görsel tabanlı arama özelliği varsayılan olarak tüm platformlarda kullanıma sunulacak.
AppMaster gibi birçok no-code platform, bu geliştirilmiş ChatGPT yakın gelecekte sağlayacağı geniş uygulama yelpazesini görmeyi sabırsızlıkla bekliyor. Kodsuz kurumsal yazılım oluşturmak, genellikle üstün etkileşim ve kullanıcı deneyimi iyileştirmesi için bu tür gelişmiş yapay zeka yardımını gerektirir.