Grow with AppMaster Grow with AppMaster.
Become our partner arrow ico

OpenAI, Sözlü Konuşma ve Görüntü Tanıma Yetenekleriyle ChatGPT'nin İşlevselliğini Artırıyor

OpenAI, Sözlü Konuşma ve Görüntü Tanıma Yetenekleriyle ChatGPT'nin İşlevselliğini Artırıyor

Yapay zeka alanında öne çıkan oyunculardan OpenAI, değerli asistanı ChatGPT yeteneklerini genişletiyor. Başlangıçta metin tabanlı bir arama aracı olarak tasarlanan ChatGPT, artık ses ve görüntü işleme yeteneklerini sergileyerek kullanıcıları için daha etkileşimli bir deneyim yaratacak.

Yaklaşık dokuz ay önceki tanıtımından bu yana ChatGPT teknoloji yelpazesinde büyük bir fenomen haline geldi. Makale yazma, şiir oluşturma ve basit metin ipuçlarından kapsamlı metinleri özetleme yeteneği nedeniyle derinden takdir edilmektedir. Ancak yapay zeka asistanı artık daha da ilgi çekici olacak. Artık sesli etkileşimlere izin vererek kulaklarını kullanıcılara verecek.

Kullanıcılar ChatGPT ile sesli diyalog kurma fırsatına sahip olacaklar. Örneğin asistandan, kullanıcıdan gelen sözlü ipuçlarının rehberliğinde doğaçlama bir uyku vakti hikayesi anlatması istenebilir. Yardıma basit sorular da yöneltilebilir ve yanıtlar konuşulan dilde iletilecektir.

Ayrıca görsel tabanlı arama özellikleri de kullanıma sunuldu. Kullanıcılar bir resim yükleyebilir ve ChatGPT yüklenen öğeyi tanımlamasını veya açıklamasını isteyebilir veya belirli bir hedefe ulaşmak için yol tarifi isteyebilir.

ChatGPT ses etkileşimi yetenekleri, metinden ve kısa bir konuşma örneğinden insan benzeri sesler üretebilen üstün bir metinden konuşmaya modeliyle ince ayar yapılmıştır. OpenAI beş özel ses oluşturmak için yetenekli seslendirme sanatçılarıyla işbirliği yaptığını açıkladı. Kuruluşun açık kaynaklı Whisper konuşma tanıma sistemi, konuşmayı metne dönüştürmenin temelini oluşturan teknoloji olarak hizmet ediyor.

Heyecan verici bir gelişmeyle Spotify lansman ortağı olarak devreye girdi. Podcast yayıncılarına, orijinal ses tonlarını korurken programlarını İngilizce'den İspanyolca, Fransızca veya Almanca'ya aktarmalarına olanak tanıyan değerli bir özellik sundu. Yine de OpenAI, bu teknolojiye erişimin evrensel olmadığını açıklıyor. İlk lansman için yalnızca Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons ve Steven Bartlett gibi belirli podcast yayıncıları tarafından kullanılabilir.

Bir blog yazısında OpenAI, yeni ses teknolojisiyle ilişkili dolandırıcılık veya hileli unsurlar tarafından yanlış beyan olasılığıyla ilgili potansiyel riskleri kabul etti. Böylece piyasaya sürülmesiyle ilgili herhangi bir tartışmaya yol açmamaya dikkat ediyor.

Bu yeni özelliklerin önümüzdeki iki hafta içinde tanıtılması planlanıyor. Başlangıçta Plus ve Enterprise abonelerinin erişimine açık olacaklar. Sesli özelliklerin keyfini çıkarmak için kullanıcıların uygulamadaki 'ayarlar'a gitmesi, 'yeni özellikler'i seçmesi, sesli görüşmelere katılması, sağ üst köşede bulunan kulaklık düğmesine dokunması ve son olarak tercih edilen ses.

Başlangıç ​​olarak, beta sürümünde yalnızca ChatGPT Android ve iOS uygulaması kullanıcıları sesli görüşmeleri deneyimleyebilecek. Ancak görsel tabanlı arama özelliği varsayılan olarak tüm platformlarda kullanıma sunulacak.

AppMaster gibi birçok no-code platform, bu geliştirilmiş ChatGPT yakın gelecekte sağlayacağı geniş uygulama yelpazesini görmeyi sabırsızlıkla bekliyor. Kodsuz kurumsal yazılım oluşturmak, genellikle üstün etkileşim ve kullanıcı deneyimi iyileştirmesi için bu tür gelişmiş yapay zeka yardımını gerektirir.

İlgili Mesajlar

Samsung, Yenilikçi Güvenlik ve Premium Yapıya Sahip Galaxy A55'i Tanıttı
Samsung, Yenilikçi Güvenlik ve Premium Yapıya Sahip Galaxy A55'i Tanıttı
Samsung, orta sınıf serisini, Knox Vault güvenliğine ve yükseltilmiş tasarım öğelerine sahip Galaxy A55 ve A35 ile genişleterek segmente amiral gemisi nitelikleri katıyor.
Cloudflare, Büyük Dil Modellerini Korumak için Yapay Zekaya Yönelik Güvenlik Duvarını Tanıtıyor
Cloudflare, Büyük Dil Modellerini Korumak için Yapay Zekaya Yönelik Güvenlik Duvarını Tanıtıyor
Cloudflare, Büyük Dil Modellerini hedef alan potansiyel suiistimalleri önceden belirlemek ve engellemek için tasarlanmış gelişmiş bir WAF olan Firewall for AI ile bir adım öne çıkıyor.
OpenAI'nin ChatGPT'si Şimdi Konuşuyor: Ses Etkileşimli Yapay Zekanın Geleceği
OpenAI'nin ChatGPT'si Şimdi Konuşuyor: Ses Etkileşimli Yapay Zekanın Geleceği
ChatGPT, OpenAI'nin ses yeteneklerini kullanıma sunmasıyla bir dönüm noktası özelliği elde etti. ChatGPT'nin iOS, Android ve web'de yanıtları yüksek sesle okuması sayesinde kullanıcılar artık eller serbest etkileşimin keyfini çıkarabilir.
ÜCRETSİZ BAŞLAYIN
Bunu kendin denemek için ilham aldın mı?

AppMaster'ın gücünü anlamanın en iyi yolu, onu kendiniz görmektir. Ücretsiz abonelik ile dakikalar içinde kendi başvurunuzu yapın

Fikirlerinizi Hayata Geçirin