26 Sep 2023·1 menit membaca

OpenAI Meningkatkan Fungsi ChatGPT dengan Kemampuan Percakapan Verbal dan Pengenalan Gambar

Raksasa teknologi, OpenAI, telah mengumumkan fitur-fitur baru yang menarik untuk asisten AI-nya yang sangat populer, ChatGPT.

OpenAI, pemain terkemuka dalam kecerdasan buatan, memperluas kemampuan asistennya yang terhormat, ChatGPT. Awalnya dirancang sebagai alat pencarian berbasis teks, ChatGPT kini memamerkan kemampuan pemrosesan suara dan gambar, menciptakan pengalaman yang lebih interaktif bagi penggunanya.

Sejak diperkenalkan sekitar sembilan bulan lalu, ChatGPT telah menjadi fenomena besar dalam spektrum teknologi. Ini sangat dihargai karena kemampuannya dalam menyusun esai, membuat puisi, dan merangkum teks ekstensif dari petunjuk teks sederhana. Namun, asisten AI kini siap menjadi lebih menarik. Sekarang akan mendengarkan pengguna, memungkinkan interaksi vokal.

Pengguna akan mendapat kesempatan untuk terlibat dalam dialog suara dengan ChatGPT. Misalnya, asisten dapat diminta untuk menceritakan kisah pengantar tidur dadakan yang dipandu oleh isyarat verbal dari pengguna. Pertanyaan sederhana juga dapat diarahkan ke bantuan, dan tanggapan akan disampaikan dalam bahasa lisan.

Selain itu, fitur pencarian berbasis gambar telah tersedia. Pengguna dapat mengunggah gambar dan meminta ChatGPT untuk mengidentifikasi atau menjelaskan item yang diunggah atau meminta petunjuk arah untuk mencapai tujuan tertentu.

Kemampuan interaksi suara ChatGPT telah disempurnakan dengan model text-to-speech unggul yang dapat menghasilkan suara mirip manusia dari teks dan sampel ucapan singkat. OpenAI mengungkapkan bahwa mereka telah berkolaborasi dengan pengisi suara terampil untuk menghasilkan lima suara eksklusif. Sistem pengenalan ucapan Whisper yang bersumber terbuka dari organisasi ini berfungsi sebagai teknologi dasar untuk mengubah ucapan menjadi teks.

Dalam perkembangan yang menggembirakan, Spotify telah berperan sebagai mitra peluncuran. Ini telah memperkenalkan fitur berharga bagi podcaster yang memungkinkan mereka mentranskripsikan acara mereka dari bahasa Inggris ke bahasa Spanyol, Prancis, atau Jerman sambil mempertahankan nada suara aslinya. Meski demikian, OpenAI mengungkapkan bahwa akses terhadap teknologi ini tidak bersifat universal. Ini hanya tersedia untuk podcaster tertentu termasuk Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons, dan Steven Bartlett untuk peluncuran awal.

Dalam postingan blognya, OpenAI mengakui potensi risiko yang terkait dengan teknologi suara barunya, terkait kemungkinan penipuan atau representasi keliru yang dilakukan oleh elemen jahat. Oleh karena itu, mereka memastikan tidak menimbulkan kontroversi apa pun saat perilisannya.

Peluncuran fitur-fitur baru ini direncanakan untuk dua minggu ke depan. Mereka akan dapat diakses oleh pelanggan Plus dan Enterprise pada awalnya. Untuk menikmati fitur suara, pengguna perlu menavigasi ke 'pengaturan' pada aplikasi, memilih 'fitur baru', ikut serta dalam percakapan suara, ketuk tombol headphone yang terletak di sudut kanan atas, dan terakhir, pilih suara yang disukai.

Pertama-tama, hanya pengguna aplikasi ChatGPT Android dan iOS yang dapat merasakan percakapan suara dalam versi beta keikutsertaan. Namun, fitur pencarian berbasis gambar akan tersedia di semua platform secara default.

Banyak platform no-code, seperti AppMaster, sangat menantikan untuk melihat beragam aplikasi yang akan dihasilkan oleh ChatGPT yang ditingkatkan ini dalam waktu dekat. Membangun perangkat lunak perusahaan tanpa kode sering kali memerlukan bantuan AI yang canggih untuk interaktivitas yang unggul dan peningkatan pengalaman pengguna.

Easy to start

Create something amazing

Experiment with AppMaster with free plan.
When you will be ready you can choose the proper subscription.

Get Started

Berita terkait