OpenAI, een prominente speler op het gebied van kunstmatige intelligentie, breidt de mogelijkheden van zijn gewaardeerde assistent ChatGPT uit. Oorspronkelijk ontworpen als een op tekst gebaseerd zoekhulpmiddel, zal ChatGPT nu pronken met stem- en beeldverwerkingsmogelijkheden, waardoor een meer interactieve ervaring voor zijn gebruikers wordt gecreëerd.
Sinds de introductie ongeveer negen maanden geleden is ChatGPT een groot fenomeen geworden in het technologiespectrum. Het wordt zeer gewaardeerd vanwege zijn vermogen om essays te schrijven, gedichten te maken en uitgebreide teksten samen te vatten op basis van eenvoudige tekstaanwijzingen. De AI-assistent zal nu echter nog aantrekkelijker worden. Het zal nu zijn oren lenen voor gebruikers, waardoor vocale interacties mogelijk zijn.
Gebruikers krijgen de mogelijkheid om een stemdialoog aan te gaan met ChatGPT. De assistent kan bijvoorbeeld worden gevraagd een geïmproviseerd verhaaltje voor het slapengaan te vertellen, geleid door verbale signalen van de gebruiker. Ook eenvoudige vragen kunnen aan de hulp worden gesteld en de antwoorden worden in gesproken taal gegeven.
Bovendien zijn er op afbeeldingen gebaseerde zoekfuncties beschikbaar gesteld. Gebruikers kunnen een afbeelding uploaden en ChatGPT vragen om het geüploade item te identificeren of uit te leggen, of om aanwijzingen op te vragen voor het bereiken van een specifiek doel.
De mogelijkheden van steminteractie van ChatGPT zijn verfijnd door een superieur tekst-naar-spraakmodel dat mensachtige stemmen kan produceren uit tekst en een kort spraakvoorbeeld. OpenAI onthulde dat het heeft samengewerkt met ervaren stemacteurs om vijf exclusieve stemmen te genereren. Het opensource-spraakherkenningssysteem Whisper van de organisatie dient als de onderliggende technologie voor het omzetten van spraak naar tekst.
In een opwindende ontwikkeling is Spotify als lanceringspartner tussenbeide gekomen. Het heeft een waardevolle functie geïntroduceerd voor podcasters waarmee ze hun shows van het Engels naar het Spaans, Frans of Duits kunnen transcriberen met behoud van hun oorspronkelijke stemtoon. Niettemin maakt OpenAI bekend dat toegang tot deze technologie niet universeel is. Het is bij de eerste lancering alleen beschikbaar voor geselecteerde podcasters, waaronder Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons en Steven Bartlett.
In een blogpost erkende OpenAI de potentiële risico's die verbonden zijn aan zijn nieuwe spraaktechnologie, met betrekking tot de waarschijnlijkheid van fraude of een verkeerde voorstelling van zaken door malafide elementen. Het zorgt er dus voor dat er geen controverse ontstaat over de release.
De onthulling van deze nieuwe features staat gepland voor de komende twee weken. Ze zullen in eerste instantie toegankelijk zijn voor Plus- en Enterprise-abonnees. Om van spraakfuncties te kunnen genieten, moeten gebruikers naar de 'instellingen' in de app navigeren, 'nieuwe functies' selecteren, zich aanmelden voor spraakgesprekken, op de hoofdtelefoonknop in de rechterbovenhoek tikken en ten slotte de optie kiezen voorkeursstem.
Om te beginnen kunnen alleen ChatGPT Android- en iOS-appgebruikers stemgesprekken ervaren op basis van een opt-in bèta. De op afbeeldingen gebaseerde zoekfunctie zal echter standaard op alle platforms beschikbaar zijn.
Veel no-code platforms, zoals AppMaster, kijken reikhalzend uit naar het brede scala aan toepassingen dat deze verbeterde ChatGPT in de nabije toekomst zou opleveren. Het bouwen van bedrijfssoftware zonder code vereist vaak dergelijke geavanceerde AI-ondersteuning voor superieure interactiviteit en verbetering van de gebruikerservaring.