Grow with AppMaster Grow with AppMaster.
Become our partner arrow ico

OpenAI svela GPT-4: l'intelligenza artificiale multimodale che trasforma la comprensione di testo e immagini

OpenAI svela GPT-4: l'intelligenza artificiale multimodale che trasforma la comprensione di testo e immagini

OpenAI ha presentato il suo rivoluzionario modello di comprensione del testo e delle immagini, GPT-4, salutandolo come il più recente punto di riferimento del successo nell'evoluzione della tecnologia di deep learning. Quest'ultima iterazione del modello di intelligenza artificiale non solo elabora il testo, ma comprende anche le immagini, superando in modo significativo le capacità del suo predecessore, GPT-3.5.

Accessibile agli abbonati di ChatGPT Plus con un limite di utilizzo imposto, GPT-4 costa 0,03 dollari per 1.000 prompt token (circa 750 parole) e 0,06 dollari per 1.000 completion token (ancora una volta, quasi 750 parole). Gli sviluppatori possono anche iscriversi alla lista d'attesa per accedere all'API.

GPT-4 ha attirato l'attenzione per la sua integrazione segreta in diverse applicazioni. È alla base di Bing Chat di Microsoft, un chatbot sviluppato in collaborazione con OpenAI. Tra gli altri primi utilizzatori vi sono Stripe, che usa GPT-4 per riassumere i siti web aziendali per il personale di supporto; Duolingo, che incorpora GPT-4 nel suo abbonamento premium per l'apprendimento delle lingue; e Morgan Stanley, che sfrutta GPT-4 per estrarre e fornire informazioni sui documenti aziendali agli analisti finanziari. GPT-4 è stato integrato anche nel sistema di tutoraggio automatico di Khan Academy.

Migliorato rispetto a GPT-3.5, che accettava solo input testuali, GPT-4 accetta input sia testuali che di immagini, dimostrando prestazioni di "livello umano" su diversi benchmark accademici. Ha superato i punteggi del 10% inferiore raggiunti da GPT-3.5, ottenendo punteggi entro la soglia del 10% superiore in un esame di abilitazione simulato.

Nel corso di sei mesi, OpenAI ha perfezionato il GPT-4 utilizzando le intuizioni di un programma interno di test avversari e di ChatGPT, collaborando al contempo con Microsoft nella progettazione di un supercomputer basato sul cloud Azure per addestrare il modello avanzato di intelligenza artificiale. Di conseguenza, il GPT-4 mostra una maggiore affidabilità, creatività e competenza nella gestione di aspetti intricati rispetto alla sua precedente iterazione, GPT-3.5.

Uno dei progressi più degni di nota del GPT-4 è la sua capacità di comprendere sia le immagini che il testo. Ad esempio, è in grado di interpretare e di fornire didascalie a immagini complesse, come l'identificazione di un adattatore per cavo Lightning analizzando l'immagine di un iPhone collegato. Questa capacità di comprensione delle immagini è attualmente in fase di test con il partner singolo Be My Eyes. La loro nuova funzione di Volontariato Virtuale alimentata da GPT-4 assiste gli utenti rispondendo a domande sulle immagini, offrendo un'analisi completa e consigli pratici basati sui dati dell'immagine presentata.

Un'innovazione fondamentale nelle capacità del GPT-4 è la sua maggiore governabilità. L'introduzione di messaggi di sistema attraverso la nuova API consente agli sviluppatori di guidare l'intelligenza artificiale fornendo istruzioni dettagliate su stile e compiti. Queste istruzioni stabiliscono il contesto e i confini delle interazioni con l'IA, garantendo un rapporto simbiotico tra IA e risorse umane.

Nonostante i sostanziali progressi, tuttavia, OpenAI riconosce che il GPT-4 presenta dei limiti, tra cui errori di ragionamento, informazioni errate e mancanza di conoscenza degli eventi successivi al settembre 2021. Inoltre, il GPT-4 potrebbe introdurre inavvertitamente delle vulnerabilità nel codice che produce. Ciononostante, OpenAI ha fatto passi avanti nel perfezionamento del GPT-4, rendendolo meno propenso a interagire con contenuti proibiti o a rispondere in modo inappropriato a richieste sensibili.

Mentre il campo dell'IA continua a evolversi, OpenAI rimane determinata a migliorare ulteriormente il GPT-4, promuovendo un futuro più intelligente ed efficiente alimentato da una tecnologia IA avanzata. Le aziende che cercano di implementare l'IA nei loro flussi di lavoro possono prendere in considerazione l'esplorazione di piattaforme no-code come AppMaster.io per integrare nelle loro attività sistemi decisionali basati sui dati.

Post correlati

AppMaster a BubbleCon 2024: esplorazione delle tendenze senza codice
AppMaster a BubbleCon 2024: esplorazione delle tendenze senza codice
AppMaster ha partecipato al BubbleCon 2024 di New York, acquisendo informazioni, ampliando le reti ed esplorando opportunità per guidare l'innovazione nello spazio di sviluppo no-code.
Riepilogo FFDC 2024: approfondimenti chiave dalla FlutterFlow Developers Conference di New York
Riepilogo FFDC 2024: approfondimenti chiave dalla FlutterFlow Developers Conference di New York
FFDC 2024 ha illuminato New York City, offrendo agli sviluppatori approfondimenti all'avanguardia sullo sviluppo di app con FlutterFlow. Con sessioni condotte da esperti, aggiornamenti esclusivi e networking senza pari, è stato un evento da non perdere!
Licenziamenti tecnologici del 2024: l'ondata continua che colpisce l'innovazione
Licenziamenti tecnologici del 2024: l'ondata continua che colpisce l'innovazione
Con 60.000 posti di lavoro tagliati in 254 aziende, tra cui giganti come Tesla e Amazon, il 2024 vedrà una continua ondata di licenziamenti nel settore tecnologico che rimodellerà il panorama dell'innovazione.
Inizia gratis
Ispirato a provarlo tu stesso?

Il modo migliore per comprendere il potere di AppMaster è vederlo di persona. Crea la tua applicazione in pochi minuti con l'abbonamento gratuito

Dai vita alle tue idee