L' Allen Institute for AI ( AI2) ha presentato un progetto innovativo denominato OLMo, un ampio modello linguistico open source. Questa iniziativa è una mossa strategica per demistificare il funzionamento interno dei modelli di intelligenza artificiale e catalizzare ulteriori progressi nel campo della modellazione del linguaggio.

L’introduzione di OLMo arriva in un momento in cui l’apertura è vista come fondamentale per promuovere una rapida innovazione nell’intelligenza artificiale generativa. Yann LeCun, capo scienziato dell’intelligenza artificiale presso Meta, ha sottolineato l’impatto trasformativo dei modelli di fondazione aperti, che a suo avviso possono accelerare il percorso verso un futuro basato sull’intelligenza artificiale attraverso una comunità solida e collaborativa.

Uno sforzo di collaborazione che ha coinvolto partner prestigiosi come il Kempner Institute Harvard University, AMD, CSC-IT Center for Science in Finlandia e Databricks, ha alimentato lo sviluppo di OLMo. Questa partnership testimonia l’approccio interdisciplinare necessario per affrontare le complessità dell’intelligenza artificiale.

Con una mossa senza precedenti, l’istituto sta rilasciando OLMo insieme ai dati di pre-addestramento e al codice di addestramento, offrendo ai ricercatori un’opportunità unica di approfondire questo modello di intelligenza artificiale. Questo modello aperto raggiunge nuovi livelli di trasparenza, fornendo strumenti essenziali per gli sviluppatori, come dati pre-formazione estesi dal set AI2's Dolma e una solida suite di valutazione con centinaia di checkpoint.

La responsabile del progetto OLMo, Hanna Hajishirzi, che sostiene anche la ricerca sulla PNL presso AI2 ed è una nota professoressa presso la University of Washington's Allen School, sottolinea l'importanza dell'apertura per la comprensione scientifica e il progresso nell'intelligenza artificiale. Con un confronto e contrasto con la ricerca medica o gli studi astronomici, Hajishirzi sottolinea che il quadro OLMo consente uno studio completo degli LLM che è determinante per lo sviluppo di sistemi di intelligenza artificiale che siano sicuri e affidabili.

AI2 sottolinea che OLMo offre precisione nella ricerca sull'intelligenza artificiale garantendo l'accesso ai dati di addestramento del modello, eliminando così congetture e promuovendo lo sviluppo basato sull'evidenza. Questa iniziativa non solo rivelerà approfondimenti dai modelli di intelligenza artificiale del passato, ma fungerà anche da trampolino di lancio per scoperte e miglioramenti futuri.

Nei prossimi mesi sono previste ulteriori iterazioni su OLMo poiché AI2 prevede di integrare varie dimensioni di modelli, set di dati e altre funzionalità. Noah Smith, un altro responsabile del progetto e direttore senior di AI2, anch'egli presso la University of Washington's Allen School, ha ribadito la missione principale di OLMo. Smith ha sposato la visione iniziale dell’intelligenza artificiale come un campo aperto, che è stato oscurato dalla commercializzazione e dalla privacy. OLMo mira a ripristinare l’essenza comune della ricerca sull’IA, consentendo un’accessibilità completa dalla creazione del modello ai metodi di valutazione, facendo così avanzare la tecnologia dell’IA in modo inclusivo e responsabile.

