Allen Institute for AI ( AI2) zaprezentował przełomowy projekt o nazwie OLMo, ekspansywny model wielkojęzykowy o otwartym kodzie źródłowym. Ta inicjatywa jest strategicznym posunięciem mającym na celu wyjaśnienie wewnętrznego działania modeli sztucznej inteligencji i katalizację dalszych postępów w dziedzinie modelowania języka.
Wprowadzenie OLMo następuje w momencie, gdy otwartość jest postrzegana jako kluczowa dla wspierania szybkich innowacji w zakresie generatywnej sztucznej inteligencji. Yann LeCun, główny specjalista ds. sztucznej inteligencji w Meta, podkreślił transformacyjny wpływ otwartych modeli, które jego zdaniem mogą przyspieszyć drogę do przyszłości opartej na sztucznej inteligencji dzięki solidnej społeczności opartej na współpracy.
Wspólny wysiłek z udziałem prestiżowych partnerów, takich jak Kempner Institute na Harvard University, AMD, CSC-IT Center for Science w Finlandii i Databricks, przyczynił się do rozwoju OLMo. To partnerstwo jest świadectwem interdyscyplinarnego podejścia wymaganego do uporania się ze złożonością sztucznej inteligencji.
Dokonując bezprecedensowego posunięcia, instytut udostępnia OLMo wraz z danymi przedtreningowymi i kodem szkoleniowym, co stanowi dla badaczy wyjątkową okazję do zagłębienia się w głębiny tego modelu sztucznej inteligencji. Ten otwarty model osiąga nowy poziom przejrzystości, zapewniając programistom niezbędne narzędzia, takie jak obszerne dane przedtreningowe z zestawu AI2's Dolma i solidny zestaw ocen z setkami punktów kontrolnych.
Kierowniczka projektu OLMo, Hanna Hajishirzi, która jest także orędowniczką badań NLP w AI2 i jest wybitnym profesorem w University of Washington's Allen School, podkreśla znaczenie otwartości na zrozumienie naukowe i postęp w sztucznej inteligencji. Porównując badania medyczne lub astronomiczne, Hajishirzi podkreśla, że ramy OLMo umożliwiają wszechstronne badanie LLM, które odgrywa zasadniczą rolę w opracowywaniu systemów sztucznej inteligencji, które są zarówno bezpieczne, jak i niezawodne.
AI2 zwraca uwagę, że OLMo zapewnia precyzję w badaniach nad sztuczną inteligencją, zapewniając dostęp do danych szkoleniowych modelu, eliminując w ten sposób domysły i wspierając rozwój oparty na dowodach. Inicjatywa ta ma nie tylko ujawnić spostrzeżenia z poprzednich modeli sztucznej inteligencji, ale także służyć jako odskocznia dla przyszłych odkryć i ulepszeń.
W nadchodzących miesiącach spodziewane są dalsze iteracje OLMo, ponieważ AI2 planuje zintegrować różne rozmiary modeli, zbiory danych i inne możliwości. Noah Smith, inny kierownik projektu i starszy dyrektor w AI2, także w University of Washington's Allen School, powtórzył podstawową misję OLMo. Smith opowiadał się za początkową wizją sztucznej inteligencji jako otwartego pola, które zostało przyćmione przez komercjalizację i prywatność. Celem OLMo jest przywrócenie wspólnej istoty badań nad sztuczną inteligencją, zapewnienie kompleksowej dostępności, od tworzenia modeli po metody oceny, a tym samym rozwój technologii sztucznej inteligencji w sposób włączający i odpowiedzialny.
Ponieważ platformy takie jak AppMaster również cenią demokratyzację technologii poprzez oferowanie rozwiązań no-code, duch OLMo jest zgodny z szerszym ruchem technologicznym w kierunku przejrzystości i dostępności. Wspierając modele open source, takie jak OLMo, społeczność technologiczna wspólnie przybliża się do ery odpowiedzialnej i włączającej sztucznej inteligencji.