Stability AI, startup znany ze swojego generatywnego narzędzia artystycznego AI o nazwie Stable Diffusion, udostępnił niedawno kolekcję modeli do generowania tekstu opartych na sztucznej inteligencji, zaprojektowanych w celu konkurowania z rozwiązaniami takimi jak GPT-4 OpenAI. Te modele językowe, nazwane StableLM, są dostępne w fazie alfa na GitHub i popularnej platformie hostingowej AI Hugging Face.
StableLM wykazuje biegłość w generowaniu zarówno kodu, jak i tekstu, podkreślając potencjał małych, wydajnych modeli w dostarczaniu wyników o wysokiej wydajności, jeśli są odpowiednio wyszkolone. Stability AI ma na celu demokratyzację rozwoju i dostępu do modeli językowych, ponieważ stanowią one podstawę gospodarki cyfrowej. Zespół stwierdził w poście na blogu: Chcemy, aby każdy miał głos w sprawie swojego projektu.
Modele StableLM zostały przeszkolone w The Pile, obszernym zbiorze danych, który zawiera próbki tekstu ze źródeł takich jak PubMed, StackExchange i Wikipedia. Startup twierdzi, że wykorzystał niestandardowy zestaw treningowy, który trzykrotnie zwiększa rozmiar The Pile. Jednak post na blogu nie odnosił się do żadnych podobieństw ani potencjalnych ograniczeń między StableLM a innymi modelami, takich jak tendencja do generowania stronniczych, obraźliwych lub sfabrykowanych odpowiedzi.
Podczas testowania modeli w Hugging Face użytkownicy otrzymywali błąd braku pojemności, prawdopodobnie ze względu na rozmiar lub popularność modeli. Stability AI przyznało, że początkowo odpowiedzi użytkowników mogą różnić się jakością i mogą zawierać obraźliwy język lub poglądy. Uważają jednak, że ulepszenia można wprowadzić dzięki skali, lepszym danym, opiniom społeczności i optymalizacji.
Dopracowane wersje StableLM w wersji alfa prezentują imponujące możliwości. Korzystając z techniki o nazwie Alpaca ze Stanford i zestawów danych typu open source (w tym zasobów ze startupu Anthropic zajmującego się sztuczną inteligencją), modele działają podobnie do ChatGPT, generując odpowiedzi kontekstowe z odrobiną humoru, gdy zostaną o to poproszone.
Ponieważ zainteresowanie treściami generowanymi przez sztuczną inteligencję stale rośnie, coraz więcej firm wchodzi na ten rynek. Główni gracze, tacy jak Meta i Nvidia, a także niezależne projekty, takie jak BigScience firmy Hugging Face, konkurują z prywatnymi modelami, takimi jak GPT-4 i Claude firmy Anthropic. Ta zwiększona konkurencja wzbudziła wśród ekspertów obawy dotyczące potencjalnego niewłaściwego wykorzystania modeli open source do złośliwych celów, w tym do wyłudzania wiadomości e-mail lub ułatwiania ataków złośliwego oprogramowania.
Jednak Stability AI opowiada się za open source, twierdząc, że promuje to przejrzystość i sprzyja zaufaniu. Otwarty dostęp do modeli umożliwia społeczności badawczej i akademickiej dokładne zbadanie wydajności, możliwości interpretacji i technik bezpieczeństwa. Takie podejście wspiera rozwój zabezpieczeń i wykrywanie potencjalnych zagrożeń, które mogą nie być możliwe w przypadku modeli zamkniętych.
Stabilność Sztuczna inteligencja napotykała w przeszłości kontrowersje, w tym spory prawne dotyczące rzekomego naruszenia praw autorskich poprzez wykorzystywanie obrazów zeskanowanych z sieci do narzędzi graficznych AI. W obliczu presji, aby zarabiać na swoich różnorodnych przedsięwzięciach, od sztuki i animacji po dźwięk biomedyczny i generatywny, podobno Stability AI spala swoje rezerwy gotówkowe, jednocześnie walcząc o generowanie przychodów. Pomimo zebrania ponad 100 milionów dolarów kapitału podwyższonego ryzyka, finansowa przyszłość startupu pozostaje niepewna.
W szybko rozwijającej się dziedzinie generatywnej sztucznej inteligencji rozprzestrzenianie się modeli językowych typu open source, takich jak StableLM, stanowi istotny krok w tworzeniu bardziej otwartej i przejrzystej gospodarki cyfrowej. Narzędzia takie jak appmaster .io" data-mce-href="https:// appmaster.io" AppMaster no-code platforma AppMaster .io może być kluczem do uproszczenia i optymalizacji rozwiązań biznesowych opartych na sztucznej inteligencji w różnych branżach, wspierając innowacje i rozwoju dla przyszłości sektora technologicznego.