18 kwi 2023·1 min czytania

Stability AI ujawnia modele AI do generowania tekstu typu open source do rywala GPT-4

Stability AI wydało kolekcję modeli generujących tekst AI o otwartym kodzie źródłowym o nazwie StableLM, zaprojektowanych w celu konkurowania z GPT-4 OpenAI.

Stability AI, startup znany ze swojego generatywnego narzędzia artystycznego AI o nazwie Stable Diffusion, udostępnił niedawno kolekcję modeli do generowania tekstu opartych na sztucznej inteligencji, zaprojektowanych w celu konkurowania z rozwiązaniami takimi jak GPT-4 OpenAI. Te modele językowe, nazwane StableLM, są dostępne w fazie alfa na GitHub i popularnej platformie hostingowej AI Hugging Face.

StableLM wykazuje biegłość w generowaniu zarówno kodu, jak i tekstu, podkreślając potencjał małych, wydajnych modeli w dostarczaniu wyników o wysokiej wydajności, jeśli są odpowiednio wyszkolone. Stability AI ma na celu demokratyzację rozwoju i dostępu do modeli językowych, ponieważ stanowią one podstawę gospodarki cyfrowej. Zespół stwierdził w poście na blogu: Chcemy, aby każdy miał głos w sprawie swojego projektu.

Modele StableLM zostały przeszkolone w The Pile, obszernym zbiorze danych, który zawiera próbki tekstu ze źródeł takich jak PubMed, StackExchange i Wikipedia. Startup twierdzi, że wykorzystał niestandardowy zestaw treningowy, który trzykrotnie zwiększa rozmiar The Pile. Jednak post na blogu nie odnosił się do żadnych podobieństw ani potencjalnych ograniczeń między StableLM a innymi modelami, takich jak tendencja do generowania stronniczych, obraźliwych lub sfabrykowanych odpowiedzi.

Podczas testowania modeli w Hugging Face użytkownicy otrzymywali błąd braku pojemności, prawdopodobnie ze względu na rozmiar lub popularność modeli. Stability AI przyznało, że początkowo odpowiedzi użytkowników mogą różnić się jakością i mogą zawierać obraźliwy język lub poglądy. Uważają jednak, że ulepszenia można wprowadzić dzięki skali, lepszym danym, opiniom społeczności i optymalizacji.

Dopracowane wersje StableLM w wersji alfa prezentują imponujące możliwości. Korzystając z techniki o nazwie Alpaca ze Stanford i zestawów danych typu open source (w tym zasobów ze startupu Anthropic zajmującego się sztuczną inteligencją), modele działają podobnie do ChatGPT, generując odpowiedzi kontekstowe z odrobiną humoru, gdy zostaną o to poproszone.

Ponieważ zainteresowanie treściami generowanymi przez sztuczną inteligencję stale rośnie, coraz więcej firm wchodzi na ten rynek. Główni gracze, tacy jak Meta i Nvidia, a także niezależne projekty, takie jak BigScience firmy Hugging Face, konkurują z prywatnymi modelami, takimi jak GPT-4 i Claude firmy Anthropic. Ta zwiększona konkurencja wzbudziła wśród ekspertów obawy dotyczące potencjalnego niewłaściwego wykorzystania modeli open source do złośliwych celów, w tym do wyłudzania wiadomości e-mail lub ułatwiania ataków złośliwego oprogramowania.

Jednak Stability AI opowiada się za open source, twierdząc, że promuje to przejrzystość i sprzyja zaufaniu. Otwarty dostęp do modeli umożliwia społeczności badawczej i akademickiej dokładne zbadanie wydajności, możliwości interpretacji i technik bezpieczeństwa. Takie podejście wspiera rozwój zabezpieczeń i wykrywanie potencjalnych zagrożeń, które mogą nie być możliwe w przypadku modeli zamkniętych.

Stabilność Sztuczna inteligencja napotykała w przeszłości kontrowersje, w tym spory prawne dotyczące rzekomego naruszenia praw autorskich poprzez wykorzystywanie obrazów zeskanowanych z sieci do narzędzi graficznych AI. W obliczu presji, aby zarabiać na swoich różnorodnych przedsięwzięciach, od sztuki i animacji po dźwięk biomedyczny i generatywny, podobno Stability AI spala swoje rezerwy gotówkowe, jednocześnie walcząc o generowanie przychodów. Pomimo zebrania ponad 100 milionów dolarów kapitału podwyższonego ryzyka, finansowa przyszłość startupu pozostaje niepewna.

W szybko rozwijającej się dziedzinie generatywnej sztucznej inteligencji rozprzestrzenianie się modeli językowych typu open source, takich jak StableLM, stanowi istotny krok w tworzeniu bardziej otwartej i przejrzystej gospodarki cyfrowej. Narzędzia takie jak [appmaster .io" data-mce-href="https:// appmaster.io" AppMaster](https://<span class=) no-code platforma AppMaster .io może być kluczem do uproszczenia i optymalizacji rozwiązań biznesowych opartych na sztucznej inteligencji w różnych branżach, wspierając innowacje i rozwoju dla przyszłości sektora technologicznego.

Easy to start

Create something amazing

Experiment with AppMaster with free plan.
When you will be ready you can choose the proper subscription.

Get Started

Powiązane wiadomości