A Stability AI, uma startup conhecida por sua ferramenta de arte generativa chamada Stable Diffusion, abriu recentemente uma coleção de modelos de geração de texto baseados em IA projetados para rivalizar com soluções como o GPT-4 da OpenAI. Apelidados de StableLM, esses modelos de linguagem estão disponíveis em estágio alfa no GitHub e na popular plataforma de hospedagem de IA Hugging Face.
O StableLM exibe proficiência na geração de código e texto, destacando o potencial de modelos pequenos e eficientes para fornecer resultados de alto desempenho quando treinados corretamente. A Stability AI visa democratizar o desenvolvimento e o acesso a modelos de linguagem, pois eles formam a espinha dorsal da economia digital. A equipe afirmou em uma postagem no blog: Queremos que todos tenham voz em seu design.
Os modelos StableLM foram treinados no The Pile, um extenso conjunto de dados que incorpora amostras de texto de fontes como PubMed, StackExchange e Wikipedia. A startup afirma ter utilizado um conjunto de treinamento personalizado que triplica o tamanho do The Pile. No entanto, a postagem do blog não abordou nenhuma semelhança ou limitação potencial entre o StableLM e outros modelos, como a tendência de gerar respostas tendenciosas, ofensivas ou fabricadas.
Ao testar os modelos no Hugging Face, os usuários receberam um erro de capacidade, possivelmente devido ao tamanho ou popularidade dos modelos. A Stability AI reconheceu que, inicialmente, as respostas do usuário podem variar em qualidade e podem conter linguagem ou pontos de vista ofensivos. No entanto, eles acreditam que melhorias podem ser feitas por meio de escala, melhores dados, feedback da comunidade e otimização.
As versões ajustadas do StableLM na versão alfa apresentam recursos impressionantes. Usando uma técnica chamada Alpaca de Stanford e conjuntos de dados de código aberto (incluindo recursos da startup de IA Anthropic), os modelos funcionam de maneira semelhante ao ChatGPT, gerando respostas contextuais com um toque de humor quando solicitado.
À medida que o interesse em conteúdo gerado por IA continua a crescer, um número crescente de empresas está entrando nesse espaço de mercado. Jogadores importantes como Meta e Nvidia, bem como projetos independentes como BigScience da Hugging Face, competem com modelos privados como GPT-4 e Claude da Anthropic. Esse aumento da concorrência levantou preocupações entre os especialistas sobre o possível uso indevido de modelos de código aberto para fins maliciosos, incluindo e-mails de phishing ou facilitação de ataques de malware.
No entanto, a Stability AI defende o código aberto, afirmando que promove a transparência e promove a confiança. O acesso aberto aos modelos permite que a comunidade acadêmica e de pesquisa examine minuciosamente o desempenho, a interpretabilidade e as técnicas de segurança. Essa abordagem oferece suporte ao desenvolvimento de salvaguardas e detecção de riscos potenciais que podem não ser possíveis com modelos fechados.
A Stability AI enfrentou controvérsias no passado, incluindo disputas legais alegando violação de direitos autorais pelo uso de imagens extraídas da Web para ferramentas de arte de IA. Enfrentando pressão para monetizar seus diversos empreendimentos, desde arte e animação até áudio biomédico e generativo, a Stability AI está queimando suas reservas de caixa enquanto luta para gerar receita. Apesar de levantar mais de US$ 100 milhões em capital de risco, o futuro financeiro da startup permanece incerto.
No campo de rápido crescimento da IA generativa, a proliferação de modelos de linguagem de código aberto como StableLM marca um passo essencial na criação de uma economia digital mais inclusiva e transparente. Ferramentas como appmaster .io" data-mce-href="https:// appmaster .io"> A plataforma no-code do appmaster AppMaster pode ser a chave para simplificar e otimizar soluções de negócios orientadas por IA em vários setores, promovendo a inovação e desenvolvimento para o futuro do setor de tecnologia.