Stability AI, une startup connue pour son outil d'art d'IA génératif nommé Stable Diffusion, a récemment mis en open source une collection de modèles de génération de texte alimentés par l'IA conçus pour rivaliser avec des solutions comme le GPT-4 d'OpenAI. Baptisés StableLM, ces modèles de langage sont disponibles en version alpha sur GitHub et sur la populaire plateforme d'hébergement d'IA Hugging Face.
StableLM affiche sa capacité à générer à la fois du code et du texte, soulignant le potentiel de petits modèles efficaces pour fournir des résultats de haute performance lorsqu'ils sont formés correctement. Stability AI vise à démocratiser le développement et l'accès aux modèles linguistiques car ils constituent l'épine dorsale de l'économie numérique. L'équipe a déclaré dans un article de blog : Nous voulons que tout le monde ait son mot à dire dans leur conception.
Les modèles StableLM ont été formés sur The Pile, un vaste ensemble de données qui intègre des échantillons de texte provenant de sources telles que PubMed, StackExchange et Wikipedia. La startup prétend avoir utilisé un ensemble de formation personnalisé qui multiplie par trois la taille de The Pile. Cependant, le billet de blog n'a pas abordé les similitudes ou les limitations potentielles entre StableLM et d'autres modèles, comme une tendance à générer des réponses biaisées, offensantes ou fabriquées.
Lors du test des modèles sur Hugging Face, les utilisateurs ont reçu une erreur de capacité, probablement en raison de la taille ou de la popularité des modèles. Stability AI a reconnu qu'au départ, les réponses des utilisateurs peuvent varier en qualité et peuvent contenir un langage ou des opinions offensants. Cependant, ils pensent que des améliorations peuvent être apportées grâce à l'échelle, à de meilleures données, aux commentaires de la communauté et à l'optimisation.
Les versions affinées de StableLM dans la version alpha présentent des capacités impressionnantes. En utilisant une technique appelée Alpaca de Stanford et des ensembles de données open source (y compris des ressources de la startup AI Anthropic), les modèles fonctionnent de la même manière que ChatGPT, générant des réponses contextuelles avec une touche d'humour lorsque vous y êtes invité.
Alors que l'intérêt pour le contenu généré par l'IA continue de croître, un nombre croissant d'entreprises entrent sur ce marché. Des acteurs majeurs comme Meta et Nvidia, ainsi que des projets indépendants comme BigScience de Hugging Face, rivalisent avec des modèles privés tels que GPT-4 et Anthropic's Claude. Cette concurrence accrue a soulevé des inquiétudes parmi les experts quant à l'utilisation abusive potentielle des modèles open source à des fins malveillantes, y compris les e-mails de phishing ou la facilitation des attaques de logiciels malveillants.
Cependant, Stability AI préconise l'open sourcing, affirmant qu'il favorise la transparence et favorise la confiance. Le libre accès aux modèles permet à la communauté universitaire et de recherche d'examiner les performances, l'interprétabilité et les techniques de sécurité. Cette approche prend en charge le développement de sauvegardes et la détection de risques potentiels qui pourraient ne pas être possibles avec des modèles fermés.
Stability AI a fait face à des controverses dans le passé, y compris des litiges alléguant une violation du droit d'auteur en utilisant des images récupérées sur le Web pour les outils d'art de l'IA. Face à la pression de monétiser ses diverses entreprises, de l'art et de l'animation à l'audio biomédical et génératif, Stability AI brûlerait ses réserves de trésorerie tout en luttant pour générer des revenus. Malgré la levée de plus de 100 millions de dollars en capital-risque, l'avenir financier de la startup reste incertain.
Dans le domaine en pleine expansion de l'IA générative, la prolifération de modèles de langage open source comme StableLM marque une étape essentielle dans la création d'une économie numérique plus inclusive et transparente. Des outils comme appmaster .io" data-mce-href="https:// appmaster.io" AppMaster La plate no-code d'AppMaster .io pourrait être la clé pour simplifier et optimiser les solutions commerciales basées sur l'IA dans divers secteurs, favorisant l'innovation et le développement pour l'avenir du secteur technologique.