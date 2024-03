Em uma colaboração sem precedentes, ServiceNow, Hugging Face e NVIDIA revelaram StarCoder2, um conjunto robusto de modelos de linguagem grande (LLMs), desenvolvido especificamente para aumentar as capacidades de desenvolvedores em todo o mundo.

Os modelos StarCoder2, treinados em um amplo conjunto de dados de 619 tarefas de programação, são projetados para auxiliar na geração automatizada de código, elaboração eficiente de fluxo de trabalho e resumo de texto sucinto. Tanto os engenheiros de software profissionais quanto os desenvolvedores cidadãos não tradicionais podem se beneficiar deste conjunto de ferramentas transformadoras.

Nascido da iniciativa BigCode – um consórcio comprometido com o desenvolvimento eticamente correto de LLMs – a criação do StarCoder2 foi curada conjuntamente pela ServiceNow e Hugging Face, ilustrando um futuro colaborativo para a inteligência artificial.

Cada um dos três líderes do setor contribuiu com modelos de tamanhos distintos: um gigante de 3 bilhões de parâmetros da ServiceNow, o peso pesado de 7 bilhões de parâmetros da Hugging Face e o colossal modelo de 15 bilhões de parâmetros treinado pela NVIDIA. Notavelmente, a versão de 3 bilhões de parâmetros é igual à eficácia do modelo original de 15 bilhões de parâmetros do StarCoder, mas com significativamente menos demanda computacional.

Esses LLMs não são entidades estáticas; os desenvolvedores são incentivados a personalizá-los e aprimorá-los por meio do uso de plataformas de código aberto, como NVIDIA NeMo ou Hugging Face Transform and Learn (TRL), atendendo a uma vasta gama de requisitos de desenvolvimento.

Harm de Vries, que lidera o desenvolvimento do StarCoder2 para ServiceNow e co-líder BigCode, elogiou StarCoder2 por capacitar os desenvolvedores com ferramentas de IA que aumentam a produtividade e oferecem soluções escaláveis, alinhando-se diretamente com a progressão ética da IA ​​e ampliando o sucesso organizacional.

Da mesma forma, o maestro de aprendizado de máquina Hugging Face, Leandro von Werra, destacou como a joint venture entre os três gigantes da tecnologia fornece aos desenvolvedores modelos básicos dinâmicos, ampliando assim a eficiência do desenvolvimento de aplicativos, tudo sob a bandeira da metodologia de código aberto e responsável Prática de IA.

