A Mistral AI, uma startup francesa de inteligência artificial que compete com empresas como a OpenAI, encerrou oficialmente o seu tão aguardado evento de financiamento da Série A, acumulando impressionantes 385 milhões de euros ou 415 milhões de dólares usando a taxa de câmbio atual. Como resultado desta injeção financeira, a empresa apresenta agora uma avaliação de 2 mil milhões de dólares, confirma relatórios da Bloomberg. Ao mesmo tempo, a Mistral AI também revela sua plataforma comercial.

Arthur Mensch, cofundador e CEO da Mistral AI, explicou em comunicado que desde a criação da empresa em maio, eles têm se concentrado inabalavelmente em moldar uma potência europeia em IA generativa. Sua abordagem está centrada em tecnologia aberta, responsável e descentralizada.

A Mistral AI já havia lançado seu modelo inaugural, denominado Mistral 7B, em setembro passado. Este extenso modelo de linguagem não foi construído para competir diretamente com modelos estabelecidos como GPT-4 ou Claude 2. Este modelo foi treinado usando um conjunto de dados comparativamente “pequeno” composto por aproximadamente 7 bilhões de parâmetros.

O modelo foi distribuído sob a licença Apache 2.0. Esta licença irrestrita de código aberto requer apenas atribuição para uso ou replicação. O modelo foi desenvolvido discretamente, aproveitando um conjunto de dados proprietário e pesos não divulgados.

Há poucos dias, os legisladores da UE chegaram a um acordo político. As empresas especializadas em modelos fundamentais terão de cumprir alguns requisitos de transparência e serão obrigadas a partilhar resumos e documentação técnica de conjuntos de dados.

A Mistral AI, no entanto, planeja monetizar seus modelos fundamentais. Este é o motivo da decisão da empresa de inaugurar hoje sua plataforma de desenvolvedores em beta. Usando esta plataforma, outras entidades corporativas podem pagar para utilizar os modelos da Mistral AI por meio de APIs.

Juntamente com o modelo Mistral 7B (também conhecido como “Mistral-tiny”), os desenvolvedores agora podem obter acesso ao modelo Mixtral 8x7B (“Mistral-small”). Este modelo incorpora uma “rede de roteadores” para processar tokens de entrada e escolher o grupo de parâmetros mais adequado para fornecer uma resposta.

Este método permite um aumento nos parâmetros do modelo, mantendo o custo e a latência sob controle, já que o modelo aproveita apenas uma fração do conjunto total de parâmetros por token. Em termos práticos, o Mixtral possui um total de 45B de parâmetros, mas implanta apenas 12B de parâmetros por token. Portanto, ele processa entradas e gera saídas no mesmo ritmo e custo de um modelo 12B, elaborou a empresa em uma postagem no blog.

O modelo Mixtral 8x7B também foi divulgado sob a licença Apache 2.0 e pode ser baixado gratuitamente. Um terceiro modelo, Mistral-medium, pode ser encontrado na plataforma de desenvolvimento do Mistral. Alega-se que ele supera outros modelos da linha Mistral AI e só pode ser acessado por meio da plataforma API paga, sem link de download disponível.