Mistral AI, une start-up française d'intelligence artificielle en concurrence avec OpenAI, a officiellement mis fin à son événement de financement très attendu de série A, amassant un montant impressionnant de 385 millions d'euros ou 415 millions de dollars en utilisant le taux de change actuel. Grâce à cette injection financière, la société affiche désormais une valorisation de 2 milliards de dollars, confirme les informations de Bloomberg. Parallèlement, Mistral AI dévoile également sa plateforme commerciale.

Arthur Mensch, co-fondateur et PDG de Mistral AI, a expliqué dans un communiqué que depuis la création de l'entreprise en mai, ils se sont concentrés sans relâche sur la formation d'une puissance européenne en matière d'IA générative. Leur approche est centrée sur une technologie ouverte, responsable et décentralisée.

Mistral AI avait déjà lancé son modèle inaugural, baptisé Mistral 7B, en septembre dernier. Ce modèle de langage étendu n'a pas été construit pour rivaliser directement avec des modèles établis comme GPT-4 ou Claude 2. Ce modèle a été formé à l'aide d'un ensemble de données relativement « petit » composé d'environ 7 milliards de paramètres.

Le modèle a été distribué sous la licence Apache 2.0. Cette licence open source illimitée nécessite uniquement une attribution pour l'utilisation ou la réplication. Le modèle a été développé discrètement, en exploitant un ensemble de données exclusives et des pondérations non publiées.

Il y a quelques jours à peine, les législateurs européens sont parvenus à un accord politique. Les entreprises spécialisées dans les modèles fondamentaux devront répondre à certaines exigences de transparence et devront partager les résumés des ensembles de données et la documentation technique.

Mistral AI envisage néanmoins de monétiser ses modèles fondateurs. C'est la raison qui a motivé la décision de l'entreprise d'inaugurer aujourd'hui sa plateforme de développement en version bêta. Grâce à cette plateforme, d'autres entités corporatives peuvent payer pour utiliser les modèles de Mistral AI via des API.

Aux côtés du modèle Mistral 7B (également appelé « Mistral-tiny »), les développeurs peuvent désormais accéder au modèle Mixtral 8x7B (« Mistral-small »). Ce modèle intègre un « réseau de routeurs » pour traiter les jetons d'entrée et sélectionner le groupe de paramètres le plus approprié pour fournir une réponse.

Cette méthode permet d'augmenter les paramètres du modèle tout en maîtrisant les coûts et la latence, car le modèle n'exploite qu'une fraction de l'ensemble total de paramètres par jeton. Concrètement, Mixtral dispose d'un total de 45 milliards de paramètres, mais il ne déploie que 12 milliards de paramètres par jeton. Par conséquent, il traite les entrées et génère des sorties au même rythme et au même coût qu’un modèle 12B, a expliqué la société dans un article de blog.

Le modèle Mixtral 8x7B a également été diffusé sous licence Apache 2.0 et peut être téléchargé gratuitement. Un troisième modèle, Mistral-medium, est disponible sur la plateforme développeur de Mistral. Il est censé surpasser les autres modèles de la gamme Mistral AI et n'est accessible que via la plate-forme API payante, sans lien de téléchargement disponible.