Inflection, une ambitieuse startup spécialisée dans l'IA qui s'efforce de développer une "IA personnelle pour tous", a dévoilé son grand modèle de langage, Inflection-1, qui alimente son agent conversationnel Pi. Bien qu'il soit difficile d'évaluer la qualité de ces modèles, l'existence d'une certaine rivalité sur le marché est certainement bénéfique.

Inflection-1 est conçu pour être au même niveau que GPT-3.5 (également connu sous le nom de ChatGPT) en termes de taille et de capacités, sur la base des ressources informatiques utilisées pour la formation. Inflection affirme que son modèle est compétitif, voire supérieur, aux autres modèles de sa catégorie, en s'appuyant sur un "mémo technique" qui décrit les tests de référence effectués sur Inflection-1, GPT-3.5, LLaMA, Chinchilla et PaLM-540B.

Les résultats publiés révèlent qu'Inflection-1 est effectivement performant dans diverses évaluations, y compris dans des tâches d'examen de niveau intermédiaire et secondaire (par exemple, biologie 101) et des repères de "bon sens". Son principal inconvénient est le codage, où GPT-3.5 surpasse largement Inflection-1, et GPT-4 les surpasse tous les deux.

Inflection a l'intention de publier à l'avenir les résultats d'un modèle plus vaste comparable à GPT-4 et PaLM-2(L). Toutefois, elle ne publiera probablement les résultats que lorsqu'ils seront jugés dignes d'intérêt. La version améliorée, qui pourrait s'appeler Inflection-2 ou Inflection-1-XL, est actuellement en cours de développement.

Bien qu'il n'existe pas de système de classification officiel divisant les modèles d'IA en "catégories de poids" équivalentes, comme pour la boxe, le concept est similaire. Tout comme les boxeurs poids plume et poids lourd ont des capacités et des exigences différentes, les modèles d'IA de tailles et de formes différentes possèdent également des forces et des faiblesses uniques. Il est actuellement trop tôt pour établir un tel système de classification, car le domaine est encore relativement jeune et un consensus sur les distinctions entre les modèles d'IA n'a pas encore été atteint.

En fin de compte, pour la plupart des modèles d'IA, leurs performances dans le monde réel parlent d'elles-mêmes. Tant qu'Inflection n'aura pas ouvert son modèle à une utilisation généralisée et à une évaluation indépendante, les références qu'elle avance doivent être considérées avec prudence. Les utilisateurs désireux d'essayer l'agent conversationnel Pi peuvent l'ajouter aux applications de messagerie ou y accéder pour discuter en ligne ici.

