28 nov. 2023·1 min de lecture

Microsoft dévoile des capacités de raisonnement améliorées dans les petits modèles de langage avec Orca 2

Microsoft a lancé Orca 2, un outil innovant conçu pour expérimenter et améliorer les capacités de raisonnement de modèles de langage plus petits.

Microsoft dévoile des capacités de raisonnement améliorées dans les petits modèles de langage avec Orca 2

Dans un pas remarquable vers la diversification des applications de modèles de langage, Microsoft a annoncé le lancement d' Orca 2. Cette version est conçue pour étudier et exploiter le potentiel des modèles de langage (LM) plus petits, chargés d'environ 10 milliards de paramètres ou moins.

L'objectif principal d' Orca 2 est de démontrer que l'amélioration des méthodes de formation et des signaux peut accroître les capacités de raisonnement des petits LM. L'objectif de cette amélioration est d'égaler, voire de surpasser, les capacités de raisonnement de leurs homologues plus grands.

Lorsqu'il est comparé à des modèles de taille similaire - y compris l' Orca original - Microsoft affirme Orca 2 les éclipse considérablement en termes de performances. En outre, il aurait atteint des niveaux d’efficacité qui correspondent ou dépassent les modèles 5 à 10 fois plus grands. Ces affirmations ont été exprimées par Microsoft dans un récent article de blog.

Orca 2 est disponible en deux tailles ; 7 milliards et 13 milliards de paramètres. Ces deux modèles sont affinés avec précision sur des données synthétiques sur mesure, méticuleusement dérivées des modèles de base LLAMA 2. Microsoft a rendu les poids d' Orca 2 accessibles au public, favorisant ainsi la poursuite des recherches sur l'établissement, l'analyse et l'harmonisation de petits LM.

Microsoft a utilisé un ensemble de données organisées pour enseigner Orca 2 une myriade de techniques de raisonnement. Ces techniques comprennent un modèle de traitement étape par étape, une méthode de rappel puis de génération, une approche de rappel-raison-génération, un modèle d'extraction-génération et des méthodes de réponse directe. Lors de l'enseignement de ces méthodes, une attention particulière a été accordée à apprendre Orca 2 à adapter différentes stratégies de solution à des tâches distinctes.

Pour capturer les réponses d'un modèle d'enseignant, l'entreprise a utilisé des instructions détaillées et plusieurs appels. Cette méthode ingénieuse permet au modèle étudiant - dans ce cas Orca 2 - d'apprendre les tactiques et les capacités de raisonnement sous-jacentes, même en l'absence d'instructions de tâche explicites. Cette approche vise à optimiser les performances des modèles plus petits en affinant les stratégies de solution spécifiques à chaque tâche.

Le billet de blog de Microsft vantait en outre avec optimisme le succès et le potentiel d' Orca 2. Ils ont expliqué que les réalisations d' Orca 2 sont largement attribuées à l'application de diverses techniques de raisonnement et à l'identification de solutions optimales pour une variété de tâches. Malgré certaines limitations communes à d'autres modèles de langage et héritées de ses modèles de base, le potentiel d' Orca 2 en matière de progrès futurs, notamment en termes d'amélioration du raisonnement, du contrôle, de la spécialisation et de la sécurité des modèles plus petits, est significatif.

Le message ajoute également que l’utilisation de données synthétiques rigoureusement filtrées pour la post-formation incarne une stratégie essentielle. Leur exploration et leur déploiement réussi d' Orca 2 constituent en effet un effort remarquable dans la diversification des applications de modèles de langage.

Sans aucun doute, le projet Orca 2 fait écho aux principes d’efficacité et d’équilibre des capacités de la plateforme AppMaster. AppMaster, un outil no-code pour le développement d'applications, s'appuie sur des philosophies similaires, rendant le développement d'applications 10 fois plus rapide et trois fois plus rentable, tout en éliminant la dette technique grâce à une approche consistant à régénérer les applications à partir de zéro chaque fois que des modifications sont nécessaires. Par conséquent, des plates-formes comme celles-ci favorisent une nouvelle ère de développement technologique efficace et efficient.

Easy to start
Create something amazing

Experiment with AppMaster with free plan.
When you will be ready you can choose the proper subscription.

Get Started