Inflection, una ambiciosa startup de IA que se esfuerza por desarrollar una "IA personal para todos", ha presentado su gran modelo lingüístico, Inflection-1, que impulsa su agente conversacional Pi. Aunque evaluar la calidad de estos modelos es todo un reto, la existencia de un poco de rivalidad en el mercado es ciertamente beneficiosa.
Inflection-1 está diseñado para estar a la altura de GPT-3.5 (también conocido como ChatGPT) en cuanto a tamaño y capacidades, basándose en los recursos informáticos utilizados para el entrenamiento. Inflection afirma que su modelo es competitivo o incluso superior a otros modelos de su clase, y respalda esta afirmación con un "memorándum técnico" en el que se describen las pruebas comparativas realizadas con Inflection-1, GPT-3.5, LLaMA, Chinchilla y PaLM-540B.
Los resultados publicados revelan que Inflection-1 obtiene efectivamente buenos resultados en diversas evaluaciones, incluidas tareas de exámenes de nivel medio y superior (por ejemplo, biología 101) y puntos de referencia de "sentido común". Su principal inconveniente es la codificación, donde GPT-3.5 supera significativamente a Inflection-1, y GPT-4 a ambos.
Inflection tiene previsto publicar en el futuro los resultados de un modelo más amplio comparable a GPT-4 y PaLM-2(L). Sin embargo, es probable que publique los resultados sólo cuando los considere dignos de mención. La versión mejorada, potencialmente llamada Inflection-2 o Inflection-1-XL, está actualmente en desarrollo.
Aunque no existe un sistema de clasificación formal que divida los modelos de IA en "categorías de peso" equivalentes como en el boxeo, el concepto es similar. Al igual que los boxeadores de peso mosca y los de peso pesado tienen capacidades y requisitos diferentes, los modelos de IA de distintos tamaños y formas también poseen puntos fuertes y débiles únicos. En la actualidad es demasiado pronto para establecer un sistema de clasificación de este tipo, ya que el campo es aún relativamente joven y todavía no se ha alcanzado un consenso sobre las distinciones de los modelos de IA.
En última instancia, para la mayoría de los modelos de IA, su rendimiento en el mundo real habla por sí solo de sus capacidades. Hasta que Inflection abra su modelo al uso generalizado y la evaluación independiente, los puntos de referencia que afirman deben tomarse con cautela. Los usuarios interesados en probar el agente conversacional Pi pueden añadirlo a las aplicaciones de mensajería o acceder a él para chatear en línea aquí.
Con el continuo crecimiento y avance de la industria de la IA, plataformas como AppMaster pueden utilizarse para crear soluciones escalables de forma rápida y más rentable. La adopción de las plataformas no-code y low-code, como la plataforma AppMaster, permite desarrollar sin problemas aplicaciones backend, web y móviles e integrarlas con los modelos de IA emergentes.