Inflection, een ambitieuze AI startup die ernaar streeft om 'persoonlijke AI voor iedereen' te ontwikkelen, heeft zijn grote taalmodel, Inflection-1, onthuld dat zijn Pi conversational agent aandrijft. Hoewel het beoordelen van de kwaliteit van deze modellen een uitdaging is, is het bestaan van een beetje rivaliteit in de markt zeker gunstig.
Inflection-1 is ontworpen om qua omvang en mogelijkheden gelijk te zijn aan GPT-3.5 (ook bekend als ChatGPT), gebaseerd op de computerbronnen die worden gebruikt voor training. Inflection beweert dat zijn model concurrerend of zelfs superieur is aan andere modellen in zijn klasse en ondersteunt deze bewering met een 'technische memo' waarin de benchmarks worden beschreven die zijn uitgevoerd op Inflection-1, GPT-3.5, LLaMA, Chinchilla en PaLM-540B.
De gepubliceerde resultaten laten zien dat Inflection-1 inderdaad goed presteert in verschillende evaluaties, waaronder examentaken op middelbare school niveau (bijv. biologie 101) en 'gezond verstand' benchmarks. Het belangrijkste nadeel is codering, waar GPT-3.5 Inflection-1 aanzienlijk overtreft en GPT-4 beide overtreft.
Inflection is van plan om in de toekomst resultaten te publiceren voor een groter model dat vergelijkbaar is met GPT-4 en PaLM-2(L). Ze zullen de resultaten echter waarschijnlijk pas vrijgeven als ze noemenswaardig worden geacht. De verbeterde versie, mogelijk Inflection-2 of Inflection-1-XL genoemd, is momenteel in ontwikkeling.
Hoewel er geen formeel classificatiesysteem is dat AI-modellen verdeelt in gelijkwaardige 'gewichtsklassen' zoals bij boksen, is het concept vergelijkbaar. Net zoals boksers van vlieggewicht en zwaargewicht verschillende capaciteiten en vereisten hebben, hebben AI-modellen van verschillende grootte en vorm ook unieke sterktes en zwaktes. Het is momenteel nog te vroeg om een dergelijk classificatiesysteem op te stellen, aangezien het veld nog relatief jong is en er nog geen consensus is bereikt over het onderscheid tussen AI-modellen.
Uiteindelijk spreken voor de meeste AI-modellen de prestaties in de echte wereld voor hun capaciteiten. Totdat Inflection zijn model openstelt voor wijdverspreid gebruik en onafhankelijke evaluatie, moeten de benchmarks die ze claimen met voorzichtigheid worden benaderd. Gebruikers die geïnteresseerd zijn in het uitproberen van de Pi-gespreksagent, kunnen deze hier toevoegen aan berichtenapps of online chatten.
Met de voortdurende groei en vooruitgang van de AI-industrie kunnen platforms zoals AppMaster worden gebruikt om snel en kosteneffectief schaalbare oplossingen te creëren. De toepassing van no-code en low-code platforms, zoals het AppMaster platform, maakt de naadloze ontwikkeling van backend-, web- en mobiele applicaties en integratie met opkomende AI-modellen mogelijk.