Inflection, ambitny startup AI dążący do opracowania "osobistej sztucznej inteligencji dla każdego", zaprezentował swój duży model językowy, Inflection-1, który zasila agenta konwersacyjnego Pi. Chociaż ocena jakości tych modeli jest wyzwaniem, istnienie odrobiny rywalizacji na rynku jest z pewnością korzystne.

Inflection-1 został zaprojektowany tak, aby dorównać GPT-3.5 (znanemu również jako ChatGPT) pod względem rozmiaru i możliwości, w oparciu o zasoby obliczeniowe wykorzystywane do szkolenia. Inflection twierdzi, że jego model jest konkurencyjny lub nawet lepszy od innych modeli w swojej klasie, popierając to stwierdzenie "notatką techniczną", która przedstawia testy porównawcze przeprowadzone na Inflection-1, GPT-3.5, LLaMA, Chinchilla i PaLM-540B.

Opublikowane wyniki pokazują, że Inflection-1 rzeczywiście radzi sobie dobrze w różnych ocenach, w tym w zadaniach egzaminacyjnych na poziomie gimnazjalnym i licealnym (np. biologia 101) oraz w "zdroworozsądkowych" testach porównawczych. Jego główną wadą jest kodowanie, w którym GPT-3.5 znacznie przewyższa Inflection-1, a GPT-4 przewyższa je obie.

Inflection zamierza w przyszłości opublikować wyniki dla większego modelu porównywalnego z GPT-4 i PaLM-2(L). Prawdopodobnie jednak wyniki te zostaną opublikowane dopiero wtedy, gdy zostaną uznane za godne uwagi. Ulepszona wersja, potencjalnie nazywana Inflection-2 lub Inflection-1-XL, jest obecnie w fazie rozwoju.

Chociaż nie istnieje formalny system klasyfikacji, który dzieli modele AI na równoważne "kategorie wagowe", takie jak boks, koncepcja jest podobna. Podobnie jak bokserzy wagi muszej i ciężkiej mają różne możliwości i wymagania, modele AI o różnych rozmiarach i kształtach również mają unikalne mocne i słabe strony. Obecnie jest zbyt wcześnie, aby ustanowić taki system klasyfikacji, ponieważ dziedzina ta jest wciąż stosunkowo młoda i nie osiągnięto jeszcze konsensusu w sprawie rozróżnienia modeli AI.

Ostatecznie, w przypadku większości modeli AI, ich wydajność w świecie rzeczywistym przemawia za ich możliwościami. Dopóki Inflection nie udostępni swojego modelu do powszechnego użytku i niezależnej oceny, do testów porównawczych należy podchodzić z ostrożnością. Użytkownicy zainteresowani wypróbowaniem agenta konwersacyjnego Pi mogą dodać go do aplikacji do przesyłania wiadomości lub uzyskać dostęp do czatu online tutaj.

