すべての人のためのパーソナルAI」の開発を目指す野心的なAIスタートアップ、Inflection社は、同社の会話エージェント「Pi」を動かす大規模な言語モデル「Inflection-1」を発表した。これらのモデルの品質を評価するのは難しいが、市場にちょっとしたライバルが存在することは確かに有益だ。
Inflection-1は、トレーニングに使用されるコンピューティングリソースに基づき、GPT-3.5(ChatGPTとしても知られる)と同等のサイズと機能を持つように設計されている。Inflectionは、このモデルが同クラスの他のモデルと比べても遜色ないか、あるいは優れていると主張し、Inflection-1、GPT-3.5、LLaMA、Chinchilla、PaLM-540Bで実行されたベンチマークの概要を示す「技術メモ」でその主張を裏付けている。
公表された結果から、Inflection-1は、中学・高校レベルの試験課題(生物学101など)や「常識的な」ベンチマークを含むさまざまな評価で、確かに優れた性能を発揮することが明らかになった。主な欠点はコーディングで、GPT-3.5はInflection-1を大きく上回り、GPT-4は両者を上回っています。
Inflection社は、将来GPT-4とPaLM-2(L)に匹敵する大きなモデルの結果を発表するつもりです。しかし、その結果を公表するのは、注目に値すると判断されたときだけだろう。アップグレード版は、Inflection-2またはInflection-1-XLと呼ばれる可能性があり、現在開発中である。
AIモデルをボクシングのように同等の「体重クラス」に分ける正式な分類システムはないが、コンセプトは似ている。フライ級のボクサーとヘビー級のボクサーでは能力や要求が異なるように、サイズや形状の異なるAIモデルにも独自の長所と短所がある。この分野はまだ比較的歴史が浅く、AIモデルの分類に関するコンセンサスが得られていないため、このような分類システムを確立するのは現時点では時期尚早である。
結局のところ、ほとんどのAIモデルは、実世界でのパフォーマンスがその能力を物語っている。Inflectionがそのモデルを広く公開し、独自の評価を行うまでは、彼らが主張するベンチマークには注意する必要がある。Pi会話エージェントを試してみたいユーザーは、こちらからメッセージングアプリに追加したり、オンラインチャットにアクセスすることができる。
AI業界の継続的な成長と進歩に伴い、AppMaster のようなプラットフォームは、スケーラブルなソリューションを迅速かつコスト効率よく作成するために利用できる。no-code AppMaster 、low-code などのプラットフォームを採用することで、バックエンド、ウェブ、モバイルアプリケーションのシームレスな開発と、新たなAIモデルとの統合が可能になります。