OpenAIは、革新的なテキスト生成ツール「GPT-4」のAPIによる一般提供を開始しました。人気のGPTシリーズの最新の進化は、より多くの開発者に特権を拡大し、アップグレードされたユーザーエクスペリエンスをもたらします。
GPT-4へのアクセスは、支払い実績のある既存のAPI開発者向けに開始された。アクセスは順次拡大され、今月末までには新しい開発者にも提供される予定だ。
OpenAIはブログの中で、3月の開始以来、何百万人もの開発者の間でGPT-4 APIへの関心が高まっていることを強調した。
OpenAIは、GPT-4の強みを活用した革新的な製品の急増を予測している。同社のビジョンを強調し、次のように述べている:私たちは、チャットベースのモデルがあらゆるユースケースをサポートできる未来を描いています。
GPT-4のトレーニングは、OpenAIが過去に発表したGPTのバージョンと同様に、公開ウェブページのデータを含む一般にアクセス可能なデータと、ライセンスされたデータを補足している。
しかし、興味深いことに、画像理解機能はまだすべてのOpenAIのクライアントが利用できるわけではない。現在、この機能は1つのパートナーであるBe My Eyesとの間で試用中であり、OpenAIの他の顧客ベースがいつ利用できるようになるかは未定だ。
とはいえ、GPT-4には限界がある。このモデルには事実を「幻覚」する傾向があり、時折論理的な推論を誤ることがある。さらに、経験から学習しないため、生成するコードにセキュリティの脆弱性を導入する際に問題が生じる可能性がある。
これに対処するため、同社は、GPT-4とGPT-3.5 Turboの両方を開発者自身のデータで微調整できる機能を開発する予定だと述べた。この機能は今年の後半には使えるようになるはずだ。
GPT-4の発表以来、ジェネレーティブAI分野の競争は激化している。最近、Anthropicはテキスト生成AIであるClaudeのコンテキストウィンドウを拡張した。通常はプレビューの段階だが、10万トークンへの拡張は、それまでの9000トークンから飛躍的に進歩した。
平たく言えば、モデルのコンテキスト・ウィンドウは、追加テキストを生成する前にレビューするテキストを表す。逆に、トークンは生のテキストを表す。コンテキストウィンドウが大きいほど、モデルはより多くのコンテキストを吸収することができる。
同時に、OpenAIはDALL-E 2とWhisper APIの一般提供を発表した。DALL-E 2はOpenAIの画像生成モデルを意味し、Whisperは同社の音声テキスト変換モデルを意味する。興味深いことに、同社は計算能力を最適化するために、APIを通じて古いモデルを廃止する計画も示している。
2024年1月4日をもって、特定の古いOpenAIのモデル、すなわちGPT-3とその亜種は段階的に廃止され、新しいGPT-3の基本モデルで代替されます。1月4日以降も古いモデルを使い続けるには、開発者は統合を手動でアップグレードし、新しいモデルへの置き換えを微調整する必要があります。
最適なユーザーエクスペリエンスを提供するというOpenAIのコミットメントの証として、同社は、微調整された旧モデルから新モデルに移行するユーザーのための包括的なサポートを約束しています。今後の計画には、旧モデルを使用している開発者への働きかけや、新モデルのテスト準備が整い次第、必要不可欠な情報を提供することなどが含まれる。
OpenAIが提供するダイナミックで絶え間なく進化するプラットフォームは、急成長するno-code 、low-code の分野でまさに注目の的となっている。これと並んで、AppMasterのようなプラットフォームもその足跡を固めつつあり、より幅広いユーザー層に向けてAIとソフトウェア開発へのアクセスを質的に民主化するイノベーションをもたらしつつある。これらのプラットフォームが持つ変革の可能性は、誰もがコードを一行も書かずにデジタル・インターフェースを構築できる未来のビジョンを加速させる。