最近、テクノロジー大手のGoogle新たに発表したマルチモーダル AI モデル Gemini に関連する一連の革新的なアップデートを明らかにしました。これは、開発者の創造的な作業を強化することを約束するこの最先端のテクノロジーを発表してからわずか 1 週間後に行われました。
Google は、Gemini の発表時に、Ultra、Pro、Nano の 3 つの異なるバージョンが利用可能であることを強調しました。これらは、さまざまなサイズと複雑さの要件に応じて調整されます。注目すべきことに、Gemini Nano はすでに Pixel 8 Pro で Android に組み込まれています。さらに、Google Bard は Gemini Pro の適応バージョンの恩恵を受けるようになりました。
Google新たな境地を開拓し、開発者が Gemini API を通じて Gemini Pro が提供する幅広い機能にアクセスできることを発表しました。開発者は、関数呼び出し、埋め込み、セマンティック検索、カスタム知識の基礎付け、およびチャット機能を使用できます。
開発者は、Gemini Pro を使用する 2 つの主な方法、Google AI Studio と Google Cloud 上の Vertex AI についても紹介します。 Google AI Studio は簡単な開始点として考えられており、Web ベースの開発ツール、1 分あたり 60 リクエストの無料割り当て、開発者がモデルに簡単に慣れるためのクイックスタート テンプレートを提供します。
より洗練されたオプションとして宣伝されている、Google Cloud 上の Google の Vertex AI は、Gemini を完全にカスタマイズできる機械学習プラットフォームです。完全なデータ制御や他の Google Cloud モジュールとの統合など、その他の実用的な機能が満載されているため、開発者はセキュリティ、安全性、プライバシー、ガバナンスのニーズに準拠できます。
現在、Vertex AI 内での Gemini の使用は、Google AI Studio の無料割り当てと同じ料金内で無料です。それにもかかわらず、この規定は、翌年に予定されている一般提供が開始されるまでのみ延長されます。それ以降の料金は、1000 文字あたり 0.00025 ドル、画像 1 枚につき 0.0025 ドルとなります。
Google は、企業データを使用して Gemini を強化し、 AppMasterなどの強力なプラットフォームと同様のlow-code環境で検索および会話エージェントを開発する機能など、Vertex AI 環境の高度な機能について詳しく説明しています。
現在、Gemini Pro はテキストを受信して出力します。ただし、画像を試したい開発者のために、専用の Gemini Pro Vision endpointテキストと一緒に画像を受け入れ、テキストを出力します。
Google は、来年初めに Gemini Ultra を発売するとの予測でさらに期待を高めています。これは、より複雑なタスクを対象とした大規模なモデルです。 Google は、Gemini を Chrome および Firebase 開発者プラットフォームと統合することも検討しています。
本日は、テクノロジー大手の画像生成モデル Imagen 2 のアップグレード バージョンも発表されました。これは現在、Google の許可リストに含まれているすべての Vertex AI ユーザーに公開されています。
Imagen のこの高度な反復により、自然言語プロンプトによって操作される、美しく魅力的で高品質で現実に近い画像の生成が可能になります。その魅力的な新機能は、画像上にテキスト オーバーレイを作成するテキスト レンダリング、ロゴの生成、キャプション生成のための視覚的な質問と回答で構成されます。