2023年12月07日·1分で読めます

Gemini の紹介: Google の洗練されたマルチモーダル AI モデル

Google は、先進的な AI モデル Gemini を発表しました。このモデルは、テキスト、コード、オーディオ、画像、ビデオなどのさまざまな形式のデータを理解できます。

Gemini の紹介: Google の洗練されたマルチモーダル AI モデル

人工知能分野の飛躍のために、 Google最新の AI モデルである Gemini を導入しました。この革新的なモデルは、従来のモデルとは異なり、テキスト、コード、オーディオ、画像、ビデオなどの異種データ形式を最初から解釈できます。

通常、マルチモーダル モデルは、さまざまな情報形式に合わせてさまざまなコンポーネントを個別にトレーニングし、それらを統合することによって開発されます。それにもかかわらず、ジェミニはこの標準的な慣行から逸脱して、異なるアプローチを活用します。モデルは最初からさまざまなデータ形式でトレーニングされ、追加のマルチモーダル データで微調整されました。この方法論により、Gemini は複数のデータ型を理解し、推論することが容易になり、現在のマルチモーダル モデルよりも優れたパフォーマンスを発揮します。 Googleおよび Alphabet の CEO であるSundar Pichaiと、Google DeepMind の CEO 兼共同創設者であるDemis Hassabisは、Gemini の強みを強調し、このモデルの能力はほぼすべての分野で最高のものと同等であると共有しました。

驚くべきことに、ジェミニは強力な推論能力を備えており、複雑な文字情報や視覚情報を認識することができます。このおかげで、膨大なデータプールから見つけにくい知識を抽出することに長けています。この唯一の例は、多くの分野でブレークスルーにつながる貴重な洞察を得るために、数十万の文書をふるいにかけられる能力です。さらに、双子座の多様な側面により、数学や物理学などの科目の複雑な問題を解読するのに特に効果的です。

初期の Gemini 1.0 には、Ultra、Pro、Nano の 3 つのバージョンがあり、それぞれ異なるサイズ要件に対応しています。 Googleによると、Gemini Ultra は、予備的なベンチマークにおいて、モデル開発および研究において一般的に使用される 32 の学術ベンチマークのうち 30 を上回りました。注目すべきことに、Gemini Ultra は人間の専門家を上回った史上初のモデルでもあります。これは、数学や物理学から歴史、法律、医学、倫理に至るまでの 57 分野を網羅する大規模マルチタスク言語理解 (MMLU) を使用して評価されました。

Gemini Pro は Bard と統合され、リリース以来最も大幅な Bard アップデートを実現しました。 Pixel 8 Pro は、Gemini Nano の機能を利用して、レコーダー アプリの要約やGoogleのキーボードのスマート リプライなどの機能を強化するように最適化されていることも注目に値します。

今後数か月間で、Gemini は検索、広告、Chrome、Duet AI などのさらに多くの Google 製品に組み込まれる予定です。 12 月 13 日より、開発者は Google AI Studio または Google Cloud Vortex AI の Gemini API を介して Gemini Pro へのアクセスが許可されます。

これに加えて、Gemini は、Python、Java、C++、Go など、いくつかの普及しているプログラミング言語を理解することができます。 Pichai 氏と Hassabis 氏によると、Gemini の健全な言語能力と複雑な情報に関する推論能力により、Gemini は世界中でトップクラスのコーディング基礎モデルとなっています。

Googleまた、Gemini を採用して、AlphaCode 2 として知られる高度なコード生成システムを設計しました。このシステムは、2 年前にリリースされた最初のバージョンのアップグレードであり、複雑な数学と理論的なコンピューター サイエンスを含む競技プログラミングの問題に取り組むことができます。

一連の発表に加えて、最先端の AI モデルをトレーニングするために設計された Cloud TPU v5p という名前の新しい TPU システムが発表され、Gemini の発売をさらに補完します。この次世代 TPU は Gemini の開発を促進し、開発者や企業クライアントが大規模な生成 AI モデルをより迅速にトレーニングできるように支援します。これにより、より短い期間で新しいサービスと機能が確実に顧客に届けられるようになります。

Google Gemini の開発中、責任ある AI 原則の順守を強調しました。サイバー攻撃、説得、自律性などの潜在的なリスク分野の研究を実施しました。暴力や否定的な固定概念を含むコンテンツを識別、ラベル付け、分離するために、安全性分類子も作成されました。

Gemini の発売は、AI の進化における重要なマイルストーンを意味し、 Googleの新時代の始まりとなります。 Gemini の機能を将来のバージョンに拡張する取り組みが現在進行中であるため、計画とメモリの進歩が改善され、より多くの情報を処理するためのコンテキスト ウィンドウが増加するため、将来的にはより良い応答が期待されます。

no-codeおよびlow-code領域が広がるにつれ、 AppMaster のようなプラットフォームにより、開発者やビジネス プロフェッショナルは、Gemini のような AI の進歩を補うスケーラブルで強力なアプリケーションを構築できるようになります。印象的な機能リストを宣伝するAppMaster 、急速に進化するアプリ開発環境において多用途でコスト効率の高いソリューションとして際立っています。

Easy to start
Create something amazing

Experiment with AppMaster with free plan.
When you will be ready you can choose the proper subscription.

Get Started