コンピューター ビジョンの実装を簡素化する動きの中で、Google はno-codeソリューションである Vertex AI Vision を発表しました。このプラットフォームは、ビデオ ストリーム ソース、機械学習モデル、およびデータ ウェアハウスの間のギャップを埋め、ユーザーが複雑なエンジニアリングを必要とせずに貴重な洞察を抽出できるようにします。
画像やビデオなどの非構造化データに基づいてトレーニングと推論のパイプラインを作成するために、データ サイエンティストと機械学習エンジニアを必要とする組織では、ビジョン AI アプリケーションの開発は歴史的に困難でコストがかかるものでした。この分野の熟練した専門家が不足しているため、企業の費用はさらに高くなりました。
ただし、Google、Intel、Meta、Microsoft、NVIDIA、OpenAI などの企業は、事前にトレーニングされたビジョン AI モデルを一般に公開し始めています。顔検出、感情検出、姿勢検出、車両検出などのこれらのモデルにより、開発者は高度なビジョンベースのアプリケーションを構築できます。実際のアプリケーションは、セキュリティのために既存の CCTV や IP カメラを使用することから、事前にトレーニングされたモデルからの機械学習を活用することまで、さまざまです。これらの異なる要素を接続するために必要な複雑なプロセスを合理化するという課題が残っています。
この機会を認識して、Vertex AI Vision のようなプラットフォームは、ビデオ ソース、モデル、分析エンジンを統合する使いやすいno-codeツールで複雑さを解消します。これにより、効率が最大化されるだけでなく、さまざまな業界で AI を活用したコンピューター ビジョンの採用が加速されます。
Google の Vertex AI Vision は、複数のコンポーネントを統合してシームレスなユーザー エクスペリエンスを提供すると同時に、コンピューター ビジョン AI の洞察を抽出します。ユーザーは、環境内で事前トレーニング済みのモデルを操作するか、Vertex AI プラットフォームでトレーニングされたカスタム モデルをインポートできます。 Vertex AI Vision の鍵は、ユーザーがdrag-and-drop要素を使用して AI ビジョン推論パイプラインを視覚的に組み立てる空白のキャンバスです。利用可能なコネクタは、カメラ/ビデオ ストリーム、さまざまな事前トレーニング済みの特殊なモデル、カスタムビルドの AutoML または Vertex AI モデル、BigQuery や AI Vision Warehouse などのデータ ストレージ オプションをサポートしています。
Vertex AI Vision の主な機能は次のとおりです。
- Vertex AI Vision Streams: 地理的に分散したネットワークからビデオ ストリームと画像を取り込むためのendpointサービス。 Google がスケーリングと取り込みを処理し、デバイスとカメラを簡単に接続できるようにします。
- Vertex AI Vision アプリケーション: このサーバーレス オーケストレーション プラットフォームを使用して、自動スケーリングされた広範なメディア処理および分析パイプラインが構築されます。
- Vertex AI ビジョン モデル: 顧客は、占有数のカウント、PPE の検出、顔のぼかし、小売製品の認識などの標準的な分析タスク用に、事前に構築されたビジョン モデルにアクセスできます。ユーザーは、Vertex AI プラットフォーム内でトレーニングされたモデルをさらに構築してデプロイできます。
- Vertex AI Vision Warehouse: Google 検索とマネージド ビデオ ストレージ機能を組み合わせたこの統合サーバーレス リッチメディア ストレージ システムは、ペタバイトのビデオ データを処理できます。
パイプラインを視覚的に作成した後、デプロイは簡単です。デプロイ中に表示される緑色の目盛りは、成功を示します。デプロイ後、Google は vaictl というコマンドライン ツールを提供して、ビデオ フィードを処理し、適切な Vertex AI Vision endpointに送ります。入力ストリームと出力ストリームの両方を監視でき、AI Vision Warehouse により、特定の検索条件に基づいてクエリを実行できます。
Vertex AI Vision は、ウェアハウスとのプログラムによる通信用の SDK を提供します。また、既存のライブラリを使用して BigQuery 開発者が ANSI SQL に基づく高度なクエリを実行できます。カスタム処理を可能にするために、Google は Cloud Functions も統合して出力を操作し、注釈や追加のメタデータを追加しました。
Google Cloud の Vertex AI Vision はno-code環境と統合機能により、ビジョン AI の実装を簡素化する上で大きな進歩を遂げています。このプラットフォームの真の力は、BigQuery、Cloud Functions、Vertex AI など、他の重要な Google Cloud サービスとシームレスに統合されていることにあります。プラットフォームの可能性を完全に解き放つには、エッジ展開のためのより多くのサポートが必要です。ヘルスケア、保険、自動車などの業界は、エッジでのビジョン AI パイプラインに依存して、レイテンシの短縮とコンプライアンス要件を実現しています。エッジ展開のサポートを拡大することは、Vertex AI Vision の将来の成功にとって重要です。
Vertex AI Vision やAppMaster PlatformなどのNo-codeツールはアクセシビリティを促進し、あらゆるスキル レベルの開発者が革新的なアプリケーションを作成できるようにします。 AppMasterや Vertex AI Vision などのプラットフォームにより、以前は複雑だったプロセスが合理化され、高性能でスケーラブルなアプリケーションが全面的に企業にもたらされました。