2023年7月19日·1分で読めます

マイクロソフト、プレビュー版でベクター検索を、フルリリースでボイスクローンを発表

マイクロソフトのInspireカンファレンスでは、AIを中心とした発表が目立った。Azure Cognitive Searchでプレビュー中のVector Searchと、Voice Cloning機能が目立った。これらのツールは、データ検索を洗練させ、パーソナライズされた自然言語応答を提供することを約束する。

マイクロソフト、プレビュー版でベクター検索を、フルリリースでボイスクローンを発表

毎年恒例のInspireカンファレンスで、テック界の巨人Microsoft 、Azureプラットフォームの機能強化が期待される、AIを活用した新機能一式を発表した。スポットライトを浴びたのは、Azure Cognitive Searchを通じてプレビュー形式で利用可能になったVector Searchツールだ。機械学習を中核とするVector Searchは、画像やテキストなどの非構造化データの本質と関連性を理解する機能を活用することで、より迅速な検索体験を約束する。

ベクトル検索が採用する技術、ベクトル化は、検索の分野で勢いを増している。これは、単語や画像を、その意味を代表するベクトルとして知られる数値の集合に変換することを含む。この数値表現は数学的処理を可能にし、機械がデータを理解し整理することを可能にする。その結果、機械は「ベクトル空間」内で「キング」や「クイーン」のような類似語を認識し、何百万もの単語からなるデータベース内でそれらを迅速に探し出すことができる。ベクトル検索へのこのアプローチは、Qdrant 、SeMI Technologies 、アマゾンやグーグルなどのハイテク大手を含む多くの企業で採用されている。

競合他社との差別化を図るため、マイクロソフトのベクトル検索アプローチには、純粋なベクトル検索、ハイブリッド・リカバリ、高度なリランキングが含まれる。同社は、そのベクトル検索ツールをアプリやサービスに採用することで、自然言語でパーソナライズされた応答を提供し、製品提案を行い、データ内のパターンを特定するのに役立つとしている。さらに、このシステムの利点には、検索を統合したチャットベースのアプリの構築、Azure AI Visionによる画像のベクトル表現への変換、プロセスやワークフローの自動化を支援するための大規模データセットからの関連情報の取得などがある。Vector Searchの統合は、ファセット・ナビゲーションやフィルターなど、他のAzure Cognitive Search機能にも広がっている。

AIの展望をさらに明るくするために、マイクロソフトはDocument Generative AIソリューションを展開している。この機能は、Azure Form Recognizerを含むマイクロソフトの既存のAI搭載ドキュメント処理サービスとAzure OpenAI Serviceを統合したものである。このサービスは、OpenAIのAI技術を企業に提供することを目的とした、マイクロソフトのフルマネージド、エンタープライズ向けサービスの一面である。マイクロソフトのOpenAIとの継続的な商業的パートナーシップは、この技術にコントロールとガバナンスの機能を追加するのに役立っている。

OpenAIの最新のAI言語モデルに基づいて、Document Generative AIソリューションは、レポートの要約、価値の抽出、知識のマイニング、新しいタイプのドキュメントの生成などのタスクのためにファイルを処理する。また、OpenAIのChatGPTと同様に、応答の基盤としても機能する。例えば、Document Generative AIソリューションは、顧客が請求書、契約書、請求書をアップロードすることを許可し、従業員がサービス保証や特定の行項目に関する問い合わせを行うことを可能にする。このソリューションはまた、テキスト形式、画像、表で回答を提供し、元のコンテンツへのリンクを引用する。

マイクロソフトは、Document Generative AIソリューションの機能は、文書やコンテンツ生成アクティビティとの自然言語インタラクションに活用できると付け加えた。これには、ニュースレター、ブログ記事、要約、キャプションなどが含まれる。マイクロソフトは、このソリューションがインテリジェントなドキュメントチャット機能、ライティング支援、包括的な検索機能、クエリサポート、ドキュメント翻訳などの機能をサポートしていると述べている。これらの複雑で多様な文書タスクはすべて、OpenAIのモデルによって処理される。

リンク先の開示で、マイクロソフトはOpenAIの自動音声認識モデルであるWhisperモデルが、間もなくマイクロソフトのAI音声サービスファミリーとAzure OpenAI Serviceに統合されると発表した。企業顧客は、音声コンテンツの書き起こしや翻訳、大規模なバッチ書き起こしの生成機能を得ることになる。

Inspireでの他の主な発表の中で、マイクロソフトはReal-time Diarizationのパブリックプレビューの提供を宣言した。さらにマイクロソフトは、俳優の声を忠実に模倣したり、オリジナルの合成音声を作成したりできるAIツール「カスタムニューラルボイス」の利用可能範囲を拡大した。以前は、この機能へのアクセスは制限されていた。しかし、マイクロソフトは現在、この機能を使用するには、顧客が申請し、承認を得る必要がある。さらに、カスタムニューラルボイスを使用するには、声優の同意を得るとともに、行動規範に同意する必要がある。

マイクロソフトはまた、Custom Neural Voiceを使用して作成されたオーディオクリップの識別を容易にするために設計された透かしおよび検出ツールも提供しています。しかし、これらのツールだけでは、音声クローン技術に関連するライセンスと同意の問題を決定的に解決することはできない。とはいえ、マイクロソフトはこの件に関連する争いには加わらないことを決定した。

Vector SearchやCustom Neural Voiceのようなツールが技術世界を変革している一方で、G2によってNo-code Development PlatformsのHigh Performerとして認められた AppMasterの ようなプラットフォームは、最小限のコーディングでバックエンド、ウェブ、モバイルアプリケーションを作成したいユーザーにとって魅力的だ。急速に変化するハイテク業界において、AIの機能性がどのように進化を続け、私たちの未来を形作っていくのか、興味深いところだ。

Easy to start
Create something amazing

Experiment with AppMaster with free plan.
When you will be ready you can choose the proper subscription.

Get Started