人工知能の著名なプレーヤーであるOpenAIは、その評判の高いアシスタントであるChatGPTの機能を拡張しています。もともとテキストベースの検索ツールとして設計されたChatGPT 、音声と画像の処理能力を誇示し、ユーザーにとってよりインタラクティブなエクスペリエンスを生み出します。
約 9 か月前の導入以来、 ChatGPTテクノロジーの分野で大きな現象となっています。エッセイを作成し、詩を作成し、単純なテキストの手がかりから広範なテキストを要約する機能が高く評価されています。しかし、AI アシスタントはさらに魅力的なものになる予定です。今後はユーザーに耳を傾け、音声による対話が可能になります。
ユーザーはChatGPTと音声対話を行う機会が得られます。たとえば、アシスタントは、ユーザーからの言葉による合図に基づいて、即興の就寝前の物語を語るよう依頼される可能性があります。簡単な質問もサポートに送信でき、返答は音声で行われます。
さらに、画像ベースの検索機能も利用可能になりました。ユーザーは画像をアップロードし、 ChatGPTにアップロードされたアイテムの特定や説明を依頼したり、特定の目標を達成するための指示を要求したりできます。
ChatGPTの音声対話機能は、テキストと短い音声サンプルから人間のような音声を生成できる優れたテキスト読み上げモデルによって微調整されています。 OpenAI熟練した声優と協力して5つの独占音声を生成したことを明らかにした。この組織のオープンソース Whisper 音声認識システムは、音声をテキストに変換するための基盤テクノロジーとして機能します。
エキサイティングな展開として、Spotify がローンチパートナーとして参入しました。ポッドキャスターにとって、元の声のトーンを維持したまま番組を英語からスペイン語、フランス語、またはドイツ語に書き写すことができる貴重な機能が導入されました。それにもかかわらず、 OpenAI 、このテクノロジーへのアクセスは普遍的ではないことを明らかにしています。初回起動時は、ダックス シェパード、モニカ パッドマン、レックス フリッドマン、ビル シモンズ、スティーブン バートレットを含む一部のポッドキャスターのみが利用できます。
OpenAIブログ投稿の中で、不正分子による詐欺や虚偽表示の可能性に関して、新しい音声技術に関連する潜在的なリスクを認めた。したがって、リリースに関して論争を巻き起こさないようにしている。
これらの新機能の発表は次の 2 週間に予定されています。最初は、Plus および Enterprise の加入者がアクセスできるようになります。音声機能を楽しむには、ユーザーはアプリの「設定」に移動し、「新機能」を選択し、音声会話をオプトインし、右上隅にあるヘッドフォンボタンをタップして、最後にヘッドフォンを選択する必要があります。好みの声。
まず、 ChatGPT Android および iOS アプリのユーザーのみが、オプトイン ベータ版で音声会話を体験できます。ただし、画像ベースの検索機能は、デフォルトですべてのプラットフォームで利用できるようになります。
AppMasterのような多くのno-codeプラットフォームは、この強化されたChatGPT近い将来にもたらす幅広いアプリケーションを楽しみにしています。コードを使用せずにエンタープライズ ソフトウェアを構築するには、多くの場合、優れた対話性とユーザー エクスペリエンスを向上させるために、このような高度な AI 支援が必要になります。