多言語のグローバル社会の便宜を図るべく、テクノロジー大国メタ社は言語翻訳プロセスに革命を起こす道を切り開きました。同社は、画期的な多言語およびマルチタスク モデルである最新の発案である SeamlessM4T を発表しました。この革新的なモデルは、複数の言語にまたがり、テキストと音声の両方を組み込んだ、より調和のとれた翻訳手段を提供する準備が整っています。
インターネット、モバイル テクノロジー、ソーシャル メディア、多様な通信プラットフォームの普及によって可能になった、地球規模で絡み合う社会の中で、さまざまな言語でのコンテンツへのアクセスのしやすさは急激に増加しています。このような相互接続された環境では、あらゆる言語で情報を伝達し、理解する能力が重要になります。このような偉業を達成する能力は、かつては SF の中だけで受け入れられていた概念でしたが、今日では AI が限界を押し広げ、そのようなビジョンを技術的な現実に変えつつある、というのがメタの立場で、最近のブログ投稿で表明されました。
SeamlessM4T をイノベーションの舵取りとして、Meta は自動音声認識のサポートを提供し、音声からテキストへの翻訳、およびテキストからテキストへの翻訳の橋渡しを 100 近くの言語で提供してきました。さらに、このプラットフォームは音声から音声への翻訳やテキストから音声への翻訳にも手を出しており、約 100 の入力言語と 35 の出力言語をカバーしています。
共同研究の進歩の精神に基づき、このプロジェクトはライセンス CC BY-NC 4.0 の下で公開され、研究者にその基礎を構築する機会を与えました。
SeamlessM4T の発売に便乗して、Meta は、270,000 時間もの音声とテキストのアラインメントを含むマルチモーダル翻訳用のデータセットである SeamlessAlign も公開しました。
メタ氏の言葉を借りれば、既存の音声合成プログラムや音声合成プログラムは、世界の膨大な言語に対応する上でほんの表面をなぞっただけであることが観察されています。この斬新なプロジェクトの導入は、拡大された言語プールに対応する方向への大幅な移行を告げるものです。
この進歩的な移行は、No Language Left Behind、Universal Speech Translator、SpeechMatrix、Massively Multilingual Speech などのこれまでの画期的な取り組みに続く、この分野における Meta の継続的な取り組みにおける最新のマイルストーンです。
責任あるテクノロジー大手として期待されるとおり、Meta は、Responsible AI の 5 つの柱に従って、モデルの責任ある開発を確実にするために取られた入念な手順についての洞察を共有しました。モデル内の潜在的な感受性を深く理解し、軽減するために、毒性とバイアスの研究、モデルのジェンダーバイアス評価などの取り組みが組み込まれています。
安心・安全の強化に私たちは絶え間なく取り組んでいます。私たちは研究を強化し、SeamlessM4T を継続的に改良するための措置を導入するよう粘り強く努力し、同時にモデルで確認された毒性の発生を最小限に抑えるよう努力しています (メタの声)。
no-codeおよびlow-codeプラットフォームが繁栄するにつれて、言語の壁をシームレスかつ効率的に打ち破ることは重要なステップです。 AppMasterから他のプラットフォームに至るまで、多言語サポートの重視はますます高まる傾向であり、今後ますます高まっていくことが予想されます。