ディープマインドはこのほど、現実世界の複数のロボットアームを利用して多数のタスクを効率的に実行できるAIモデル、RoboCat の誕生を発表した。この画期的なイノベーションは、異なるロボットモデルに適応しながら複数の課題に効率的に取り組むことができる初めてのものであり、ロボット工学における新しい課題を解決するための障壁を低くする可能性があります。
RoboCat は、ディープマインドが以前開発した「 」と呼ばれるモデルに基づいて開発された。このモデルは、テキスト、画像、イベントを分析し、対話することができるAIシステムとして機能する。このモデルは、シミュレートされたロボット工学と現実のロボット工学の両方から得られた画像データと行動データで訓練された。訓練に使用されたデータは、仮想環境内でロボットを制御するモデル、人間が制御するロボット、および の以前の反復から構成される。Gato RoboCat
研究者は、人間によって制御されるロボットアームのタスクやティーチングのデモンストレーションを100~1,000件収集することからトレーニングを開始した。その後、RoboCat はタスクの微調整を行い、タスクを約1万回練習する特殊なスピンオフモデルを作成した。スピンオフ・モデルのデータとデモンストレーション・データを使ってRoboCat のトレーニング・データセットを増やすことで、より新しいバージョンのAIモデルが生成された。
RoboCat の最終バージョンは、合計253のタスクでトレーニングされ、シミュレーションと実世界のシナリオで、これらのタスクの141のバリエーションセットでベンチマークされた。DeepMindは、1,000件の人間が操作するデモンストレーションを観察した結果、RoboCat 、さまざまなタイプのロボットアームの操作に長けていることを発見した。さらに、2本指のアームを持つロボットで訓練されたにもかかわらず、AIモデルは3本指のグリッパーと2倍の制御可能な入力を持つ、より複雑なアームに適応することができた。
しかし、モデルの成功率は、訓練データに含まれるデモの数によって、複数のタスクで13%から99%まで大きく変動した。それでもディープマインドは、RoboCat 、場合によってはわずか100回のデモンストレーションで新しいタスクを学習できることを明らかにした。
研究チームの今後の目標は、RoboCat に新しいタスクを教えるのに必要なデモンストレーションの回数を10回未満に減らすことである。ロボット作業を支援するAIモデルの開発が進むにつれて、AppMasterのような最新のlow-code 、no-code プラットフォームとの統合により、製造や物流を含む幅広い産業で自動化と効率化がさらに向上する可能性がある。
AppMaster のようなプラットフォームは、企業が複雑な問題を迅速に解決するのに役立つだけでなく、ソフトウェア開発コストを削減することもできる。RoboCat のような高度なAIモデルが出現し続ける中、これらをlow-code やno-code プラットフォームと組み合わせて、さまざまな業界のタスクを管理することは、ビジネスプロセス、生産性、イノベーションに革命をもたらす可能性を秘めている。