VentureBeat 2023/8/1 06:13:41(JST)
GoogleのDeepmindは、特定のトレーニングなしでロボットに新しいタスクを実行させることができる画像と言語を組み合わせたモデル「Robotics Transformer 2(RT-2)」を発表しました。RT-2は、ウェブのテキストと画像を使用して、現実世界の概念を理解し、ロボットのアクションのための一般化された指示に変換することができます。この技術の改善により、現在よりもはるかに少ないトレーニングで、状況に応じて異なるタスクを実行できるコンテキストに敏感な適応型ロボットが実現できる可能性があります。”
“RT-2は、以前のモデルであるRT-1とは異なり、ロボットを動作させるために何十万ものデータポイントを必要としません。RT-2は、少量のロボットデータから学習し、基礎モデルで見られる複雑な推論を実行し、以前に見たこともトレーニングもされていないタスクに対しても知識を転送することができます。RT-2は、新しいコマンドの解釈やユーザーのコマンドに対する応答など、物体のカテゴリーや高レベルの説明についての推論など、ロボットデータに限定されない一般化能力と意味理解能力を示しています。”
“RT-2の進化により、倉庫で同じ作業を繰り返すロボットではなく、物体の種類、重さ、壊れやすさなどの要素を考慮して、異なるアプローチで各物体を処理できるコンテキストに敏感なロボットが実現できる可能性があります。AI駆動のロボット市場は、2021年の69億ドルから2026年には353億ドルに成長すると予測されています。”
(※本記事はAIによって自動的に要約されています。正確な情報は引用元の記事をご覧ください。)
(※画像はAIによって自動で生成されており、引用元とは関係ありません。)
引用元の記事:Deepmind unveils RT-2, a new AI that makes robots smarter.