スピーキングロボット：私たちの新しいAIモデルは、視覚と言語をロボットの動作に翻訳します。

Google 2023/7/28 18:00:00(JST)

ロボットは長い間、人々が遠い未来を想像する際に常に主役として登場してきました。しかし、その技術は科学小説の領域にとどまり、実現されることはありませんでした。しかし、今日、ロボットの未来に近づく新しい進歩が紹介されました。Robotics Transformer 2（RT-2）は、テキストと画像から学習したTransformerベースのモデルで、ロボットのアクションを直接出力することができます。つまり、RT-2はロボットの言葉を話すことができます。”

“従来のロボット学習の課題は、複雑で抽象的なタスクを未知の環境で処理する能力が必要であり、これまでに見たことのない状況にも対応できることです。RT-2は、ウェブデータから知識を転送し、ロボットの行動に反映させることができます。これにより、ロボットは少量のトレーニングデータで新しいタスクに対応できるようになります。”

“RT-2の情報転送能力は、ロボットが新しい状況や環境に迅速に適応する可能性を示しています。RT-2のテストでは、トレーニングデータのタスクにおいては以前のモデルと同等の性能を発揮し、未知のシナリオではRT-1の32％から62％に性能を向上させました。RT-2は、学習した概念を新しい状況に転用することができるため、より一般的な目的のロボットに大きな可能性を示しています。”

(※本記事はAIによって自動的に要約されています。正確な情報は引用元の記事をご覧ください。)
(※画像はAIによって自動で生成されており、引用元とは関係ありません。)
引用元の記事：Speaking robot: Our new AI model translates vision and language into robotic actions.