Open-World

Open-World Object Manipulation using Pre-trained Vision-Language Models

概述提出MOO: Manipulation of Open-World Objects 用预训练的VLM在图像中标记instruction的object的坐标，传入policy进行控制，可以zero-shot泛化到novel object，还支持手指、点击输入指令。问题机器人泛化到训练中没有见 ......

Vision-Language Manipulation Pre-trained Open-World Language更新时间 2023-12-17

共1篇 :1/1页 首页上一页1下一页尾页

526互联

Open-World

Open-World Object Manipulation using Pre-trained Vision-Language Models