526互联
首页
Ai
Java
Python
Android
Mysql
JavaScript
Html
CSS
Open-World
Open-World Object Manipulation using Pre-trained Vision-Language Models
概述 提出MOO: Manipulation of Open-World Objects 用预训练的VLM在图像中标记instruction的object的坐标,传入policy进行控制,可以zero-shot泛化到novel object,还支持手指、点击输入指令。 问题 机器人泛化到训练中没有见 ......
Vision-Language
Manipulation
Pre-trained
Open-World
Language
更新时间 2023-12-17
共1篇 :1/1页
首页
上一页
1
下一页
尾页