Instruction-Following

Instruction-Following Agents with Multimodal Transformer

概述 提出了InstructRL,包含一个multimodal transformer用来将视觉obs和语言的instruction进行编码,以及一个transformer-based policy,可以基于编码的表示来输出actions。 前者在1M的image-text对和NL的text上进行训 ......
共1篇  :1/1页 首页上一页1下一页尾页