Language-Guided

CLIP-S^4:Language-Guided Self-Supervised Semantic Segmentation论文阅读笔记

## 摘要 作者提出了CLIP-S4,借助自监督像素表示学习和V-L模型实现各种语义分割任务,不需要使用任何像素级别标注以及未知类的信息。作者首先通过对图像的不同增强视角进行像素-分割对比学习来学习像素嵌入。之后,为进一步改善像素嵌入并实现基于自然语言的语义分割,作者设计了由V-L模型指导的嵌入一致 ......
共1篇  :1/1页 首页上一页1下一页尾页