grounding

【论文阅读笔记】【多模态-Referring & Grounding】 Grounded Language-Image Pre-training

GLIP CVPR 2022 (Oral, Best Paper Finalist) 读论文思考的问题 论文试图解决什么问题?写作背景是什么? 问题: 如何将视觉-语言预训练技术应用在以目标检测为代表的 fine-grained image understanding 上面? 如何在增加训练数据的同 ......

GLIP:Grounded Language-Image Pre-training

Grounded Language-Image Pre-training 目录Grounded Language-Image Pre-training简介摘要Introduction统一的损失函数方法总结参考资料 GLIPv1: Grounded Language-Image Pre-trainin ......

【论文阅读笔记】【Referring & Grounding】 Ferret: Refer and Ground Anything Anywhere at Any Granularity

读论文思考的问题 论文试图解决什么问题? referring 和 grounding 是图片空间信息理解的两大方面,而以往的模型通常只关注于其中的一个方面 能否根据人类理解图片的能力,将 referring 和 grounding 的能力统一到一个模型中? 如何联合这两个任务?它们能相互促进吗? 如 ......

多模态大模型的grounding能力

数据集 a)QW-VL:Visual Genome, RefCOCO, RefCOCO+, RefCOCOg, b)CogVLM:Visual7W,Flickr30K-Entities c)Kosmos2:GRIT OFA Unifying Architectures, Tasks, and Mod ......
模态 grounding 模型 能力

Temporally Grounding Natural Sentence in Video

Temporally Grounding Natural Sentence in Video 摘要:我们引入了一种有效且高效的方法,可以在长的、未修剪的视频序列中建立(即本地化)自然句子。 具体来说,提出了一种新颖的时间地面网络(TGN)来暂时捕获视频和句子之间不断变化的细粒度逐字交互。 TGN 基 ......
Temporally Grounding Sentence Natural Video

[论文研读]空天地一体化(SAGIN)的网络安全_A_Survey_on_Space-Air-Ground-Sea_Integrated_Network_Security_in_6G

** 恢复内容开始 ** ## 空天地一体化(SAGIN)的网络安全 **目前关注的方面:** 集中在安全通信、入侵检测、侧通道攻击、GPS欺骗攻击、网络窃听、消息修改/注入等方面,有些侧重于分析现有的安全威胁[20]、[21],有些提出了他们的攻击方法[14]、[22],还有一些则更多地侧重于SA ......

论文阅读笔记《Stochastic Grounded Action Transformation for Robot Learning in Simulation》

Stochastic Grounded Action Transformation for Robot Learning in Simulation 发表于IROS 2020(CCF C) 模拟中机器人学习的随机接地动作转换 Desai S, Karnan H, Hanna J P, et al. ......

论文阅读笔记《Grounded Action Transformation for Robot Learning in Simulation》

Grounded Action Transformation for Robot Learning in Simulation 发表于AAAI 2017 仿真机器人学习中的接地动作变换 Hanna J, Stone P. Grounded action transformation for robo ......

meta seg_anything and grounding_dino

https://github.com/IDEA-Research/GroundingDINO https://github.com/facebookresearch/segment-anything ......
共9篇  :1/1页 首页上一页1下一页尾页