CogVLM

激发创新，助力研究：CogVLM，强大且开源的视觉语言模型亮相

激发创新，助力研究：CogVLM，强大且开源的视觉语言模型亮相 CogVLM 是一个强大的开源视觉语言模型（VLM）。CogVLM-17B 拥有 100 亿视觉参数和 70 亿语言参数。 CogVLM-17B 在 10 个经典跨模态基准测试上取得了 SOTA 性能，包括 NoCaps、Flicker ......

模型视觉语言 CogVLM更新时间 2023-11-21

多模态-CogVLM

图文多模态方向：利用现有强大的预训练图像和语言大模型，冻结其参数并通过可训练模块建立起图像与语言模型间联系，实现对图文数据的联合处理能力。 CoGVLM 结构整个网络结构由4部分构成：视觉模型(ViT encoder), 语言模型(LLM), MLP适配器(MLP adapter)，视觉专家模块 ......

模态 CogVLM更新时间 2023-11-05

共2篇 :1/1页 首页上一页1下一页尾页

526互联

CogVLM

激发创新，助力研究：CogVLM，强大且开源的视觉语言模型亮相

多模态-CogVLM