质变

Meta-Transformer:1个框架理解12种模态引发的质变与涌现(已开源)

前言 近日,香港中文大学多媒体实验室(CUHK MMLab)联合上海人工智能实验室的OpenGVLAB研究团队提出一个统一多模态学习框架 Meta-Transformer,实现骨干网络的大一统,具有一个模态共享编码器,并且无需配对数据,即可理解 12 种模态信息, 并提供了多模态无边界融合的新范式。 ......
共1篇  :1/1页 首页上一页1下一页尾页