模态blip里程碑 论文

SHARPNESS-AWARE MINIMIZATION FOR EFFICIENTLY IMPROVING GENERALIZATION论文阅读笔记

Intro 在训练集上最小化损失很可能导致泛化性低,因为当今模型的过参数化会导致training loss的landscape异常复杂且非凸,包含很多local/global minima,因此优化器的选择至关重要。loss landscape的几何性质(特别是minima的flatness)与泛化 ......

人类记忆应该是有损压缩还是无损压缩?人类记忆应该是单模态的还是多模态的?

今日胡想,两个问题 —— 人类记忆应该是有损压缩还是无损压缩?人类记忆应该是单模态的还是多模态的? ......
模态 人类 记忆 还是

美国财团是如何控制美国教育界的 —— 哈佛史上最短任期!53岁女校长宣布辞职,博士论文被指抄袭

相关: 哈佛史上最短任期!53岁女校长宣布辞职,博士论文被指抄袭 ......
教育界 财团 任期 校长 博士

[论文阅读] Self-conditioned Image Generation via Generating Representations

Pre title: Self-conditioned Image Generation via Generating Representations accepted: arXiv 2023 paper: https://arxiv.org/abs/2312.03701 code: https:/ ......

Learning Dynamic Query Combinations for Transformer-based Object** Detection and Segmentation论文阅读笔记

Motivation & Intro 基于DETR的目标检测范式(语义分割的Maskformer也与之相似)通常会用到一系列固定的query,这些query是图像中目标对象位置和语义的全局先验。如果能够根据图像的语义信息调整query,就可以捕捉特定场景中物体位置和类别的分布。例如,当高级语义显示图 ......

使用CLIP和LLM构建多模态RAG系统

使用CLIP和LLM构建多模态RAG系统 在本文中我们将探讨使用开源大型语言多模态模型(Large Language Multi-Modal)构建检索增强生成(RAG)系统。本文的重点是在不依赖LangChain或LLlama index的情况下实现这一目标,这样可以避免更多的框架依赖。 什么是RA ......
模态 系统 CLIP LLM RAG

论文写作方法

公式居中编号靠右 https://www.bilibili.com/video/BV1Xd4y1Z7Xi/?spm_id_from=333.337.search-card.all.click&vd_source=f0c0211a242fdec2b56aa48b9d63c70e 公式编辑器:matht ......
论文写作 方法 论文

多模态大模型少样本自适应综述

前言 在医学成像和遥感等一些细粒度领域,多模态基础模型的性能往往不尽人意。因此,许多研究者开始探索这些模型的少样本适应方法,逐渐衍生出三种主要技术途径:1)基于提示的方法;2)基于适配器的方法;3)基于外部知识的方法。尽管如此,这一迅速发展的领域产生了大量结果,但尚无全面的综述来系统地整理研究进展。 ......
模态 样本 模型

【略读论文|大模型相关】Zero-Shot Relational Learning on Temporal Knowledge Graphs with Large Language Models

时间:2023 学校:慕尼黑大学 创新点: 1.据我们所知,这是第一个试图在TKGF背景下研究零射击关系学习的工作。 2.我们设计了一种基于llm的方法zrLLM,并设法在零射击关系推理中增强各种基于嵌入的TKGF模型。 3.实验结果表明,zrLLM有助于大大提高所有考虑的TKGF模型对包含未见零射 ......

CHATGPT4革新登场:人工智能新里程碑

CHATGPT4是最新一代的人工智能语言模型,相较于前辈模型如CHATGPT3,它在多个维度上都有显著提升。CHATGPT4拥有更强大的理解和生成语言的能力,可以处理更复杂的对话和文本任务。其训练数据量巨大,覆盖面广,使得模型能够更好地理解和生成各种语言风格和主题的内容。 此外,CHATGPT4在多 ......

机器学习周刊 第4期:动手实战人工智能、计算机科学热门论文、免费的基于ChatGPT API的安卓端语音助手、每日数学、检索增强 (RAG) 生成技术综述

LLM开发者必读论文:检索增强(RAG)生成技术综述! 目录: 1、动手实战人工智能 Hands-on Al 2、huggingface的NLP、深度强化学习、语音课 3、Awesome Jupyter 4、计算机科学热门论文 5、LLM开发者必读论文:检索增强 (RAG) 生成技术综述 6、App ......
人工智能 实战 人工 语音 助手

机器学习周刊03:如何学习深度学习?2024 年学习生成式 AI 路线图、如何构建高效的RAG系统、苹果 腾讯最新论文、阿里DreaMoving

腾讯推出的 AppAgent,是一个多模态智能体,通过识别当前手机的界面和用户指令直接操作手机界面,能像真实用户一样操作手机! 机器学习周刊:关注Python、机器学习、深度学习、大模型等硬核技术 1、如何学习深度学习? 最近X上有推友重提这篇文章,是网友看过 Jeremy 教授的 fast.ai ......
路线图 DreaMoving 深度 周刊 路线

设置 QMainWindow 窗口为模态

QDialog 因为有 exec() 函数为阻塞式的可以让 QDialog 成为模态的界面,但是 QMainWindow 创建的对象窗口只能使用 show() 来进行显示,无法直接让以 QMainWindow 的对象实现模态的效果。 如果要使 QMainWindow 的实例化对象能够实现模态的效果, ......
模态 QMainWindow

ICLR 2022: Anomaly Transformer论文阅读笔记+代码复现

本论文全名为Anomaly Transformer: Time Series Anomaly Detection with Association Descrepancy(通过关联差异进行时序异常检测),主要提出了一种无监督的异常点检测算法,并在6个benchmarks上测试,获取良好结果。 论文链 ......
Transformer Anomaly 代码 笔记 论文

​Github揽获3k+星!清华开源CogAgent:基于多模态大模型的GUI Agent

前言 本文提出了视觉 GUI Agent,使用视觉模态(而非文本)对 GUI 界面进行更全面直接的感知,从而做出规划和决策。对此,我们研发了多模态大模型 CogAgent,可接受 1120×1120 的高分辨率图像输入,不仅提升了通用视觉理解能力,还具备强大的 GUI Agent 能力。 本文转载自 ......
模态 CogAgent 模型 Github Agent

NeurIPS 2023 | 腾讯 AI Lab 18 篇入选论文解读

前言 NeurIPS 2023(Neural Information Processing Systems)神经信息处理系统大会是当前全球最负盛名的 AI 学术会议之一,将于 12 月 10 日在美国新奥尔良召开。官方信息显示,本届会议共有 12343 篇有效论文投稿,接收率为 26.1%,略高于 ......
NeurIPS 论文 2023 Lab 18

数控系统中的模态指令

一、模态指令概述 在数控加工中,模态指令是控制加工过程中各项参数设置的指令。这些指令会影响加工状态,直到被新的指令覆盖或取消为止。模态指令相对于非模态指令,具有较高的优先级和较长的持续时间,在加工过程中起到了关键的作用。 二、常见的模态指令 1. G指令 G指令是数控系统中最重要的模态指令之一。G指 ......
模态 数控系统 指令 数控 系统

ChatGPT论文降重Prompt

你是一个已经阅读过大量论文的论文写作专家。我正在设计一个基于xxx系统。接下来,我将给你一个论文段落,你可以使用调整句子用词、句子结构等方法,重新描述这段话,对文章的内容进行润色,使之更加接近论文的写作风格。你也可以自己增添一些描述和内容。 ......
ChatGPT Prompt 论文

大模型评测-微软亚洲研究院:A Survey on Evaluation of Large Language Models论文分享

《A Survey on Evaluation of Large Language Models》 一、论文介绍:微软亚洲研究院公开了介绍大模型评测领域的论文《A Survey on Evaluation of Large Language Models》。该论文一共调研了219篇文献,以评测内容 ......
Evaluation 研究院 Language 模型 Survey

论文精读—多智能体算法在无人机集群的运用

导:“在阅读一篇论文后,要对这几个方面有清晰的认识,动机、创新点和实验设计,外加自己对这篇论文有什么想法” 论文解读:本文组织如下:第二节介绍了相关工作,第三节介绍了大规模搜索场景和系统模型,第四节详细介绍了基于marl的无人机群搜索方法,第五节讨论了仿真设置和实验结果,第六节总结了本文。 建模思考 ......
无人机 集群 算法 智能 论文

AAAI 2024 | 腾讯优图实验室27篇论文入选,含表格结构识别、异常图像生成、医学图像分割等研究方向

前言 AAAI 2024 (AAAI Conference on Artificial Intelligence) 人工智能国际会议于近日公布论文录用结果,本届会议共收到9862篇份论文投稿,最终录用2342篇论文,录用率23.75%。AAAI 是美国人工智能协会主办的年会,同时也是是人工智能领域中 ......
图像 研究方向 表格 实验室 方向

大模型被偷家!腾讯港中文新研究修正认知:CNN搞多模态不弱于Transfromer

前言 在Transformer占据多模态工具半壁江山的时代,大核CNN又“杀了回来”,成为了一匹新的黑马。腾讯AI实验室与港中文联合团队提出了一种新的CNN架构,图像识别精度和速度都超过了Transformer架构模型。切换到点云、音频、视频等其他模态,也无需改变模型结构,简单预处理即可接近甚至超越 ......
模态 Transfromer 模型 CNN

三分钟学完科研论文常用统计图

统计分析的结果通常包括统计图和统计表。统计图是一种用图形表示数据的方式,它能够直观地展示数据的分布、趋势和关系。科研论文中常见的统计图包括条形图、饼图、折线图、散点图等。这些图形可以帮助人们快速地理解和分析数据,找出其中的规律和特征。今天就来讲一讲常用的科研统计图。 一、统计图结构 统计图一般包括5 ......
科研论文 科研 常用 论文

[Winform]在Form里显示模态对话框ModalDialog

在Form里显示模态Dialog 问题 如何在WinForm的一个Form里面弹出一个模态Dialog? 背景 程序的框架是Winform,只有一个窗口MainForm。MainForm里面是一个TabControl,每个TabPage是一个Form,每个TabPage的Form相互独立,互不干扰, ......
模态 对话框 ModalDialog Winform Form

移动端手写板 + 模态框 + 弹框,前端监听移动端返回按钮

今天的需求是把全屏的手写板改为同一个页面只占半屏的手写板,本来用的iframe,后面发现笔触和屏幕按下的位置不一样,然后用了jQuery的$.load(),发现用$.load会导致文件中的js不执行,后面还是重新开始,在同文件重新写了一个canvas手写板,然后发现了,canvas在全屏的时候没问题 ......
模态 手写板 前端 按钮

论文笔记:全同态加密研究进展-白利芳等

论文笔记:全同态加密研究进展-白利芳等 同态加密–概念 同态性 给定2个代数结构间的映射,**$ \delta: A \to B\(,满足\)\delta(x _A y)=\delta(x) _B \delta(y)\(**,这里这种映射\)\delta \(就可以看作是同态加密中的“加密”操作,即 ......
研究进展 笔记 论文

GPT-1论文《Improving Language Understanding by Generative Pre-Training》解读

背景 GPT-1 采用了两阶段训练的方式: 1. 第一阶段 pre-training,在海量文本上训练,无需label,根据前k-1个词预测第k个单词是什么,第一阶段的训练让模型拥有了很多的先验知识,模型具有非常强的泛化性 2. 第二阶段在特定任务上fine-tuning,让模型能适应不同的任务,提 ......

大模型涉及到的比较经典的论文

大模型涉及到的比较经典的论文: 2014 Neural Machine Translation by Jointly Learning to Align and Translate - This paper introduces an attention mechanism in RNNs to i ......
模型 经典 论文

【论文精读#1】SPGAN-DA:用于领域自适应遥感图像语义分割的语义保留生成对抗网络

作者: Yansheng Li 发表年代: 2023 使用的方法: 无监督领域自适应(UDA)、GAN、ClassMix、边界增强 来源: IEEE TGRS 方向: 语义分割 期刊层次: CCF B;工程技术1区;IF 8.2 文献链接: https://doi.org/10.1109/TGRS. ......
语义 遥感 SPGAN-DA 图像 领域

论文推荐:大型语言模型能自我解释吗?

这篇论文的研究主要贡献是对LLM生成解释的优缺点进行了调查。详细介绍了两种方法,一种是做出预测,然后解释它,另一种是产生解释,然后用它来做出预测。 最近的研究发现,即使LLM是在特定数据上训练的,也不能认识到训练的知识与推理上下文之间的联系。 因此一些人认为之为“X链”的方法非常重要。因为要求LLM ......
模型 语言 论文
共930篇  :1/31页 首页上一页1下一页尾页