经典 论文vit

大模型涉及到的比较经典的论文

大模型涉及到的比较经典的论文: 2014 Neural Machine Translation by Jointly Learning to Align and Translate - This paper introduces an attention mechanism in RNNs to i ......
模型 经典 论文

南阳卧龙岗100副经典楹联、匾额

南阳卧龙岗100副经典楹联、匾额,文化含金量奇高! 2020-07-15 17:32 南阳卧龙岗,有座“鲤鱼跳龙门”大型砖雕照壁 1.千古人龙(大门外石坊) 注:人龙:人中龙,比喻出类拔萃,有重大影响的人物。此指诸葛亮。 清道光十二年(1832年)南阳县典史王清亮书。 释义:诸葛亮是永垂千古的人类的 ......
匾额 楹联 经典 100

【论文精读#1】SPGAN-DA:用于领域自适应遥感图像语义分割的语义保留生成对抗网络

作者: Yansheng Li 发表年代: 2023 使用的方法: 无监督领域自适应(UDA)、GAN、ClassMix、边界增强 来源: IEEE TGRS 方向: 语义分割 期刊层次: CCF B;工程技术1区;IF 8.2 文献链接: https://doi.org/10.1109/TGRS. ......
语义 遥感 SPGAN-DA 图像 领域

论文推荐:大型语言模型能自我解释吗?

这篇论文的研究主要贡献是对LLM生成解释的优缺点进行了调查。详细介绍了两种方法,一种是做出预测,然后解释它,另一种是产生解释,然后用它来做出预测。 最近的研究发现,即使LLM是在特定数据上训练的,也不能认识到训练的知识与推理上下文之间的联系。 因此一些人认为之为“X链”的方法非常重要。因为要求LLM ......
模型 语言 论文

[论文阅读] Learning Component-Level and Inter-Class Glyph Representation for few-shot Font Generation

Pre title: Learning Component-Level and Inter-Class Glyph Representation for few-shot Font Generation accepted: ICME 2023 paper: https://ieeexplore.ie ......

Bert-vits2-2.3-Final,Bert-vits2最终版一键整合包(复刻生化危机艾达王)

近日,Bert-vits2发布了最新的版本2.3-final,意为最终版,修复了一些已知的bug,添加基于 WavLM 的 Discriminator(来源于 StyleTTS2),令人意外的是,因情感控制效果不佳,去除了 CLAP情感模型,换成了相对简单的 BERT 融合语义方式。 事实上,经过2 ......
Bert-vits 生化危机 Bert vits 危机

PDF论文重命名

PDF-Renamer Python 库的使用教程 "pdf-renamer" 是一个 Python 命令行工具,主要用于自动地重命名科研论文的 PDF 文件。它可以用于重新命名单个文件,也可以批量扫描整个文件夹及其子目录。 内容目录 简介 安装 使用 在 Windows 右键菜单添加快捷方式 简介 ......
论文 PDF

《OneLLM: One Framework to Align All Modalities with Language》论文学习

一、Abstract 随着LLM的兴起,由于其强大的语言理解和推理能力,在学术和工业界中越来越受欢迎。LLM的进展也启发了研究人员将LLM作为多模态任务的接口,如视觉语言学习、音频和语音识别、视频理解等,因此多模态大语言模型(Multimodal Large Language Model, MLLM ......
Modalities Framework Language OneLLM 论文

论文精读:ST2Vec:道路网络中的时空轨迹相似性学习(ST2Vec: Spatio_Temporal Trajectory Similarity Learning in Road Networks)

论文精读:ST2Vec 道路网络中的时空轨迹相似性学习 《ST2Vec: Spatio-Temporal Trajectory Similarity Learning in Road Networks》 论文链接:https://doi.org/10.48550/arXiv.2112.09339 一 ......

用AI大模型学经典:了凡四训

缘起: 在读《了凡四训-立命之学》时,总有些疑问,比如立命究竟是什么含义?生死之命,贫富之命,贵贱之命究竟是什么意思? 参考学习和自己拓展 参考AI大模型后,可知: 立命: 确立自己的天命(人生目标),令自己生活或工作有奔头,精神有寄托。从而坚定志向,不至于被挫折或困难所阻碍自己的目标达成 三个命的 ......
模型 经典

论文阅读-OpenFE 自动特征生成技术

论文链接:https://arxiv.org/abs/2211.12507 摘要 提出了一种新的feature boost方法来鉴别候选特征在准确率上对模型的提升效果 双阶段剪枝算法,从粗筛到精筛从候选特征池中挑选出top k个生成特征 在简单但有代表性的设置下,证明了特征生成是有益的 引言 Exp ......
特征 OpenFE 论文 技术

论文阅读-Self-supervised and Interpretable Data Cleaning with Sequence Generative Adversarial Networks

1. GARF 简介 代码地址:https://github.com/PJinfeng/Garf-master 基于 SeqGAN 提出了一种自监督、数据驱动的数据清洗框架——GARF。 GARF 的数据清洗分为两个步骤: 规则生成 (Rule generation with SeqGAN):利用 ......

5.经典进程同步问题

生产者消费者问题 一组生产者进程和一组消费者进程共享一个初始为空,大小为n的缓冲区。当缓冲区没满时,生产者才能把消息放入缓冲区,否则必须等待,只有缓冲区不空时,消费者才能从中取出消息,否则必须等待。由于缓冲区是临界资源,它只允许一个生产者放入消息,或一个消费者从中取出消息。 semaphore mu ......
进程 经典 问题

《Learning Transferable Visual Models From Natural Language Supervision》论文学习

一、Abstract 最先进的计算机视觉系统被训练用以预测一组预定的固定目标类别。这种受限的监督方式限制了它们的通用性和可用性,因为需要额外的标记数据来指定任何新的视觉概念。因此,直接从关于图像的原始描述文本中学习是一个有希望的替代方法,它利用了更广泛的因特网监督来源。 我们证明了预测哪个标题与哪张 ......

经典卷积神经网络LeNet&AlexNet&VGG

LeNet LeNet-5是一种经典的卷积神经网络结构,于1998年投入实际使用中。该网络最早应用于手写体字符识别应用中。普遍认为,卷积神经网络的出现开始于LeCun等提出的LeNet网络,可以说LeCun等是CNN的缔造者,而LeNet则是LeCun等创造的CNN经典之作网络结构图由下图所示: L ......
卷积 神经网络 amp 神经 AlexNet

云端开炉,线上训练,Bert-vits2-v2.2云端线上训练和推理实践(基于GoogleColab)

对于笔者这样的穷哥们来讲,GoogleColab就是黑暗中的一道光,就算有训练时长限制,也能凑合用了,要啥自行车?要饭咱也就别嫌饭馊了,本次我们基于GoogleColab在云端训练和推理Bert-vits2-v2.2项目,复刻那黑破坏神角色莉莉丝(lilith)。 ......
云端 GoogleColab Bert-vits Bert vits

《CLIP:Connecting text and images》论文学习

一、Abstract 尽管深度学习已经彻底改革了计算机视觉领域,但当前的深度学习视觉方案方法存在几个主要问题: 高质量的视觉数据集,制作过程耗时且成本高昂,同时只包含了有限范围的视觉概念 标准的深度学习视觉模型(例如ImageNet、ResNet)擅长完成单一任务,且只能完成一个任务,需要投入巨大的 ......
Connecting images 论文 CLIP text

回顾经典之neko_tree

一.neko_tree 猫neko树是一种维护序列的数据结构。在处理绝大多数线段树能处理的问题(如最大子段和,区间最大值,区间\(gcd\)等满足结合律且能快速合并的信息)上能做到\(O(nlogn)\)预处理后\(O(1)\)的询问。但是不支持修改。 neko树怎么维护信息?想象在线段树上取得区间 ......
neko_tree 经典 neko tree

LightGCL Simple Yet Effective Graph Contrastive Learning For Recommendation论文阅读笔记

Abstract 目前的图对比学习方法都存在一些问题,它们要么对用户-项目交互图执行随机增强,要么依赖于基于启发式的增强技术(例如用户聚类)来生成对比视图。这些方法都不能很好的保留内在的语义结构,而且很容易受到噪声扰动的影响。所以我们提出了一个图对比学习范式LightGCL来减轻基于CL的推荐者的通 ......

BiFormer: Vision Transformer with Bi-Level Routing Attention 使用超标记的轻量ViT

alias: Zhu2023a tags: 超标记 注意力 rating: ⭐ share: false ptype: article BiFormer: Vision Transformer with Bi-Level Routing Attention * Authors: [[Lei Zhu] ......
轻量 Transformer 标记 Attention BiFormer

《X-LLM: Bootstrapping Advanced Large Language Models by Treating Multi-Modalities as Foreign Languages》论文学习

《X-LLM: Bootstrapping Advanced Large Language Models by Treating Multi-Modalities as Foreign Languages》论文学习 ......

经典算法——冒泡排序

题:给一个无序数组,写一个排序函数。 数组{4,8,9,7,7,3,2,6,5} 思路:n个数组元素,这里n为九。 抽象点,九个身高不完全相同的人从左到右坐下 现在排降序,由一号位开始,把一号位上的人与其余八个人比身高,比他低者继续往后比,比他高者则与其交换座位后由现一号位上的人继续与后比较,一直比 ......
算法 经典

Rethinking and Improving Relative Position Encoding for Vision Transformer: ViT中的位置编码

Rethinking and Improving Relative Position Encoding for Vision Transformer * Authors: [[Kan Wu]], [[Houwen Peng]], [[Minghao Chen]], [[Jianlong Fu]], ......

2023年12月 论文推荐

12月已经过了一半了,还有2周就是2024年了,我们来推荐下这两周我发现的一些好的论文,另外再推荐2篇很好的英文文章。 https://avoid.overfit.cn/post/4a878fde9a3f4cf3a29de4e742580d6b ......
论文 2023

Bert-vits2-v2.2新版本本地训练推理整合包(原神八重神子英文模型miko)

近日,Bert-vits2-v2.2如约更新,该新版本v2.2主要把Emotion 模型换用CLAP多模态模型,推理支持输入text prompt提示词和audio prompt提示语音来进行引导风格化合成,让推理音色更具情感特色,并且推出了新的预处理webuI,操作上更加亲民和接地气。 更多情报请 ......
Bert-vits 模型 Bert vits miko

MetaFormer Is Actually What You Need for Vision:通用的ViT架构才是关键

MetaFormer Is Actually What You Need for Vision * Authors: [[Weihao Yu]], [[Mi Luo]], [[Pan Zhou]], [[Chenyang Si]], [[Yichen Zhou]], [[Xinchao Wang]] ......
MetaFormer 架构 Actually 关键 Vision

SiReN Sign-Aware Recommendation Using Graph Neural Networks论文阅读笔记

Abstract 目前使用GNN的推荐系统主要利用高评分的正向用户-物品交互信息。但是如何利用低评分来表示用户的偏好是一个挑战,因为低评分仍然可以提供有用的信息。所以在本文中提出了基于GNN模型的有符号感知推荐系统SiReN,SiReN有三个关键组件 构造一个符号二部图更精确的表示用户的偏好,分为两 ......

《ChatBridge: Bridging Modalities with Large Language Model as a Language Catalyst》论文学习

一、Abstract 构建能够感知现实世界多种模态信信号,并解决各种任务的通用模型,是人工智能领域一个吸引人的目标。 在本文中,我们介绍了ChatBridge,这是一个新颖的多模态语言模型,它利用语言的表达能力作为催化剂,来弥合不同模态之间的差距。我们证明,只需要使用双模态的语言配对数据(image ......

《MiniGPT-4: Enhancing Vision-language Understanding with Advanced Large Language Models》论文学习

一、ABSTRACT 最新的GPT-4展示了非凡的多模态能力,例如直接从手写文本生成网站和识别图像中的幽默元素。这些特性在以往的视觉-语言模型中很少见。然而,GPT-4背后的技术细节仍然未公开。我们认为,GPT-4增强的多模态生成能力源自于复杂的大型语言模型(LLM)的使用。 为了检验这一现象,我们 ......

【论文阅读】HTTP 流量和恶意 URL 的异常检测

Part 1关于论文 基本信息 题目:HTTP 流量和恶意 URL 的异常检测源码:sec2vec源代码 摘要 在本文中,我们将展示如何利用自然语言处理(NLP)中已知 的方法来检测 HTTP 请求中的异常情况和恶意 URL。目前大 多数针对类似问题的解决方案要么基于规则,要么使用人工 选择的特征进 ......
恶意 流量 论文 HTTP URL
共1140篇  :3/38页 首页上一页3下一页尾页