论文翻译convolutional multi-scale enhancement
PDF论文重命名
PDF-Renamer Python 库的使用教程 "pdf-renamer" 是一个 Python 命令行工具,主要用于自动地重命名科研论文的 PDF 文件。它可以用于重新命名单个文件,也可以批量扫描整个文件夹及其子目录。 内容目录 简介 安装 使用 在 Windows 右键菜单添加快捷方式 简介 ......
《OneLLM: One Framework to Align All Modalities with Language》论文学习
一、Abstract 随着LLM的兴起,由于其强大的语言理解和推理能力,在学术和工业界中越来越受欢迎。LLM的进展也启发了研究人员将LLM作为多模态任务的接口,如视觉语言学习、音频和语音识别、视频理解等,因此多模态大语言模型(Multimodal Large Language Model, MLLM ......
论文精读:ST2Vec:道路网络中的时空轨迹相似性学习(ST2Vec: Spatio_Temporal Trajectory Similarity Learning in Road Networks)
论文精读:ST2Vec 道路网络中的时空轨迹相似性学习 《ST2Vec: Spatio-Temporal Trajectory Similarity Learning in Road Networks》 论文链接:https://doi.org/10.48550/arXiv.2112.09339 一 ......
论文阅读-OpenFE 自动特征生成技术
论文链接:https://arxiv.org/abs/2211.12507 摘要 提出了一种新的feature boost方法来鉴别候选特征在准确率上对模型的提升效果 双阶段剪枝算法,从粗筛到精筛从候选特征池中挑选出top k个生成特征 在简单但有代表性的设置下,证明了特征生成是有益的 引言 Exp ......
论文阅读-Self-supervised and Interpretable Data Cleaning with Sequence Generative Adversarial Networks
1. GARF 简介 代码地址:https://github.com/PJinfeng/Garf-master 基于 SeqGAN 提出了一种自监督、数据驱动的数据清洗框架——GARF。 GARF 的数据清洗分为两个步骤: 规则生成 (Rule generation with SeqGAN):利用 ......
《Learning Transferable Visual Models From Natural Language Supervision》论文学习
一、Abstract 最先进的计算机视觉系统被训练用以预测一组预定的固定目标类别。这种受限的监督方式限制了它们的通用性和可用性,因为需要额外的标记数据来指定任何新的视觉概念。因此,直接从关于图像的原始描述文本中学习是一个有希望的替代方法,它利用了更广泛的因特网监督来源。 我们证明了预测哪个标题与哪张 ......
python 读取数据调翻译更新表字段
import time import requests import pymysql import datetime import random from hashlib import md5 import json now_date = datetime.datetime.now().strfti ......
《CLIP:Connecting text and images》论文学习
一、Abstract 尽管深度学习已经彻底改革了计算机视觉领域,但当前的深度学习视觉方案方法存在几个主要问题: 高质量的视觉数据集,制作过程耗时且成本高昂,同时只包含了有限范围的视觉概念 标准的深度学习视觉模型(例如ImageNet、ResNet)擅长完成单一任务,且只能完成一个任务,需要投入巨大的 ......
LightGCL Simple Yet Effective Graph Contrastive Learning For Recommendation论文阅读笔记
Abstract 目前的图对比学习方法都存在一些问题,它们要么对用户-项目交互图执行随机增强,要么依赖于基于启发式的增强技术(例如用户聚类)来生成对比视图。这些方法都不能很好的保留内在的语义结构,而且很容易受到噪声扰动的影响。所以我们提出了一个图对比学习范式LightGCL来减轻基于CL的推荐者的通 ......
SegNeXt: Rethinking Convolutional Attention Design for Semantic Segmentation
SegNeXt: Rethinking Convolutional Attention Design for Semantic Segmentation * Authors: [[Meng-Hao Guo]], [[Cheng-Ze Lu]], [[Qibin Hou]], [[Zhengning ......
Fully convolutional networks for semantic segmentation
Fully convolutional networks for semantic segmentation * Authors: [[Jonathan Long]], [[Evan Shelhamer]], [[Trevor Darrell]] DOI: 10.1109/CVPR.2015.729 ......
SeaFormer: Squeeze-enhanced Axial Transformer for Mobile Semantic Segmentation
SeaFormer: Squeeze-enhanced Axial Transformer for Mobile Semantic Segmentation * Authors: [[Qiang Wan]], [[Zilong Huang]], [[Jiachen Lu]], [[Gang Yu]] ......
U-Net: Convolutional Networks for Biomedical Image Segmentation
U-Net: Convolutional Networks for Biomedical Image Segmentation * Authors: [[Olaf Ronneberger]], [[Philipp Fischer]], [[Thomas Brox]] Local library 初读 ......
InternImage: Exploring Large-Scale Vision Foundation Models with Deformable Convolutions 可变形卷积v3
InternImage: Exploring Large-Scale Vision Foundation Models with Deformable Convolutions * Authors: [[Wenhai Wang]], [[Jifeng Dai]], [[Zhe Chen]], [[Z ......
Real-Time Single Image and Video Super-Resolution Using an Efficient Sub-Pixel Convolutional Neural Network
Real-Time Single Image and Video Super-Resolution Using an Efficient Sub-Pixel Convolutional Neural Network * Authors: [[Wenzhe Shi]], [[Jose Caballer ......
CBAM: Convolutional Block Attention Module
CBAM: Convolutional Block Attention Module * Authors: [[Sanghyun Woo]], [[Jongchan Park]], [[Joon-Young Lee]], [[In So Kweon]] doi:https://doi.org/10. ......
Adaptive Sparse Convolutional Networks with Global Context Enhancement for Faster Object Detection on Drone Images
Adaptive Sparse Convolutional Networks with Global Context Enhancement for Faster Object Detection on Drone Images * Authors: [[Bowei Du]], [[Yecheng ......
Scale-Prior Deformable Convolution for Exemplar-Guided Class-Agnostic Counting
Scale-Prior Deformable Convolution for Exemplar-Guided Class-Agnostic Counting 初读印象 comment:: (计数用的一个网络)提出了一个标度优先的可变形卷积,将典范的信息,例如标度,整合到计数网络主干中。 动机 本文考 ......
《X-LLM: Bootstrapping Advanced Large Language Models by Treating Multi-Modalities as Foreign Languages》论文学习
《X-LLM: Bootstrapping Advanced Large Language Models by Treating Multi-Modalities as Foreign Languages》论文学习 ......
2023年12月 论文推荐
12月已经过了一半了,还有2周就是2024年了,我们来推荐下这两周我发现的一些好的论文,另外再推荐2篇很好的英文文章。 https://avoid.overfit.cn/post/4a878fde9a3f4cf3a29de4e742580d6b ......
SiReN Sign-Aware Recommendation Using Graph Neural Networks论文阅读笔记
Abstract 目前使用GNN的推荐系统主要利用高评分的正向用户-物品交互信息。但是如何利用低评分来表示用户的偏好是一个挑战,因为低评分仍然可以提供有用的信息。所以在本文中提出了基于GNN模型的有符号感知推荐系统SiReN,SiReN有三个关键组件 构造一个符号二部图更精确的表示用户的偏好,分为两 ......
《MiniGPT-4: Enhancing Vision-language Understanding with Advanced Large Language Models》论文学习
一、ABSTRACT 最新的GPT-4展示了非凡的多模态能力,例如直接从手写文本生成网站和识别图像中的幽默元素。这些特性在以往的视觉-语言模型中很少见。然而,GPT-4背后的技术细节仍然未公开。我们认为,GPT-4增强的多模态生成能力源自于复杂的大型语言模型(LLM)的使用。 为了检验这一现象,我们 ......
《ChatBridge: Bridging Modalities with Large Language Model as a Language Catalyst》论文学习
一、Abstract 构建能够感知现实世界多种模态信信号,并解决各种任务的通用模型,是人工智能领域一个吸引人的目标。 在本文中,我们介绍了ChatBridge,这是一个新颖的多模态语言模型,它利用语言的表达能力作为催化剂,来弥合不同模态之间的差距。我们证明,只需要使用双模态的语言配对数据(image ......
机械翻译
private void translate(String from, String to, String text) throws IOException { MediaType mediaType = MediaType.parse("application/json"); RequestBod ......
【论文阅读】HTTP 流量和恶意 URL 的异常检测
Part 1关于论文 基本信息 题目:HTTP 流量和恶意 URL 的异常检测源码:sec2vec源代码 摘要 在本文中,我们将展示如何利用自然语言处理(NLP)中已知 的方法来检测 HTTP 请求中的异常情况和恶意 URL。目前大 多数针对类似问题的解决方案要么基于规则,要么使用人工 选择的特征进 ......
PANE-GNN Unifying Positive and Negative Edges in Graph Neural Networks for Recommendation论文阅读笔记
Abstract 目前利用GNN的推荐系统主要关注用户的正面反馈,而忽略了负面反馈提供的见解。于是我们提出了PANG- GNN,该模型将图神经网络的正面和负面边统一在一起。PANG-GNN首先将原始评分图根据正面和负面反馈划分为两个不同的二分图。接下来分别使用两个独立的嵌入,即感兴趣嵌入和无兴趣嵌入 ......
六级翻译
六级翻译技巧 方法 1.找主干-添枝加叶-检查回读 谁是什么 谁做了什么 什么被做(be done) 修饰成分有动词 用定语从句 2.无主语 添加 主语:people ,they ,we, he ,his,it 换成被动 there be 常用语法 之一 one of +名词复数形式 水浒传是中国文 ......
【论文阅读笔记】【多模态-Vision-Language Pretraining】 BLIP: Bootstrapping Language-Image Pre-training for Unified Vision-Language Understanding and Generation
BLIP ICML 2022 (Spotlight) 读论文思考的问题 论文试图解决什么问题?写作背景是什么? 问题: 在视觉-语言预训练(VLP)中,如何更加高效地利用充斥着噪声的海量图文对数据,提升预训练效果? 如何设计模型,使得预训练后的模型在理解(understanding-based)任务 ......
Swin Transformer 马尔奖论文(ICCV 2021最佳论文)
目录 简介 作者之一的微软亚研院的首席研究员胡瀚老师在bibili讲过该论文 swin transformer比ViT做的更好的原因之一就是它将图片的一些特性嵌入到了网络模型之中,比如说平移不变性和尺寸不变性等,这样使得网络能够在cv领域做的更好。 该文章提出的Swin Transformer可以被 ......