multi-modal attention retrieval learning

GCGP:Global Context and Geometric Priors for Effective Non-Local Self-Attention加入了上下文信息和几何先验的注意力

Global Context and Geometric Priors for Effective Non-Local Self-Attention * Authors: [[Woo S]] 初读印象 comment:: (GCGP)提出了一个新的关系推理模块,它包含了一个上下文化的对角矩阵和二维相 ......

A Guide to Image and Video based Small Object Detection using Deep Learning : Case Study of Maritime Surveillance

A Guide to Image and Video based Small Object Detection using Deep Learning : Case Study of Maritime Surveillance 基于图像和视频的小对象指南使用深度学习进行检测:的案例研究海上监视 1 ......

Occluded Person Re-Identification with Deep Learning: A Survey and Perspectives

应对行人信息丢失、噪声干扰、视角错位等挑战 局部特征学习:人体分割、姿态估计、语义分割、属性注释、混合法 ***语义分割*** ECCV-2020)用于行人重识别的身份引导人类语义解析 https://blog.51cto.com/u_14300986/5466923 ......

神经网络优化篇:机器学习基础(Basic Recipe for Machine Learning)

机器学习基础 下图就是在训练神经网络用到的基本方法:(尝试这些方法,可能有用,可能没用) 这是在训练神经网络时用到地基本方法,初始模型训练完成后,首先要知道算法的偏差高不高,如果偏差较高,试着评估训练集或训练数据的性能。如果偏差的确很高,甚至无法拟合训练集,那么要做的就是选择一个新的网络,比如含有更 ......
神经网络 Learning 神经 机器 Machine

【scikit-learn基础】--『预处理』之 正则化

数据的预处理是数据分析,或者机器学习训练前的重要步骤。通过数据预处理,可以 提高数据质量,处理数据的缺失值、异常值和重复值等问题,增加数据的准确性和可靠性 整合不同数据,数据的来源和结构可能多种多样,分析和训练前要整合成一个数据集 提高数据性能,对数据的值进行变换,规约等(比如无量纲化),让算法更加 ......
正则 scikit-learn 基础 scikit learn

Machine Learning in Python

Metric Formula Interpretation Accuracy $ \frac{TP+TN}{TP+TN+FP+FN} $ Overall performance of model Precision $ \frac{TP}{TP+FN} $ How accurate the posi ......
Learning Machine Python in

Ansor:Generating High-Performance Tensor Program for Deep Learning

Ansor:Generating High-Performance Tensor Program for Deep Learning Abstract 高性能的张量程序对于保证深度神经网络的高效执行十分关键,但是在不同硬件平台上获取高性能的张量程序并不容易。近年的研究中,深度学习系统依赖硬件供应商提 ......

RLHF · PbRL | 选择 near on-policy query,加速 policy learning 收敛速度

Query-Policy Misalignment:选择的看似 informative 的 query,实际上可能与 RL agent 的兴趣不一致,因此对 policy learning 几乎没有帮助,最终导致 feedback-efficiency 低下。 ......
policy on-policy learning 速度 query

Fully Attentional Network for Semantic Segmentation:FLANet

Fully Attentional Network for Semantic Segmentation * Authors: [[Qi Song]], [[Jie Li]], [[Chenghong Li]], [[Hao Guo]], [[Rui Huang]] 初读印象 comment:: (F ......

Q-learning与Sarsa算法辨析

这个是Q-learing的一个算法,根据代码,它就是,先设定训练100次,然后,给它一个随机的状态,这里我们假设状态6就是终点,那么走迷宫的时候,如果没走到6,就要一直走下去,,所以里面还要用到一个while循环,然后在每个状态的时候,找一个非负的动作,存储在数组里,(算是合理动作的集合吧),下一个 ......
算法 Q-learning learning Sarsa

《Progressive Learning of Category-Consistent Multi-Granularity Features for Fine-Grained Visual Classification》阅读笔记

论文标题 《Progressive Learning of Category-Consistent Multi-Granularity Features for Fine-Grained Visual Classification》 细粒度视觉分类中类别一致多粒度特征的渐进学习 作者 Ruoyi D ......

【scikit-learn基础】--『预处理』之 数据缩放

数据的预处理是数据分析,或者机器学习训练前的重要步骤。通过数据预处理,可以 提高数据质量,处理数据的缺失值、异常值和重复值等问题,增加数据的准确性和可靠性 整合不同数据,数据的来源和结构可能多种多样,分析和训练前要整合成一个数据集 提高数据性能,对数据的值进行变换,规约等(比如无量纲化),让算法更加 ......
scikit-learn 基础 数据 scikit learn

Flash-attention 2.3.2 支持 Windows了,但是我的2080ti是不支持的。

不久前Flash-attention 2.3.2 终于支持了 Windows,推荐直接使用大神编译好的whl安装 github.com/bdashore3/flash-attention/releasesstable diffusion webui flash-attention2性能测试 安装环境 ......
Flash-attention attention Windows Flash 2080

【scikit-learn基础】--『预处理』之 标准化

数据的预处理是数据分析,或者机器学习训练前的重要步骤。通过数据预处理,可以 提高数据质量,处理数据的缺失值、异常值和重复值等问题,增加数据的准确性和可靠性 整合不同数据,数据的来源和结构可能多种多样,分析和训练前要整合成一个数据集 提高数据性能,对数据的值进行变换,规约等(比如无量纲化),让算法更加 ......
scikit-learn 基础 标准 scikit learn

【论文解读】System 2 Attention提高大语言模型客观性和事实性

本文简要介绍了论文“System 2 Attention (is something you might need too) ”的相关工作。基于transformer的大语言模型(LLM)中的软注意很容易将上下文中的不相关信息合并到其潜在的表征中,这将对下一token的生成产生不利影响。为了帮助纠正... ......
事实性 客观性 Attention 模型 客观

The Devil Is in the Details: Window-based Attention for Image Compression

目录简介 简介 基于CNN的模型的一个主要缺点是 cNN结构不是为捕捉局部冗余而设计的,尤其是非重复纹理,这严重影响了重建质量。受视觉转换器(ViT)和Swin Transformer最新进展的启发,我们发现将局部感知注意机制与全局相关特征学习相结合可以满足图像压缩的期望。 介绍了一种更简单有效的基 ......

论文笔记: Attributed Graph Clustering: A Deep Attentional Embedding Approach

论文笔记: Attributed Graph Clustering: A Deep Attentional Embedding Approach 中文名称: 属性图聚类:一种深度注意力嵌入方法 论文链接: https://arxiv.org/abs/1906.06532 背景: ​ 图聚类是发现网络 ......

Attention 2015-今

现在attention的热度已经过去了,基本上所有的attention都是transformer的kqv形式的,甚至只要说道attention,默认就是transformer的attention。 为避免遗忘历史,我这里做一个小总结。繁杂的att我就不去了解了,只了解下经典的。 以下以\(h_i\) ......
Attention 2015

Adaptive Graph Contrastive Learning for Recommendation论文阅读笔记

Abstract 在实际的场景中,用户的行为数据往往是有噪声的,并且表现出偏态分布。所以需要利用自监督学习来改善用户表示。我们提出了一种新的自适应图对比学习(AdaGCL)框架,该框架使用两个自适应对比视图生成器来进行数据增强,以更好地增强CF范式。具体的说,我们使用了两个可训练的视图生成器,一个图 ......

15.Please retell the parable of The Blind men and An Elephant. What is the moral of the parable? What can we learn from the parable when it comes to critical thinking?

Round 1: Retelling the Parable and Extracting the Moral Speaker 1 (Student A): Hey everyone! So, let's dive into the parable of "The Blind Men and the ......
parable the What Elephant critical

System 2 Attention:可以提高不同LLM问题的推理能力

推理正在成为大型语言模型(llm)关注的下一个主要领域。尽管llm拥有先进的能力,但大多数llm经常被简单的错误绊倒,显示出他们在推理方面的局限性。这些模型可能会被上下文中的不相关细节所误导,或者受到输入提示中的偏差的影响。而后一种倾向被称为谄媚,也就是说模型会更偏向与输入一致,而不管准确性如何。人 ......
Attention 能力 System 问题 LLM

【scikit-learn基础】--『数据加载』之外部数据集

这是scikit-learn数据加载系列的最后一篇,本篇介绍如何加载外部的数据集。 外部数据集不像之前介绍的几种类型的数据集那样,针对每种数据提供对应的接口,每个接口加载的数据都是固定的。而外部数据集加载之后,数据的字段和类型是不确定的。 简单来说,我们在实际的数据分析工作中,用到的是外部数据集加载 ......
数据 scikit-learn 基础 scikit learn

Overview of Machine Learning Methods for Genome-Wide Association Analysis

Overview of Machine Learning Methods for Genome-Wide Association Analysis BIBE2021: The Fifth International Conference on Biological Information and B ......

Paper Reading: Oversampling with Reliably Expanding Minority Class Regions for Imbalanced Data Learning

为了设计更有效的插值过采样算法,本文提出了一种新的插值过采样方法 OREM。OREM 在原始少数类样本周围找到候选少数类区域,然后利用这些候选区域识别不包含任何多数类样本的干净子区域。它们被认为是潜在的少数类区域,所以通过将合成样本填充到干净子区域可以增强少数类的表达能力。OREM 方法的思路很简单... ......

Predicting gene expression from histone modifications with self-attention based neural networks and transfer learning

Predicting gene expression from histone modifications with self-attention based neural networks and transfer learning Yuchi Chen 1, Minzhu Xie 1, Jie ......

Drug response prediction using graph representation learning and Laplacian feature selection

Drug response prediction using graph representation learning and Laplacian feature selection Minzhu Xie 1 2, Xiaowen Lei 3, Jianchen Zhong 3, Jianxing ......

【scikit-learn基础】--『数据加载』之样本生成器

除了内置的数据集,scikit-learn还提供了随机样本的生成器。通过这些生成器函数,可以生成具有特定特性和分布的随机数据集,以帮助进行机器学习算法的研究、测试和比较。 目前,scikit-learn库(v1.3.0版)中有20个不同的生成样本的函数。本篇重点介绍其中几个具有代表性的函数。 1. ......
生成器 样本 scikit-learn 基础 数据

DeepWalk Online Learning of Social Representations

目录概符号说明DeepWalk代码 Perozzi B., AI-Rfou R. and Skiena S. DeepWalk: Online learning of social representations. KDD, 2014. 概 经典的 graph embedding 学习方法. 符号说 ......

The second day learning summary

1.什么是接口测试? 接口测试是测试系统组件间接口的一种测试。接口测试主要用于外部系统与系统之间以及内部各个子系统之间的交互点,定义特定的交互点,然后通过这些交互点来,通过一些特殊的规则也就是协议,来进行数据之间的交互。测试的重点是要检查数据的交换,传递和控制管理过程,以及系统间的相互逻辑依赖关系等 ......
learning summary second The day

Class-Incremental Learning with Generative Classifiers(CVPR2021W)

前置知识:VAE(可以参考https://zhuanlan.zhihu.com/p/348498294) Motivation 之前的方法通常使用判别式分类器,对条件分布\(p(y|\textbf{x})\)进行建模(classifier+softmax+ce)。其问题在于分类器会偏向最新学的类别, ......