recommendation personalized explainable transformer

Attention机制竟有bug？Softmax是罪魁祸首，影响所有Transformer

前言「大模型开发者，你们错了。」本文转载自机器之心仅用于学术分享，若侵权请联系删除欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 CV各大方向专栏与各个部署框架最全教程整理【CV技术指南】CV全栈指导班、基础入门班、论文指导班全面上线! ......

罪魁祸首罪魁祸首 Transformer Attention更新时间 2023-07-29

Meta-Transformer 多模态学习的统一框架

Meta-Transformer是一个用于多模态学习的新框架，用来处理和关联来自多种模态的信息，如自然语言、图像、点云、音频、视频、时间序列和表格数据，虽然各种数据之间存在固有的差距，但是Meta-Transformer利用冻结编码器从共享标记空间的输入数据中提取高级语义特征，不需要配对的多模态训练 ......

模态 Meta-Transformer Transformer 框架 Meta更新时间 2023-07-29

Meta-Transformer：1个框架理解12种模态引发的质变与涌现（已开源）

前言近日，香港中文大学多媒体实验室（CUHK MMLab）联合上海人工智能实验室的OpenGVLAB研究团队提出一个统一多模态学习框架 Meta-Transformer，实现骨干网络的大一统，具有一个模态共享编码器，并且无需配对数据，即可理解 12 种模态信息, 并提供了多模态无边界融合的新范式。 ......

模态质变 Meta-Transformer Transformer 框架更新时间 2023-07-28

Bidirectional Encoder Representations from Transformers

BERT（Bidirectional Encoder Representations from Transformers）是由Google在2018年提出的自然语言处理（NLP）模型。它是一个基于Transformer架构的预训练模型，通过无监督学习从大量的文本数据中学习通用的语言表示，从而能够更好... ......

Representations Bidirectional Transformers Encoder from更新时间 2023-07-28

Transformer模型

### Transformer模型 [Transformer模型及其实现](https://blog.csdn.net/moo611/article/details/122234867) 历史：谷歌团队在2017年提出的经典NLP模型（目前很火的bert模型就是基于此模型）。特点：Transfor ......

Transformer 模型更新时间 2023-07-28

MySQL_Explain详解

当我们在工作中面临SQL优化的问题时，熟练掌握适合的工具，就能使事半功倍，提高工作效率。其中，EXPLAIN工具就是一种常用且高效的SQL优化工具。 EXPLAIN关键字的使用方法是，在select语句之前添加它，这样MySQL会在查询上设置一个标记。但不同于普通查询，此时执行的并不是查询语句本身， ......

MySQL_Explain Explain MySQL更新时间 2023-07-28

CF623E Transforming Sequence

难点在于卡 `__int128`（？）。首先 $N>K$ 显然无解，只需考虑 $N\le K$ 的情况。然而这并没有什么用。把 $b$ 看作集合，显然 $b_i\subset b_{i+1}$。所以令 $f_{n,i}$ 为考虑到 $b_n$ 且 $|b_n|=i$ 的方案数，集合元素无序，即选 ......

Transforming Sequence 623E 623 CF更新时间 2023-07-27

VBA利用transform函数和ADO实现交叉汇总

VBA中transform函数基本语法： Creates a crosstab query. Syntax TRANSFORM aggfunction selectstatement PIVOT pivotfield [IN (value1[, value2[, ...]])] The TRANSF ......

函数 transform VBA ADO更新时间 2023-07-27

Vision Transformer

Vision Transformer 本文关注ViT论文`4.5 Inspecting Vision Transformer`可视化的原理及实现，此外还对ViT pytorch源码实现进行理解 [toc] # Introduction [论文地址](arXiv:2010.11929) ## Titl ......

Transformer Vision更新时间 2023-07-27

transformer中解码器的实现细节

1. 前言 17年google团队发表l了论文《Attention Is All You Need》，transformer横空出世，并引领了AI学术圈的研发风向，以Transformer为基础模型的新模型层出不穷，无论是NLP还是CV或者是多模态，attention遍地开花。这篇文章遵循enco ......

解码器 transformer 细节更新时间 2023-07-26

论文翻译（扩散模型来了）：Diffusion-Based Mel-Spectrogram Enhancement for Personalized Speech Synthesis with Found Data

利用发现的数据来创建合成声音是具有挑战性的，因为现实世界的录音通常包含各种类型的音频退化。解决这个问题的一种方法是使用增强模型对语音进行预增强，然后使用增强后的数据进行文本转语音（TTS）模型训练。本论文研究了使用条件扩散模型进行广义语音增强，旨在同时解决多种类型的音频退化。增强是在对数Mel频谱领 ......

论文翻译 Diffusion-Based Mel-Spectrogram Personalized Enhancement更新时间 2023-07-26

MySQL的执行计划详解（Explain）

MySQL的执行计划详解（Explain） 1、MySQL执行计划的定义在 MySQL 中可以通过 explain 关键字模拟优化器执行 SQL语句，从而知道 MySQL 是如何处理 SQL 语句的。 2、MySQL整个查询的过程• 客户端向 MySQL 服务器发送一条查询请求• 服务器首先检查查 ......

Explain MySQL更新时间 2023-07-22

mysql：EXPLAIN

推荐阅读原文：[EXPLAIN用法和结果分析](https://blog.csdn.net/why15732625998/article/details/80388236) 语法： `EXPLAIN SELECT * FROM t1` #### id - id相同，执行顺序由上至下 - id不同，如 ......

EXPLAIN mysql更新时间 2023-07-21

explain

用于分析SQL语句的执行效率直接执行explain SQL语句即可查询`select * from user`语句的执行效率: ![image](https://img2023.cnblogs.com/blog/1859679/202307/1859679-20230721075344015-1 ......

explain更新时间 2023-07-21

Transformer（转换器）

Sequence To Sequence（序列对序列）输入一个序列，输出一个序列输出序列的长度由机器自己决定，例如：语音辨识、机器翻译、语音翻译 Sequence To Sequence一般分成两部分： Encoder:传入一个序列，由Encoder处理后传给Decoder Decoder:决定 ......

转换器 Transformer更新时间 2023-07-20

斯坦福博士一己之力让Attention提速9倍！FlashAttention燃爆显存，Transformer上下文长度史诗级提升

前言 FlashAttention新升级！斯坦福博士一人重写算法，第二代实现了最高9倍速提升。本文转载自新智元仅用于学术分享，若侵权请联系删除欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 CV各大方向专栏与各个部署框架最全教程整理【CV技 ......

上下文显存史诗 FlashAttention Transformer更新时间 2023-07-19

Transformer取代者登场！微软、清华刚推出RetNet：成本低、速度快、性能强

前言 Transformer 的训练并行性是以低效推理为代价的：每一步的复杂度为 O (N) 且键值缓存受内存限制，让 Transformer 不适合部署。不断增长的序列长度会增加 GPU 内存消耗和延迟，并降低推理速度。研究者们一直在努力开发下一代架构，希望保留训练并行性和 Transformer ......

速度快 Transformer 成本性能速度更新时间 2023-07-19

[未解决] vue transform-blocks解析源代码报错：Illegal tag name. Use '<' to print '<'.

报错内容： [vite] Internal server error: Illegal tag name. Use '<' to print '`标签后报错，但其他vue文件可以正常读取和展示。报错的文件，去掉``标签就可以正常加载。报错的方法是vue-compiler的`baseParse()` ......

transform-blocks 39 源代码 transform Illegal更新时间 2023-07-19

从RNN到Transformer

## 1. RNN 循环神经网络的内容可参考https://www.youtube.com/watch?v=UNmqTiOnRfg。 RNN建模的对象是具有时间上前后依赖关系的对象。以youtube上的这个视频为例，一个厨师如果只根据天气来决定今天他做什么菜，那么就是一个普通的神经网络；但如果他第i ......

Transformer RNN更新时间 2023-07-18

Hugging News #0717: 开源大模型榜单更新、音频 Transformers 课程完成发布！

每一周，我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新，包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等，我们将其称之为「Hugging News」。本期 Hugging News 有哪些有趣的消息，快来看看吧！ 🎉 😍 ## 重磅更新 ......

Transformers 模型音频 Hugging 课程更新时间 2023-07-17

Unified Conversational Recommendation Policy Learning via Graph-based Reinforcement Learning

图的作用：图结构捕捉不同类型节点（即用户、项目和属性）之间丰富的关联信息，使我们能够发现协作用户对属性和项目的偏好。因此，我们可以利用图结构将推荐和对话组件有机地整合在一起，其中对话会话可以被视为在图中维护的节点序列，以动态地利用对话历史来预测下一轮的行动。由四个主要组件组成：基于图的 MDP ......

Learning Conversational Recommendation Reinforcement Graph-based更新时间 2023-07-17

大语言模型的预训练[1]:基本概念原理、神经网络的语言模型、Transformer模型原理详解、Bert模型原理介绍

# 大语言模型的预训练[1]:基本概念原理、神经网络的语言模型、Transformer模型原理详解、Bert模型原理介绍 # 1.大语言模型的预训练 ## 1.LLM预训练的基本概念预训练属于迁移学习的范畴。现有的神经网络在进行训练时，一般基于反向传播（Back Propagation，BP）算法 ......

模型原理语言神经网络 Transformer更新时间 2023-07-17

粗读Multi-Task Recommendations with Reinforcement Learning

论文： Multi-Task Recommendations with Reinforcement Learning 地址： https://arxiv.org/abs/2302.03328 # 摘要 In recent years, Multi-task Learning (MTL) has yi ......

Recommendations Reinforcement Multi-Task Learning Multi更新时间 2023-07-17

Transform LiveData

查询资料的其中一个场景：创建一个回调函数，当查询后台的时候，后台有结果了，回调对应的回调函数，并将结果保存到LiveData中。 public class DataModel { ... public MutableLiveData<List<Repo>> searchRepo(String qu ......

Transform LiveData更新时间 2023-07-15

[论文速览] A Closer Look at Self-supervised Lightweight Vision Transformers

## Pre title: A Closer Look at Self-supervised Lightweight Vision Transformers accepted: ICML 2023 paper: https://arxiv.org/abs/2205.14443 code: https ......

Self-supervised Transformers Lightweight supervised Closer更新时间 2023-07-15

论文日记四：Transformer(论文解读+NLP、CV项目实战)

# 导读重磅模型**transformer**,在2017年发布，但就今天来说产生的影响在各个领域包括NLP、CV这些都是巨大的！ Paper《[Attention Is All You Need](https://arxiv.org/pdf/1706.03762.pdf)》,作者是在机器翻译这个 ......

论文 Transformer 实战项目日记更新时间 2023-07-14

Swin Transformer结构梳理

[TOC] > Swim Transformer是特为视觉领域设计的一种分层Transformer结构。Swin Transformer的两大特性是滑动窗口和层级式结构。 1.滑动窗口使相邻的窗口之间进行交互，从而达到全局建模的能力。 2.层级式结构的好处在于不仅灵活的提供各种尺度的信息，同时还因为 ......

Transformer 结构 Swin更新时间 2023-07-13

Shell | Transformer-xl代码的shell代码实现

**实现网址：**https://github.com/kimiyoung/transformer-xl/tree/master/pytorch ![](https://img2023.cnblogs.com/blog/3085423/202307/3085423-20230713165109801 ......

代码 Transformer-xl Transformer Shell shell更新时间 2023-07-13

Transforms的使用

# 一、Transforms的结构及用法 - 导入transforms ```python from torchvision import transforms ``` - 作用：图片输入transforms后，可以得到一些预期的变换 ## 1. Transforms的python用法 ### 写在 ......

Transforms更新时间 2023-07-13

MEANTIME Mixture of Attention Mechanisms with Multi-temporal Embeddings for Sequential Recommendation

[TOC] > [Cho S., Park E. and Yoo S. MEANTIME: Mixture of attention mechanisms with multi-temporal embeddings for sequential recommendation. RecSys, 20 ......

Multi-temporal Recommendation Embeddings Mechanisms Sequential更新时间 2023-07-12

共551篇 :10/19页 首页上一页78910111213下一页尾页