transformers bert gpt4 nlp

CF1506D - Epic Transformation

思路用优先队列模拟 ac代码 #include <bits/stdc++.h> using namespace std; using i64 = long long; const i64 inf = 8e18; typedef pair<int, int> pii; const int N = 5 ......

Transformation 1506D 1506 Epic CF更新时间 2024-01-13

校验ChatGPT 4真实性的三个经典问题：提供免费测试网站快速区分 GPT3.5 与 GPT4

现在已经有很多 ChatGPT 的套壳网站，以下分享验明 GPT-4 真身的三个经典问题，帮助你快速区分套壳网站背后到底用的是 GPT-3.5 还是 GPT-4。大家可以在这个网站测试：https://ai.hxkj.vip，免登录可以问三条，登录之后无限制。咱们使用免登录的额度测试就已经够用了 ......

GPT 真实性三个 ChatGPT 经典更新时间 2024-01-12

LLM series: Transformer

🥥 Homepage Dataset, DataLoader, and Transforms Model Traning Model 🥑 Get Started! Import libraries: import torch import torch.nn as nn import torch. ......

Transformer series LLM更新时间 2024-01-12

Learning Dynamic Query Combinations for Transformer-based Object** Detection and Segmentation论文阅读笔记

Motivation & Intro 基于DETR的目标检测范式（语义分割的Maskformer也与之相似）通常会用到一系列固定的query，这些query是图像中目标对象位置和语义的全局先验。如果能够根据图像的语义信息调整query，就可以捕捉特定场景中物体位置和类别的分布。例如，当高级语义显示图 ......

Transformer-based Combinations Segmentation Transformer Detection更新时间 2024-01-11

[NLP复习笔记] Transformer

1. Transformer 概述 1.1 整体结构 \(\text{Transformer}\) 主要由 \(\text{Encoder}\) 和 \(\text{Decoder}\) 两个部分组成。\(\text{Encoder}\) 部分有 \(N = 6\) 个相同的层，每层包含一个 \( ......

Transformer 笔记 NLP更新时间 2024-01-11

用GPT4聊天制作AI绘画搞笑视频，播放量近10w，附GPT4开通教程

AI一天，人间一年。大家好，我是小卷，最近大家在视频号、抖音刷短视频时，是不是经常刷到那种用AI生成的聊天搞笑绘画视频。比如下面这个视频：南方小土豆来哈尔滨 ......

GPT4 绘画 GPT 教程视频更新时间 2024-01-10

RNN 和 Transformer 复杂度比较

这里假设BatchSize为 1，就是单样本的情况。原始 RNN 块：（1）单步计算 H，包含两个矩阵向量乘法，和一个激活，复杂度HidSize² （2）一共有SeqLen步，所以整体复杂度SeqLen * HidSize² LSTM 块：（1）单步计算 F I C_hat O，包含八个矩阵向 ......

复杂度 Transformer RNN更新时间 2024-01-09

挑战Transformer的新架构Mamba解析以及Pytorch复现

今天我们来详细研究这篇论文“Mamba:具有选择性状态空间的线性时间序列建模” Mamba一直在人工智能界掀起波澜，被吹捧为Transformer的潜在竞争对手。到底是什么让Mamba在拥挤的序列建中脱颖而出? 在介绍之前先简要回顾一下现有的模型 Transformer:以其注意力机制而闻名，其中序 ......

Transformer 架构 Pytorch Mamba更新时间 2024-01-09

《Span-Based Joint Entity and Relation Extraction with Transformer Pre-Training》阅读笔记

代码原文地址预备知识： 1.什么是束搜索算法（beam search）? beam search是一种用于许多自然语言处理和语音识别模型的算法，作为最终决策层，用于在给定目标变量(如最大概率或下一个输出字符)的情况下选择最佳输出。 2.什么是条件随机场（Conditional Random Fi ......

Pre-Training Transformer Span-Based Extraction Relation更新时间 2024-01-08

AI_NLP以及SAM的理解-分割模型

机器学习一般机器学习分为有监督学习，无监督学习和强化学习无监督学习 Unsupervised Learning Self-Supervised Learning，又称为自监督学习 -Self-Supervised Learning 的核心思想 Masked Autoencoders Are Sc ......

模型 AI_NLP NLP SAM AI更新时间 2024-01-08

[NLP复习笔记] 神经网络及BP算法

1. 神经网络 1.1 神经元神经元（Neuron）或节点（Node）是神经网络的基本单元。下图是一个简单的神经元示意图，\(x\) 表示输入（\(\text{Input}\)）， \(x_i\) 表示来自于前面第 \(i\) 个神经元（\(\text{Neuron}\)）的输入，通常会增加 ......

神经网络算法神经笔记网络更新时间 2024-01-07

[NLP复习笔记] RNN、LSTM

1. RNN 1.1 RNN 简介循环神经网络（\(\text{Recurrent Neural Network}\)，简称 \(\text{RNN}\)）是一种用于处理序列数据的神经网络。其核心思想是使用循环结构来保持一个内部状态，这个状态理论上可以捕获到目前为止的全部信息流。\(\text{R ......

笔记 LSTM NLP RNN更新时间 2024-01-07

[NLP复习笔记] 基于负采样的 Skip-gram 及 SGD 训练公式推导

1. one-hot 向量我们先了解一下 \(\text{one-hot}\) 向量。\(\text{one-hot}\) 编码是表示分类变量的常见方法，尤其在数据预处理和机器学习的特征工程中。一个 \(\text{one-hot}\) 向量是一个其中只有一个元素是 1，其余为 0 的向量。假设 ......

公式 Skip-gram 笔记 Skip gram更新时间 2024-01-06

首次引入大模型!Bert-vits2-Extra中文特化版40秒素材复刻巫师3叶奈法

Bert-vits2项目又更新了，更新了一个新的分支：中文特化，所谓中文特化，即针对中文音色的特殊优化版本，纯中文底模效果百尺竿头更进一步，同时首次引入了大模型，使用国产IDEA-CCNL/Erlangshen-MegatronBert-1.3B大模型作为Bert特征提取，基本上完全解决了发音的ba ......

巫师 Bert-vits 素材模型 Extra更新时间 2024-01-06

[NLP复习笔记] 单词向量表示、余弦相似度以及TF-IDF

1. 单词与向量 1.1 Term-document 矩阵 Term-document 矩阵是信息检索和文本挖掘中常用的一种表示方法，这种矩阵是一个二维表格，用来表示词（term）在文档（document）集合中的分布情况。在这个矩阵中，行通常代表词汇（terms），列代表文档。矩阵中的每一个元素， ......

余弦向量单词笔记 TF-IDF更新时间 2024-01-06

[NLP复习笔记] 朴素贝叶斯分类器

1. 贝叶斯决策论假设有 \(N\) 中类别标记 \(\gamma = \{c_1, c_2, \dots, c_N\}\)，\(\lambda_{ij}\) 是将一个真实标记为 \(c_{j}\) 分类为 \(c_i\) 所产生的损失。基于后验概率 \(P(c | \mathbf{x})\) 可 ......

笔记 NLP更新时间 2024-01-05

ICLR 2022: Anomaly Transformer论文阅读笔记+代码复现

本论文全名为Anomaly Transformer: Time Series Anomaly Detection with Association Descrepancy（通过关联差异进行时序异常检测），主要提出了一种无监督的异常点检测算法，并在6个benchmarks上测试，获取良好结果。论文链 ......

Transformer Anomaly 代码笔记论文更新时间 2024-01-05

[NLP复习笔记] N-gram 及基本平滑方法

1. N-gram 模型 1.1 N-gram 模型介绍 \(\text{N-gram}\) 是一种基于统计语言模型的算法，用于预测文本中的单词，其中 \(\text{N}\) 一般指的是序列中的单词数量。其基本思想是将文本内容进行大小为 \(\text{N}\) 的滑动窗口操作来计算概率。例如： ......

笔记方法 N-gram gram NLP更新时间 2024-01-05

我是学生如何白嫖 GPT4

效果速度巨快，无需同租，没有25/h条消息限制，最重要的是学生免费。 0 你需要拥有的东西一个 Github 学生认证账号（没有请右转进入洛师教育邮箱薅羊毛指南）代理（或许改host也能） 1 获取自己的 Copilot api 进入网站：Get Copilot Token 这一步需要代理， ......

学生 GPT4 GPT更新时间 2024-01-05

概率霍夫变换（Progressive Probabilistic Hough Transform）原理详解

概率霍夫变换（Progressive Probabilistic Hough Transform）的原理很简单，如下所述： 1.随机获取边缘图像上的前景点，映射到极坐标系画曲线； 2.当极坐标系里面有交点达到最小投票数，将该点对应x-y坐标系的直线L找出来； 3.搜索边缘图像上前景点，在直线L上的点 ......

Probabilistic 概率 Progressive Transform 原理更新时间 2024-01-03

5、flink任务中可以使用哪些转换算子（Transformation）

5、flink任务中可以使用哪些转换算子（Transformation） <div id="content_views" class="htmledit_views"> <h1>1、什么是Flink中的转换算子</h1> 在使用 Flink DataStream API 开发流式计算任务时，可以将一 ......

算子 Transformation 任务 flink更新时间 2024-01-03

NLP开源库SentencePiece

SentencePiece：SentencePiece 是一个提供无监督文本标记化和文本编码的库。它的主要特点是可以在字符级别和单词级别之间找到一个平衡，使用所谓的"subword units"作为标记化的单位。这种方法特别适合处理罕见词和词汇变化。SentencePiece 包括两种主要的标记化算 ......

SentencePiece NLP更新时间 2024-01-02

Visual Transformer 与归纳偏置

开端 ViT（Visual Transformer）是 2020 年 Google 团队提出的将 Transformer 应用在图像分类的模型，但是当训练数据集不够大的时候，ViT 的表现通常比同等大小的 ResNets 要差一些。为什么呢？寻找答案的过程中，发现了归纳偏置这个概念。在阅读 ......

Transformer Visual更新时间 2023-12-31

huggingface--bert

按照huggangingface上的说明文档，进行一一学习的 dmis-lab/biobert-v1.1 · Hugging Face BERT (huggingface.co) BertConfig：包含BERT模型所有配置参数的类。它定义了模型的大小，例如隐藏层的数量、注意力头的数量等。 ......

huggingface bert更新时间 2023-12-31

transformers 系列

Attention 注意力机制【1】-入门篇注意力机制【2】- CV中的注意力机制注意力机制【3】-Self Attention 注意力机制【4】-多头注意力机制注意力机制【5】Scaled Dot-Product Attention 和 mask attention 注意力机制【6】-tra ......

transformers更新时间 2023-12-30

Pandas - apply、agg、transform 函数

apply：行或列的操作。 agg：聚合，可以传递字典，对多个列使用不同的函数。最终结果可能会合并，与原 DataFrame 列长度不保持一致。 transform：转换，也可以对多个列使用不同的函数。但是最终结果与原 DataFrame 列长度保持一致，不会聚合。 ......

函数 transform Pandas apply agg更新时间 2023-12-30

Swin Transformer

Swin Transformer 目录Swin Transformer简介VIT的缺陷核心创新总体结构和运作网络细节Patch partitionLinear EmbeddingPatch MergingSwin Block模块W-MSASW-MSAAttention Mask计算成本分析主要优势S ......

Transformer Swin更新时间 2023-12-29

VIT Vision Transformer

VIT Vision Transformer 目录VIT Vision TransformerViT模型结构图像划分PatchLinear Projection of Flatted PatchesPatch+Position Embedding分类向量和位置向量EncoderMLP Head（全连 ......

Transformer Vision VIT更新时间 2023-12-29

DETR基于Transformer目标检测

DETR基于Transformer目标检测目录DETR基于Transformer目标检测DETR网络结构和NLP Transformer对比Object QueryFFN为什么DETR不需要NMS优缺点参考资料 DETR首次将Transformer应用到了目标检测任务中。图像会先经过一个传统的CN ......

Transformer 目标 DETR更新时间 2023-12-29

Bert-vits2最终版Bert-vits2-2.3云端训练和推理(Colab免费GPU算力平台)

对于深度学习初学者来说，JupyterNoteBook的脚本运行形式显然更加友好，依托Python语言的跨平台特性，JupyterNoteBook既可以在本地线下环境运行，也可以在线上服务器上运行。GoogleColab作为免费GPU算力平台的执牛耳者，更是让JupyterNoteBook的脚本运行 ......

Bert-vits Bert vits 云端 Colab更新时间 2023-12-27

共640篇 :1/22页 首页上一页1234下一页尾页