Roberta

在灾难推文分析场景上比较用 LoRA 微调 Roberta、Llama 2 和 Mistral 的过程及表现

引言自然语言处理 (NLP) 领域的进展日新月异，你方唱罢我登场。因此，在实际场景中，针对特定的任务，我们经常需要对不同的语言模型进行比较，以寻找最适合的模型。本文主要比较 3 个模型: RoBERTa、Mistral-7B 及 Llama-2-7B。我们用它们来解决一个常见问题 —— 对灾难相关 ......

灾难场景过程 Roberta Mistral更新时间 2023-12-21

HuggingFace | 使用Roberta训练一个牛客网讨论贴文本分类模型

**训练一个NLU模型** 本文将使用trainer 训练一个牛客网讨论帖文本分类模型。详细过程如下： #### 构建数据集数据集下载链接： [train data](https://github.com/chadqiu/newcoder-crawler/blob/main/train.csv) ......

HuggingFace 模型文本 Roberta更新时间 2023-07-30

Bertviz: 在Transformer模型中可视化注意力的工具（BERT，GPT-2，Albert，XLNet，RoBERTa，CTRL，etc.)

BertViz BertViz是一个在Transformer模型中可视化注意力的工具，支持transformers库中的所有模型（BERT，GPT-2，XLNet，RoBERTa，XLM，CTRL等）。它扩展了Llion Jones的Tensor2Tensor可视化工具和HuggingFace的tr ......

Transformer 注意力模型 Bertviz RoBERTa更新时间 2023-06-26

Bert变体--Roberta

Roberta 论文地址：https://arxiv.org/pdf/1907.11692.pdf Static vs. Dynamic Masking Roberta使用动态Mask。 Bert在预处理训练数据时，每个样本会进行一次随机的mask，后续的每个训练步都采用这次mask，实际上就是每个 ......

变体 Roberta Bert更新时间 2023-04-17

共4篇 :1/1页 首页上一页1下一页尾页

526互联

Roberta

在灾难推文分析场景上比较用 LoRA 微调 Roberta、Llama 2 和 Mistral 的过程及表现

HuggingFace | 使用Roberta训练一个牛客网讨论贴文本分类模型

Bertviz: 在Transformer模型中可视化注意力的工具（BERT，GPT-2，Albert，XLNet，RoBERTa，CTRL，etc.)

Bert变体--Roberta