Chinese

Llama2-Chinese项目:1-项目介绍和模型推理

Atom-7B与Llama2间的关系:Atom-7B是基于Llama2进行中文预训练的开源大模型。为什么叫原子呢?因为原子生万物,Llama中文社区希望原子大模型未来可以成为构建AI世界的基础单位。目前社区发布了6个模型,如下所示: FlagAlpha/Atom-7B FlagAlpha/Llama ......
项目 Llama2-Chinese 模型 Chinese Llama2

Llama2-Chinese项目:2.1-Atom-7B预训练

虽然Llama2的预训练数据相对于第一代LLaMA扩大了一倍,但是中文预训练数据的比例依然非常少,仅占0.13%,这也导致了原始Llama2的中文能力较弱。为了能够提升模型的中文能力,可以采用微调和预训练两种路径,其中: 微调需要的算力资源少,能够快速实现一个中文Llama的雏形。但缺点也显而易见, ......
Llama2-Chinese Chinese 项目 Llama2 Llama

Llama2-Chinese项目:2.2-大语言模型词表扩充

因为原生LLaMA对中文的支持很弱,一个中文汉子往往被切分成多个token,因此需要对其进行中文词表扩展。思路通常是在中文语料库上训练一个中文tokenizer模型,然后将中文tokenizer与LLaMA原生tokenizer进行合并,最终得到一个扩展后的tokenizer模型。国内Chinese ......
词表 Llama2-Chinese 模型 Chinese 语言

Llama2-Chinese项目:3.1-全量参数微调

提供LoRA微调和全量参数微调代码,训练数据为data/train_sft.csv,验证数据为data/dev_sft.csv,数据格式如下所示: "<s>Human: "+问题+"\n</s><s>Assistant: "+答案 举个例子,如下所示: <s>Human: 用一句话描述地球为什么是独 ......
Llama2-Chinese 参数 Chinese 项目 Llama2

Llama2-Chinese项目:2.3-预训练使用QA还是Text数据集?

Llama2-Chinese项目给出pretrain的data为QA数据格式,可能会有疑问pretrain不应该是Text数据格式吗?而在Chinese-LLaMA-Alpaca-2和open-llama2预训练使用的LoRA技术,给出pretrain的data为Text数据格式。所以推测应该pre ......
Llama2-Chinese Chinese 还是 项目 数据

Llama2-Chinese项目:2.1-Atom-7B预训练

虽然Llama2的预训练数据相对于第一代LLaMA扩大了一倍,但是中文预训练数据的比例依然非常少,仅占0.13%,这也导致了原始Llama2的中文能力较弱。为了能够提升模型的中文能力,可以采用微调和预训练两种路径,其中: 微调需要的算力资源少,能够快速实现一个中文Llama的雏形。但缺点也显而易见, ......
Llama2-Chinese Chinese 项目 Llama2 Llama

Llama2-Chinese项目:2.2-大语言模型词表扩充

因为原生LLaMA对中文的支持很弱,一个中文汉子往往被切分成多个token,因此需要对其进行中文词表扩展。思路通常是在中文语料库上训练一个中文tokenizer模型,然后将中文tokenizer与LLaMA原生tokenizer进行合并,最终得到一个扩展后的tokenizer模型。国内Chinese ......
词表 Llama2-Chinese 模型 Chinese 语言

Llama2-Chinese项目:1-项目介绍和模型推理

Atom-7B与Llama2间的关系:Atom-7B是基于Llama2进行中文预训练的开源大模型。为什么叫原子呢?因为原子生万物,Llama中文社区希望原子大模型未来可以成为构建AI世界的基础单位。目前社区发布了6个模型,如下所示: FlagAlpha/Atom-7BFlagAlpha/Llama2 ......
项目 Llama2-Chinese 模型 Chinese Llama2

bzoj #3569. DZY Loves Chinese II

https://hydro.ac/d/bzoj/p/3569 实际上,考虑类 tarjan 的过程,从这方面入手能更快地有思路。 考虑先找一棵 dfs 树,那么对于未被删去的树边,我们并不需要管。 若对于一条被删去的树边,那么需要底下能返祖!如果底下返不了祖,那么在这里一定就不连通了。换言之,底下的 ......
Chinese Loves bzoj 3569 DZY

The 17th Chinese Northeast Collegiate Programming Contest

链接:[https://codeforces.com/gym/104366](https://codeforces.com/gym/104366) ## A. Cask Effect ```cpp #include "bits/stdc++.h" using namespace std; using ......

[SQL Server]无法解决 equal to 运算中 "SQL_Latin1_General_CP1_CI_AS" 和 "Chinese_PRC_CI_AS" 之间的排序规则冲突。

错误信息: [SQL Server]无法解决 equal to 运算中 "SQL_Latin1_General_CP1_CI_AS" 和 "Chinese_PRC_CI_AS" 之间的排序规则冲突。 场景: 一个简单的SQL语句,因为团队合作建表时排序方式不同,两个字段无法比较 select mca ......

基于bert-base-chinese训练bert模型(最后附上整体代码)

目录: 一、bert-base-chinese模型下载 二、数据集的介绍 三、完成类的代码 四、写训练方法 五、总源码及源码参考出处 一、bert-base-chinese模型下载 对于已经预训练好的模型bert-base-chinese的下载可以去Hugging face下载,网址是:Huggin ......
bert-base-chinese bert 模型 整体 chinese

发电站乐队歌词全中译 / The Comprehensive Chinese Translation of Kraftwerk Lyrics

# 发电站乐队歌词全中译 / The Comprehensive Chinese Translation of Kraftwerk Lyrics 发电站所有英文版录音室专辑的歌词中文翻译。《The Mix》和《Minimum-Maximum》为重混(remix)或演唱会专辑,故《Expo 2000》 ......

chinese 以前版本

```cpp /* 0.0.0 梦开始的地方 */ #include #include #include using namespace std; int px=10,py=5,ma=0; string jie[100005]={"这是墙壁,你不能通过","这是地面,上面似乎布满了灰尘"}; str ......
chinese 版本

chinese game

# 0.0.0版本震撼来袭 代码: ```cpp #include #include #include using namespace std; int px=10,py=5,ma=0; string jie[100005]={"这是墙壁,你不能通过","这是地面,上面似乎布满了灰尘"}; stri ......
chinese game

Chinese Stories

With the development of China's economy and the improvement of living standards, China has changed a lot . The following I will tell several Chinese S ......
Chinese Stories

实用模型推荐(一)相似度,文本向量化:text2vec-base-chinese

1.开源地址:https://github.com/shibing624/text2vec 2.使用场景:文本相似度计算,文本转指令 3.API封装: import uvicorn from fastapi import FastAPI from loguru import logger from ......

《2001:太空漫游》:Chinese应该如何翻译?

《2001:太空漫游》:彩尼日应该如何翻译? 参考译本:郝明义《2001:太空漫游》,简体版。 译文摘录: 全世界人口已经多达六十亿——其中三分之一在东方国家。 原文: the population of the world was now six billion - a third of them ......
Chinese 2001

Eclipse的Console如何实现中文输出(Eclipse Display Chinese)

最近遇到Eclipse的Console中文输出乱码的问题,现象如下: 在网上找到一些方法,一般均不好用,直到找到“如何在Eclipse控制台中显示汉字”,链接如下 https://www.likecs.com/show-204927969.html 经测试,发现上述描述,选择UTF-8不太行,而选择 ......
Eclipse Console Chinese Display

US firm's official entry into segment to motivate more Chinese peers to join in

Apple Inc's augmented reality headset will help accelerate the development of the AR industrial chain in China, and push the product not only for ente ......
official motivate Chinese segment entry

[论文阅读] SGCE-Font@ Skeleton Guided Channel Expansion for Chinese Font Generation

## Pre title: SGCE-Font: Skeleton Guided Channel Expansion for Chinese Font Generation accepted: Arxiv 2022 paper: https://arxiv.org/abs/2211.14475 co ......
Font Generation SGCE-Font Expansion Skeleton

abc268 C - Chinese Restaurant

C - Chinese Restaurant 算贡献就是在普通思路上交换循环数,或是交换求和符号的2边的个数,来达到优化和解题的目的 对于该题,我刚开始的想法是循环旋转次数,再去查看符合要求的菜的个数,这样是O^2的 于是我们交换循环数,先去循环每个菜,我们发现每个菜实际上只对3个循环次数有贡献,于 ......
Restaurant Chinese abc 268

Chinese Chess Coursework 2

Programming Paradigms 2023: Coursework 21. OverviewThe following files are all provided, they must be downloaded from Moodle:Sample_java.zip // the sa ......
Coursework Chinese Chess

Chinese-LLaMA-Alpaca技术报告

EFFICIENT AND EFFECTIVE TEXT ENCODING FOR CHINESE LL AMA AND ALPACA https://arxiv.org/pdf/2304.08177v1.pdf https://github.com/ymcui/Chinese-LLaMA-Alpa ......

AtCoder ABC286 C - Chinese Restaurant

AtCoder ABC286 C - Chinese Restaurant 题目描述 有 $N$ 个人从 $0$ 开始编号, 按逆时针顺序间隔均匀地坐在转盘周围。 在开始时, 第 $p_i$ 盘菜在第 $i$ 个人的前面。 现在, 你可以进行以下操作 $0$ 次或多次。 将转盘逆时针旋转 $\dfr ......
Restaurant AtCoder Chinese ABC 286
共55篇  :2/2页 首页上一页2下一页尾页