chinese loves bzoj 3569

CF1883D In Love

思路 如果每一次加或者删一个区间,再去暴力找有没有互不相交的区间的话,铁定 TLE。 那么,我们考虑维护有多少对互不相交的区间,那么每次加或者删一个区间,就去算这个区间对答案的贡献,然后再看答案是否为 \(0\) 即可快速判断有没有互不相交的区间。 现在考虑如何计算一个新加入或者删去的区间能让互不相 ......
1883D 1883 Love CF In

CF1523D Love-Hate 题解

抽象化题意: 一共有 \(m\) 个元素,给定 \(n\) 个集合,每个集合的元素不超过 \(15\) 个,求出一个元素个数最多的集合 \(S\) 是至少 \(\lceil \dfrac{n}{2} \rceil\) 个集合的子集。 其中$ p $ $ (1 \le n \le 2 \cdot 10 ......
题解 Love-Hate 1523D 1523 Love

[CISCN 2019 初赛]Love Math

原理 解题过程 首先进入靶场,有代码让我们审计 <?php error_reporting(0); //听说你很喜欢数学,不知道你是否爱它胜过爱flag if(!isset($_GET['c'])){ show_source(__FILE__); //如果没有传递c,则高亮显示代码 }else{ / ......
初赛 CISCN 2019 Love Math

[CF444E] DZY Loves Planting

DZY Loves Planting 逆天题。 想到二分,判断用网络流,但是好像 n 有点大。 我们想尽量让每个点的 g 能大于下界,所以我们尽量往大的边走,其实就是尽量不走小的边。 所以考虑将边从小到大排序,每次合并两端的连通块,如果剩下点的 x 总和小于总点数就只能内部消化。 又因为这已经是最劣 ......
Planting Loves 444E 444 DZY

关于英语的语言规范问题——美式英语、英式英语和Chinese English到底哪个才是正宗

因为日常生成生活中总是会使用英语进行阅读、写作、学习和交流表达,由于小的时候是学传统正宗英语(英式英语),后来长大后因为美国实力强又开始学这个时候的正宗英语(美式英语),但是由于个人的能力问题(农村娃长大的,英语这东西没有学习环境)最后美式英语和英式英语都没有学明白,最后就学了个中式英语。 ......
Chinese English 语言 问题

「BZOJ2505」tickets 题解

preface 网上目前还没看到我的方法,就大概讲一下做法 solution 首先想到贪心,考虑 \([l, r]\) 的最大次数,一定是找到最小的 \(x\) 满足 \(l \sim x\) 的位数的和大于等于 \(k\),然后递归的求解 \([x + 1, r]\),易证。 还是考虑将 \(Qu ......
题解 tickets BZOJ 2505

CF553C Love Triangles

很有意思的一个题,想了一会才发现解题的关键 首先我们注意到对于某个大小\(\ge 3\)的连通块,其实连通块内的所有边的颜色都会被已知的边唯一确定 而不同的连通块间的连边方式有两种,因此设连通块个数为\(tot\),最后的答案就是\(2^{tot-1}\) 但还要考虑判掉不合法的情况,注意到不管是\ ......
Triangles 553C Love 553 CF

P9290 Luna likes Love 题解

原题:[洛谷P9310]([P9310 EGOI2021] Luna likes Love / 卢娜爱磕 cp - 洛谷 | 计算机科学教育新生态 (luogu.com.cn)) 题目大意 给定一个长度为 \(\large 2n(n\leq 10^5)\) 的序列,序列中 \(\large 1\si ......
题解 P9290 likes 9290 Luna

【读论文】CM-Gen: A Neural Framework for Chinese Metaphor Generation with Explicit Context Modelling

为了更好的阅读体验,请点击这里 由于发不出论文,所以找点冷门方向做一做。从汉语比喻开始。 读完这篇论文之后我觉得 COLING 这方向我上我也行(ε=ε=ε=┏(゜ロ゜;)┛ 题目:CM-Gen: A Neural Framework for Chinese Metaphor Generation ......

pip 手动安装 jieba包 | [babyllama2-chinese]

在复现 babyllama2-chinese 项目时,jieba 无论是用 pip 还是 conda 进行安装都会报错,遂尝试手动安装,步骤如下: 先参考一篇博客 以及我自己的博客:conda、pip从本地安装包 我直接进入pip官网: https://pypi.org 搜索jieba包 这里需要注 ......

【babyllama2-chinese】项目 | 环境配置

所用计算节点: 中科曙光 异构节点-4D1-2 单节点: 每个节点是32核 128G 4张dcu卡,dcu卡显存每张16G 作业调度系统: slrum requirements.txt: 自动安装 使用 pip install -r requirements.txt 报错,遂尝试手动安装所有包 手动 ......

开启中文智能之旅:探秘超乎想象的 Llama2-Chinese 大模型世界

“开启中文智能之旅:探秘超乎想象的 Llama2-Chinese 大模型世界” 1.国内Llama2最新下载地址 本仓库中的代码示例主要是基于Hugging Face版本参数进行调用,我们提供了脚本将Meta官网发布的模型参数转换为Hugging Face支持的格式,可以直接通过transforme ......
Llama2-Chinese 模型 Chinese 之旅 智能

CF1878F Vasilije Loves Number Theory

CF1878F Vasilije Loves Number Theory 首先约数个数是积性函数,题目中要求 \(\gcd(n,a)=1\),所以 \(a\) 和 \(n\) 互质,\(n=d(a)d(n)\) ,于是问题转化为 \(n\) 是否整除 \(d(n)\)。 观察题目,\(n\) 可能会 ......
Vasilije Number Theory 1878F Loves

Chinese-Text-Classification-PyTorch

Chinese-Text-Classification Github项目地址: https://github.com/JackHCC/Chinese-Text-Classification-PyTorch 作者:JackHCC 链接:https://www.jianshu.com/p/9438fd0 ......

LLM实践-在Colab上使用免费T4 GPU进行Chinese-Llama-2-7b-4bit推理

一、配置环境 1、打开colab,创建一个空白notebook,在[修改运行时环境]中选择15GB显存的T4 GPU. 2、pip安装依赖python包 !pip install --upgrade accelerate !pip install bitsandbytes transformers_ ......
Chinese-Llama Chinese Colab Llama 4bit

Llama2-Chinese项目:8-TRL资料整理

TRL(Transformer Reinforcement Learning)是一个使用强化学习来训练Transformer语言模型和Stable Diffusion模型的Python类库工具集,听上去很抽象,但如果说主要是做SFT(Supervised Fine-tuning)、RM(Reward ......
Llama2-Chinese Chinese 项目 Llama2 资料

Llama2-Chinese项目:7-外延能力LangChain集成

本文介绍了Llama2模型集成LangChain框架的具体实现,这样可更方便地基于Llama2开发文档检索、问答机器人和智能体应用等。 1.调用Llama2类 针对LangChain[1]框架封装的Llama2 LLM类见examples/llama2_for_langchain.py,调用代码如下 ......

Llama2-Chinese项目:4-量化模型

一.量化模型调用方式 下面是一个调用FlagAlpha/Llama2-Chinese-13b-Chat[1]的4bit压缩版本FlagAlpha/Llama2-Chinese-13b-Chat-4bit[2]的例子: from transformers import AutoTokenizerfro ......
Llama2-Chinese 模型 Chinese 项目 Llama2

Llama2-Chinese项目:5-推理加速

随着大模型参数规模的不断增长,在有限的算力资源下,提升模型的推理速度逐渐变为一个重要的研究方向。常用的推理加速框架包含lmdeploy、FasterTransformer和vLLM等。 一.lmdeploy推理部署 lmdeploy由上海人工智能实验室开发,推理使用C++/CUDA,对外提供pyth ......
Llama2-Chinese Chinese 项目 Llama2 Llama

Llama2-Chinese项目:6-模型评测

测试问题筛选自AtomBulb[1],共95个测试问题,包含:通用知识、语言理解、创作能力、逻辑推理、代码编程、工作技能、使用工具、人格特征八个大的类别。 1.测试中的Prompt 例如对于问题"列出5种可以改善睡眠质量的方法",如下所示: [INST] <<SYS>>You are a helpf ......
Llama2-Chinese 模型 Chinese 项目 Llama2

Llama2-Chinese项目:3.2-LoRA微调和模型量化

提供LoRA微调和全量参数微调代码,训练数据为data/train_sft.csv,验证数据为data/dev_sft.csv,数据格式为"<s>Human: "+问题+"\n</s><s>Assistant: "+答案。本文主要介绍Llama-2-7b模型LoRA微调以及4bit量化的实践过程。 ......
Llama2-Chinese 模型 Chinese 项目 Llama2

Llama2-Chinese项目:2.3-预训练使用QA还是Text数据集?

Llama2-Chinese项目给出pretrain的data为QA数据格式,可能会有疑问pretrain不应该是Text数据格式吗?而在Chinese-LLaMA-Alpaca-2和open-llama2预训练使用的LoRA技术,给出pretrain的data为Text数据格式。所以推测应该pre ......
Llama2-Chinese Chinese 还是 项目 数据

Llama2-Chinese项目:3.1-全量参数微调

提供LoRA微调和全量参数微调代码,训练数据为data/train_sft.csv,验证数据为data/dev_sft.csv,数据格式如下所示: "<s>Human: "+问题+"\n</s><s>Assistant: "+答案 举个例子,如下所示: <s>Human: 用一句话描述地球为什么是独 ......
Llama2-Chinese 参数 Chinese 项目 Llama2

Llama2-Chinese项目:1-项目介绍和模型推理

Atom-7B与Llama2间的关系:Atom-7B是基于Llama2进行中文预训练的开源大模型。为什么叫原子呢?因为原子生万物,Llama中文社区希望原子大模型未来可以成为构建AI世界的基础单位。目前社区发布了6个模型,如下所示: FlagAlpha/Atom-7B FlagAlpha/Llama ......
项目 Llama2-Chinese 模型 Chinese Llama2

Llama2-Chinese项目:2.1-Atom-7B预训练

虽然Llama2的预训练数据相对于第一代LLaMA扩大了一倍,但是中文预训练数据的比例依然非常少,仅占0.13%,这也导致了原始Llama2的中文能力较弱。为了能够提升模型的中文能力,可以采用微调和预训练两种路径,其中: 微调需要的算力资源少,能够快速实现一个中文Llama的雏形。但缺点也显而易见, ......
Llama2-Chinese Chinese 项目 Llama2 Llama

Llama2-Chinese项目:2.2-大语言模型词表扩充

因为原生LLaMA对中文的支持很弱,一个中文汉子往往被切分成多个token,因此需要对其进行中文词表扩展。思路通常是在中文语料库上训练一个中文tokenizer模型,然后将中文tokenizer与LLaMA原生tokenizer进行合并,最终得到一个扩展后的tokenizer模型。国内Chinese ......
词表 Llama2-Chinese 模型 Chinese 语言

Llama2-Chinese项目:3.1-全量参数微调

提供LoRA微调和全量参数微调代码,训练数据为data/train_sft.csv,验证数据为data/dev_sft.csv,数据格式如下所示: "<s>Human: "+问题+"\n</s><s>Assistant: "+答案 举个例子,如下所示: <s>Human: 用一句话描述地球为什么是独 ......
Llama2-Chinese 参数 Chinese 项目 Llama2

P5047 [Ynoi2019 模拟赛] Yuno loves sqrt technology II 题解

Description 给你一个长为 \(n\) 的排列,\(m\) 次询问,每次查询一个区间的逆序对数,强制在线。 link \(1\leq n,m\leq 10^5\)。 Solution 考虑分块。 首先如果 \(l,r\) 在同一个块内,可以对于每个块暴力二维前缀和预处理。 如果 \(l,r ......
模拟赛 题解 technology P5047 loves

F. Vasilije Loves Number Theory

F. Vasilije Loves Number Theory 前提知识:d(n)表示数字n的正约数个数,gcd(a,b)表示a,b两者的最大公约数 要点:问是否存在a,使得d(a * n)=n,gcd(n,a)=1,意思是n与a互质, 则可得,d(a * n)=d(a)*d(n)=n 则问题转化成 ......
Vasilije Number Theory Loves

bzoj#4551. [Tjoi2016&Heoi2016]树

原题(需要魔法) 原题(不需魔法) 强制在线做法 \(O(n \log n)\) 考虑每一次标记点:只会影响其子树中的点 所以使用DFS序+线段树就可以辣! 离线做法 \(O(n \log n)\) 考虑将每一次标记的时间记录到点上 然后使用倍增 \(LCA\) 的思想向上倍增 离线做法 \(O(n ......
2016 bzoj 4551 Tjoi Heoi