随想录 训练营 序列 随想

使用单卡v100 32g或更低显存的卡,使用peft工具qlora或lora混合精度训练大模型chatGLM2-6b,torch混合精度加速稳定训练,解决qlora loss变成nan的问题!

最近新换了工作,以后的工作内容会和大模型相关,所以先抽空跑了一下chatGLM2-6b的demo,使用Qlora或lora微调模型 今天简单写个文档记录一下,顺便也是一个简单的教程,并且踩了qlora loss变成nan训练不稳定的问题 本教程并没有写lora的原理,需要的话自行查阅 1.chatG ......
精度 qlora 显存 的卡 chatGLM2

NativeBuffering,一种高性能、零内存分配的序列化解决方案[性能测试篇]

第一版的NativeBuffering([上篇]、[下篇])发布之后,我又对它作了多轮迭代,对性能作了较大的优化。比如确保所有类型的数据都是内存对齐的,内部采用了池化机器确保真正的“零内存分配”等。对于字典类型的数据成员,原来只是“表现得像个字段”,这次真正使用一段连续的内存构架了一个“哈希表”。我... ......

2023牛客暑期多校训练营8 B Bloodline Counter 指数型生成函数 容斥 多项式求逆

传送门 容易想到求出竞赛图上最大环\(\le k\)的数量,再求出\(\le k-1\)的数量作差即可得到答案。 设指数型生成函数\(G(x)\)表示大小为\(i\)的环的方案数。 \(G(x)=\sum_{i=1}^k\frac{a_i}{i!}x^i\) 那么最大环\(\le k\)的数量\(= ......
多项式 训练营 函数 Bloodline 指数

代码随想录----做题篇

ABOUT 只做题,想思路 二分法 思路:两端的平均数跟要找的值对比,小了就缩小左边区间,大了就缩小右边区间,然后再次求两端的平均数,小了就缩小左边区间,大了就缩小右边区间,最终到达循环结束 对比加缩小区间,写法很简单 if (nums[mid] > target){ right = mid; } ......
随想录 随想 代码

解题报告 P2572 [SCOI2010] 序列操作

P2572 [SCOI2010] 序列操作 线段树。 首先对于一个区间,我们需要存储 \(8\) 个量来保证算出答案:\(1\) 的个数,\(0\) 的个数,最左边连续 \(1/0\) 个数,最右边连续 \(1/0\) 个数,区间内最长连续 \(1/0\) 个数。 可以如下定义一个节点: struc ......
序列 报告 P2572 2572 2010

洛谷 P2290 [HNOI2004] 树的计数(Prufer序列,Cayley 公式)

传送门 解题思路 关于Prufer序列的构造,见OI-wiki 这里直接放结论: 一个Prufer序列与一个无根树一一对应 度数为 \(d_i\) 的节点在序列中出现了 \(d_i-1\) 次 \(\sum(d_i-1)=n-2\) n个点的完全图的生成树有 \(n^{n-2}\) 种 所以相当于 ......
序列 公式 Cayley Prufer P2290

训练集、验证集、测试集和交叉验证

1.训练集和测试集 测试集:检验学习到的模型好坏 训练集:用于学习模型 2.训练集、验证集和测试集 问题:当可选择的模型有多个和模型中超参数有多种选择方案时怎么选择? 解决:验证集:从原来的训练集中划一部分用于选择模型和超参数 根据验证集确定的模型和超参数,再使用训练集+验证集一起训练模型的参数 3 ......

代码随想训练营第二十二天(Python)| 235. 二叉搜索树的最近公共祖先、701.二叉搜索树中的插入操作、450.删除二叉搜索树中的节点

235. 二叉搜索树的最近公共祖先 关键点:最近公共祖先的判断,二叉树的特性 1、做二叉树的模式 class Solution: def lowestCommonAncestor(self, root: 'TreeNode', p: 'TreeNode', q: 'TreeNode') -> 'Tr ......
训练营 节点 祖先 随想 代码

常见编程语言的json序列化与序列化代码片段(java/python/js/c#/ruby/c++)

json序列化与反序列化 Python import json # 序列化为 JSON data = {"name": "John", "age": 30} serialized_data = json.dumps(data) # 反序列化 JSON deserialized_data = json ......
序列 编程语言 片段 常见 语言

Go 进阶训练营对标字节跳动2-2级能力模型,实践驱动掌握云计算第一语言

最近整理了下收集的Go学习资料,包含了Go学习社区、入门、进阶、性能优化、面试和Go学习书籍,还是比较全面的,在这里推荐给大家。 废话不多说,先献上Go技能升级地图,自己照着地图修炼 Go学习社区 Golang 中国:国内较早的 Go 社区,汇聚各类信息与服务 Learn Go:比较好的Golang ......
训练营 字节 模型 能力 Go

2023牛客暑期多校训练营7 K-Set 二进制拆位 前缀和

传送门 给出一个\(n\)个数的集合,定义任意一个子集S的价值为\(|S|\cdot max\cdot min\cdot(\bigoplus_{x\in S}a_x)\) 显然可以先将\(\{a_i\}\)进行由小到大的排序。 先考虑只有一个数字的情况答案为\(\sum a_i^3\) 考虑枚举\( ......
前缀 二进制 训练营 K-Set 2023

基于LSTM深度学习网络的时间序列分析matlab仿真

1.算法运行效果图预览 2.算法运行软件版本 matlab2022a 3.算法理论概述 LSTM是一种循环神经网络(RNN)的变体,专门设计用于处理序列数据。LSTM网络通过记忆单元和门控机制来捕捉时间序列中的长期依赖关系,避免了传统RNN中的梯度消失问题。LSTM的核心原理包括三种门控:输入门(i ......

序列化组件对数据的增删改查

序列化组件对数据的增删改查 1 写一个序列化的类,继承Serializer 2 在类中写要反序列化的字段,想反序列化哪个字段,就在类中写哪个字段,字段的属性(max_lenth......) max_length 最大长度 min_lenght 最小长度 allow_blank 是否允许为空 tri ......
序列 组件 数据

代码随想录第七天 | 454.四数相加II 383. 赎金信 15. 三数之和 18. 四数之和

07:04:26 第一题:https://leetcode.cn/problems/4sum-ii/ 早上起来人不清醒,模模糊糊过掉了,晚上再重新复习一下 关键是这串 for a in nums3: for b in nums4: wow_sum = -(a + b) if wow_sum in h ......
之和 随想录 随想 代码 454

python、R语言ARIMA-GARCH分析南方恒生中国企业ETF基金净值时间序列分析

全文链接:https://tecdat.cn/?p=34123 原文出处:拓端数据部落公众号 分析师:Yuyan Wang 虽然中国股票市场日益完善,但还不完全是弱有效市场,因此中国股票市场存在比较明显的通过技术分析达到的套利机会。 解决方案 任务/目标 根据基金净值的要求,运用多种模型分析实现股票 ......

代码随想训练营第二十一天(Python)| 530.二叉搜索树的最小绝对差、501.二叉搜索树中的众数、236. 二叉树的最近公共祖先

二叉搜素树,利用中序遍历的升序结果 530.二叉搜索树的最小绝对差 1、递归中序遍历 class Solution: def __init__(self): self.pre = None self.res = float('inf') def getMinimumDifference(self, ......
训练营 祖先 随想 代码 Python

多模态对比语言图像预训练CLIP:打破语言与视觉的界限

多模态对比语言图像预训练CLIP:打破语言与视觉的界限 一种基于多模态(图像、文本)对比训练的神经网络。它可以在给定图像的情况下,使用自然语言来预测最相关的文本片段,而无需为特定任务进行优化。CLIP的设计类似于GPT-2和GPT-3,具备出色的零射击能力,可以应用于多种多模态任务。 多模态对比语言 ......
模态 语言 界限 图像 视觉

3.最长连续序列

题目概述:给定一个无序数组,问这个数组的元素能够组成的连续数组的最长长度为多少。 解题思路:很明显,我们需要对该数组先进行排序处理。我一开始用的是双指针,第一个指针枚举起点,第二个指针枚举该起点能够到达的最右边的距离,WA了。因为该数组有重复元素。(其实只要使用set去个重,这种方法就能AC了,不过 ......
序列

利用一段字节序列构建一个数组对象

《.NET中的数组在内存中如何布局? 》介绍了一个.NET下针对数组对象的内存布局。既然我们知道了内存布局,我们自然可以按照这个布局规则创建一段字节序列来表示一个数组对象。 ......
数组 序列 字节 对象

基于GRU门控循环网络的时间序列预测matlab仿真,对比LSTM网络

1.算法运行效果图预览 LSTM: GRU 2.算法运行软件版本 matlab2022a 3.算法理论概述 门控循环单元(Gated Recurrent Unit,简称GRU)是一种用于序列建模和预测的递归神经网络(RNN)变体。GRU通过引入门控机制,克服了传统RNN在处理长序列时的梯度消失问题, ......
时间序列 网络 序列 时间 matlab

代码随想录训练营第二十天打卡(Python)| 654.最大二叉树 、617.合并二叉树 、700.二叉搜索树中的搜索 、98.验证二叉搜索树

654.最大二叉树 1、使用切片 class Solution: def constructMaximumBinaryTree(self, nums: List[int]) -> Optional[TreeNode]: if len(nums) == 0: return None max_val = ......
随想录 训练营 随想 代码 Python

代码随性训练营第十八天(Python)| 513.找树左下角的值、112. 路径总和1、0113.路径总和-ii、106.从中序与后序遍历序列构造二叉树

513.找树左下角的值 1、层序遍历迭代法 def findBottomLeftValue(self, root: Optional[TreeNode]) -> int: queue = [root] res = float('-inf') while queue: n = len(queue) f ......
总和 路径 训练营 序列 从中

YOLOv8跑训练和预测

1.在GitHub上下载YOLOv8源码和预训练模型 源码:https://github.com/Ahqiu1/YOLO-v8 预训练模型:https://github.com/ultralytics/assets/releases/download/v0.0.0/yolov8n.pt 2.配置YO ......
YOLOv8 YOLOv

.NET 反序列化 GetterSettingsPropertyValue 攻击链

0x01 链路1 SettingsPropertyValue SettingsPropertyValue位于命名空间 System.Configuration,用于应用程序存储和检索设置的值,此类具有Name、IsDirty、Deserialized、PropertyValue、Serialized ......
GetterSettingsPropertyValue 序列 NET

学不会的动态规划——子序列篇

前言 感觉摆烂好久了,其实好像也没有摆烂,只是没有学新东西了,之前打算死磕网络流的,但是感觉对我们队目前来说用处不大,就算南京站真的出了,99.9999%的概率写不来,所以就去练思维了。但是好像也并没有怎么练到,被大量的作业绑架了呜呜呜QAQ。感觉dp方面还是太弱了,最后挣扎一下。 一些概念 最长上 ......
序列 动态

代码随性训练营第十七天(Python)| 110.平衡二叉树、257. 二叉树的所有路径、404.左叶子之和

110.平衡二叉树 1、递归法 class Solution: def isBalanced(self, root: Optional[TreeNode]) -> bool: if self.get_height(root) != -1: # -1 代表高度差大于 1 return True els ......
之和 训练营 路径 叶子 代码

P4309 [TJOI2013] 最长上升子序列题解

P4309 [TJOI2013] 最长上升子序列题解 正文 单调队列?单调锤子队列!! 本题的操作可以省略成: 单点修改 区间查询 好极了,此时我们有两种选择: 线段树和树状数组,(平衡树,真不会,下一位 因为不需要其他操作,所以我们还是选择更小巧更可爱的树状数组吧。 关于vector vector ......
题解 序列 P4309 4309 2013

批量修改Fasta文件中序列的名称

比如一个Fasta文件的内容如下: seq001|aaa ATCGGGG seq002|bbb AAAATTTT 删除序列名称中“|”后的内容,只保留seq001, seq002这样的名称 点击查看代码 #!/usr/bin/env python import sys import pysam wi ......
序列 名称 文件 Fasta

20231029NOIP训练赛

20231029NOIP训练赛 时间安排 7:50-9:10 写T1 9:10-10:10写T2 10:10-11:20写T3 11:20-11:50写T4 总结 T1看了一个多小时不会做,导致T4没写完 题解 T1 发现每一个操作在差分数组里只是交换两个数的位置,于是如果两个数组的差分数组排序后相 ......
20231029 NOIP

20231028NOIP训练赛

20231028NOIP训练赛 时间安排 7:50-8:20 写T1 8:20-9:20写T2 9:20-10:20写T4 10:20-11:50写T4 总结 题解 T1 模拟题,按照题意二分模拟即可 T2 DP题,设\(f_{i,j}\)表示前i个笔画为奇数的字中有j个出现了偶数次,\(g_{i, ......
20231028 NOIP