随想录 训练营 九天 随想

算法训练day27 回溯算法概述、LeetCode77

算法训练day27 回溯算法概述、LeetCode77. 回溯算法 与递归函数联系,是一种纯暴力搜索方式 解决问题(抽象为树形结构 组合问题(无序 切割问题 子集问题 排列问题(有序 棋盘问题(n皇后、解数独 回溯算法模板 void backtracking(参数) { if (终止条件) { 存放 ......
算法 LeetCode day 27 77

关于训练集、验证集、测试集的理解

我们在一般深度学习的实验中,经常使用到的是训练集和测试集。训练集自不必说,是用来训练网络参数的,如网络权重W,b。要进行区分的是验证集和测试集。验证集的作用是用来调整超参数,如网络层数、学习率等等。而测试集是用来测试你所训练的网络(包括网络参数和超参数)的效果。之所以不能用测试集来修改超参数,是因为 ......

【高级学校算法】5.神经网络训练

TensorFlow实现 TensorFlow框架 神经网络训练的过程 准备数据集 定义模型 训练模型 评估模型 使用模型 实现详情 定义模型Dense:指定输入、输出和参数模型 model = tf.keras.Sequential([ tf.keras.layers.Dense(1, input ......
神经网络 算法 神经 学校 网络

国庆训练记录

教练要求的,于是就写了写 9.30 vp 了 22 年的绵阳站 开场看了 A ,看到 dota 背景以为是个签到题,于是大胆猜了一个结论然后成功 wa 了一发。 然后 zcw 看到 C 是个签到,快速过了。 我暂时放下 A 和 tyf 去看 G,然后我听完题面反应过来最多执行 log 次,于是交给 ......
国庆

神经网络训练时,为什么loss值不稳定,测试集准确率上下浮动?

神经网络训练时,为什么loss值不稳定,测试集准确率上下浮动? https://www.zhihu.com/question/600770126/answer/3027268624 神经网络训练时,loss值 不稳定往往是由于以下几个原因: 1. 数据集的噪声和不确定性会导致训练时的随机性 ,从而导 ......
神经网络 准确率 上下 神经 网络

2023 年 10 月训练记录

训练记录 10 月了。 CF457F An easy problem about trees 尝试理解。 我们不妨先二分答案,将 \(\ge mid\) 的设为 \(1\),\(<mid\) 的设为 \(0\),于是问题转化为了权值均为 \(0/1\) 的版本。 我们称一棵树的大小为其非叶节点数。 ......
2023 10

笨办法学Python3 习题25 更多更多的训练

练习内容: 将ex25模块导入 在终端中手动运行函数 查看变化结果 退出quit() 1 def break_words(stuff): 2 "用来分割参数元素" 3 words = stuff.split(' ') 4 return words 5 6 def sort_words(words): ......
更多 习题 Python3 办法 Python

南昌航空大学2023级新生训练题集7-49吉良吉影不上班

7-49 吉良吉影不上班 Problem 吉良吉影是一个普通的上班族,他从上司哪里得知他接下来有n天的工作期,由于连续的工作会让员工的效率底下,所以公司觉的吉良吉影可以在与n互质的日子里请假,吉良吉影想知道自己有几天假期,你能尽快告诉他吗?(毕竟你家的门把手已经被杀手皇后摸过了)。 注:应该是“那里 ......
新生 航空 大学 2023 49

南昌航空大学2023级新生训练题集7-50我爱全排类

7-50 我爱全排类 Problem 藤原书记正在做一个简单的数学题,给出一个数字n,题目希望藤原书记输出从大写字母A开始的n个字母的全排列,可爱的藤原书记希望你来帮他完成 输入格式 输入数字n(n<=9) 输出格式 输出从大写字母A开始的n个字母的全排列(按字典序顺序输出) 输入样例 在这里给出一 ......
新生 航空 我爱 大学 2023

SS秋季训练3

training A source : AT_arc154_c 不同的元素个数减少,将 \(b\) 按权值连续段分段,有一段长度超过 \(2\) 就可以“旋转”。枚举 \(a\) 每个对应位置。 B source : AT_arc160_c 两个合成一个等价于“进位”,顺序无关,从低往高做dp,\( ......

深度学习中对多个目标标签进行训练和预测代码实例

#Tensofrlow #假设我们有一个任务是从图像中预测物体的位置(x坐标和y坐标)和物体的类别。这个任务有三个目标标签:x坐标、y坐标和类别。 import numpy as np import tensorflow as tf from tensorflow import keras from ......
实例 深度 多个 目标 代码

大语言模型LLM推理及训练显存计算方法

一、推理:显存计算 推理的显存大头就是:参数量,参数类型版本一般有以下四种: float 32位 浮点数 4 字节 half / BF16 16位 浮点数 2 字节 int8 8位 整数 1 字节 int4 4位 整数 0.5 字节 以 7B-BF16 版本为例,需要显存 = 数量 * 类型大小 = ......
显存 模型 语言 方法 LLM

算法训练day23 LeetCode669.108.538.

算法训练day23 LeetCode669.108.538. 669.修剪二叉搜索树 题目 669. 修剪二叉搜索树 - 力扣(LeetCode) 题解 代码随想录 (programmercarl.com) 递归 不能单纯地由根节点的值直接删除单值,需要继续判断子节点是否符合条件 class Sol ......
算法 LeetCode day 108 669

Llama2-Chinese项目:2.3-预训练使用QA还是Text数据集?

Llama2-Chinese项目给出pretrain的data为QA数据格式,可能会有疑问pretrain不应该是Text数据格式吗?而在Chinese-LLaMA-Alpaca-2和open-llama2预训练使用的LoRA技术,给出pretrain的data为Text数据格式。所以推测应该pre ......
Llama2-Chinese Chinese 还是 项目 数据

Llama2-Chinese项目:2.1-Atom-7B预训练

虽然Llama2的预训练数据相对于第一代LLaMA扩大了一倍,但是中文预训练数据的比例依然非常少,仅占0.13%,这也导致了原始Llama2的中文能力较弱。为了能够提升模型的中文能力,可以采用微调和预训练两种路径,其中: 微调需要的算力资源少,能够快速实现一个中文Llama的雏形。但缺点也显而易见, ......
Llama2-Chinese Chinese 项目 Llama2 Llama

LongLoRA:不需要大量计算资源的情况下增强了预训练语言模型的上下文能力

麻省理工学院和香港中文大学推出了LongLoRA,这是一种革命性的微调方法,可以在不需要大量计算资源的情况下提高大量预训练语言模型的上下文能力。 LongLoRA是一种新方法,它使改进大型语言计算机程序变得更容易,成本更低。训练LLM往往需要大量信息和花费大量的时间和计算机能力。使用大量数据(上下文 ......
上下文 LongLoRA 模型 上下 能力

《看了受制了》第二十九天,7道题,合计148道题

2023年9月28日 好尴尬啊,好尴尬啊,怎么就想不到呢?今天的C、D思路都是来源于知乎大佬。 【 >此篇博客解析< 】 Acwing1275 最大数 题目理解 线段树,板子题。但是需要转化!! 每次添加一个数,看作在flag + 1的位置上,修改一个数 然后query是求l 到 flag的最大值 ......
九天 148

国家智能网联汽车创新中心自动驾驶操作系统训练营第二期开始啦,欢迎报名参加!

自动驾驶OS开发训练营是国家智能网联汽车创新中心发起的技术培训项目,旨在为在校大学生和智能汽车领域工作人员提供专业的自动驾驶操作系统开发技能和知识。 培训课程涵盖三个阶段,初阶实现驱动开发,中阶完成OS移植适配,终阶面向自动驾驶场景应用。 初阶训练营历时约4周,旨在让学员初步掌理解自动驾驶知识,掌握 ......
训练营 智能 国家 汽车 系统

GLM大模型训练

ChatGPTBook/LLMFTProj Name Last commit message Last commit date parent directory .. ChatGLM-6B (Directory) update code 3 months ago data (Directory) u ......
模型 GLM

随想录Day8|344. 反转字符串、541. 反转字符串Ⅱ、LCR 122. 路径加密、151. 反转字符串里的单词、LCR182. 动态口令

随想录Day8|344. 反转字符串、541. 反转字符串Ⅱ、LCR 122. 路径加密、151. 反转字符串里的单词、LCR182. 动态口令 题目越来越长了…… 344. 反转字符串 文章&视频讲解 编写一个函数,其作用是将输入的字符串反转过来。输入字符串以字符数组 s 的形式给出。 不要给另外 ......
字符串 字符 随想录 口令 随想

尝试用ColabPro训练深度学习模型

Colab中使用.ipynb文件,即我们平时使用的Jupyter Notebook文件来完成相关代码的执行。如果要训练模型,需要将模型封装成可以经过ipynb文件执行的形式。 在具体的运行时类型中,可以选择不同的运行时,其中包含了可选的GPU和CPU。GPU中有V100、A100、T4这几种可以选择 ......
深度 ColabPro 模型

深度学习 学习与训练中遇到的问题 记录

RuntimeError: Sizes of tensors must match except in dimension 1. Got 61 and 60 in dimension 2 错误产生原因:在模型中有以下操作:torch.cat(x, y) 当x, y的尺寸不一致时,就会出现以上错误。 ......
深度 问题

腾讯云 Cloud Studio 实战训练营结营&活动获奖公示

点击链接了解详情 “腾讯云 Cloud Studio 实战训练营” 是由腾讯云联合 CSDN 推出的系列开发者技术实践活动,通过技术分享直播、动手实验项目、优秀代码评选、有奖征文活动等,让广大开发者沉浸式体验腾讯云开发者工具 Cloud Studio 的同时,实现技术实战能力提升。 本次实战训练营活 ......
训练营 实战 Studio Cloud amp

算法训练day22 LeetCode235

算法训练day22 LeetCode235.701.450. 235. 二叉搜索树的最近公共祖先 题目 235. 二叉搜索树的最近公共祖先 - 力扣(LeetCode) 题解 代码随想录 (programmercarl.com) 对于二叉树,可以用递归回溯的方式 对于二叉搜索树,由其根节点大于左右子 ......
算法 LeetCode day 235 22

代码随想录day21 | ● 530.二叉搜索树的最小绝对差 ● 501.二叉搜索树中的众数 ● 236. 二叉树的最近公共祖先

530. 二叉搜索树的最小绝对差 class Solution { private: int result = INT_MAX; TreeNode* pre = NULL; void traversal(TreeNode* cur){ if (cur == NULL) return; travers ......
随想录 祖先 随想 代码 day

大模型增量训练--基于transformer制作一个大模型聊天机器人

ChatGPTBook/UniLMProj 代码地址 Folders and files Name Last commit message Last commit date parent directory .. data (Directory) update code 3 months ago i ......
模型 增量 机器人 transformer 机器

算法训练day21 LeetCode 530

算法训练day21 LeetCode 530.501.236 530二叉搜索树的最小绝对差 题目 530. 二叉搜索树的最小绝对差 - 力扣(LeetCode) 题解 代码随想录 (programmercarl.com) 中序遍历二叉平衡树 --> 有序数组 --> 遍历数组得到最小绝对差 clas ......
算法 LeetCode day 530 21

随想录Day7|454. 四数相加Ⅱ、383. 赎金信、15. 三数之和、18. 四数之和

随想录Day7|454. 四数相加Ⅱ、383. 赎金信、15. 三数之和、18. 四数之和 454. 四数相加Ⅱ 文章&视频讲解 给你四个整数数组 nums1、nums2、nums3 和 nums4 ,数组长度都是 n ,请你计算有多少个元组 (i, j, k, l) 能满足: 0 <= i, j, ......
之和 随想录 随想 Day7 Day

预训练Bert模型输出类型为str问题解决

input_ids=keras.layers.Input(shape=(MAXLEN,),dtype='int32') attention_mask=keras.layers.Input(shape=(MAXLEN,),dtype='int32') token_type_ids=keras.laye ......
模型 类型 问题 Bert str

算法训练day20 LeetCode654

算法训练day20 LeetCode654.617.700.98 654.最大二叉树 题目 654. 最大二叉树 - 力扣(LeetCode) 题解 代码随想录 (programmercarl.com) 使用递归 返回节点地址,输入父节点地址,数组 终止条件是输入地数组为空 单层操作: 如果输入数组 ......
算法 LeetCode day 654 20