随想录 训练营 祖先 随想

基于无监督训练SimCSE+In-batch Negatives策略有监督训练的语义索引召回

# 基于无监督训练SimCSE+In-batch Negatives策略有监督训练的语义索引召回 语义索引(可通俗理解为向量索引)技术是搜索引擎、推荐系统、广告系统在召回阶段的核心技术之一。语义索引模型的目标是:给定输入文本,模型可以从海量候选召回库中**快速、准确**地召回一批语义相关文本。语义索 ......
语义 Negatives 索引 In-batch SimCSE

语义检索系统:基于无监督预训练语义索引召回:SimCSE、Diffcse

# 基于无监督预训练语义索引召回:SimCSE、Diffcse 语义索引(可通俗理解为向量索引)技术是搜索引擎、推荐系统、广告系统在召回阶段的核心技术之一。语义索引模型的目标是:给定输入文本,模型可以从海量候选召回库中**快速、准确**地召回一批语义相关文本。语义索引模型的效果直接决定了语义相关的物 ......
语义 索引 Diffcse SimCSE 系统

更快的训练和推理: 对比 Habana Gaudi®2 和英伟达 A100 80GB

通过本文,你将学习如何使用 [Habana® Gaudi®2](https://habana.ai/training/gaudi2/) 加速模型训练和推理,以及如何使用 🤗 [Optimum Habana](https://huggingface.co/docs/optimum/habana/in ......
更快 Habana Gaudi A100 174

代码随想录算法训练营第四十四天| 647. 回文子串 516.最长回文子序列

647. 回文子串 要求: 找出回文子串的个数 思路: 设置起始节点 如果头尾相等,且是相差为1,指定回文 如果相差很多,那么就看它的字串 代码: 1 // 要求:找出 正反相等,且连续字符,开始结束位置不同,也认为是一个 2 // dp[n][n] 起始-中止位置 3 // 4 // 如果两边相等 ......
回文 随想录 训练营 序列 随想

2023牛客暑期多校训练营5 ABCDEGHI

[比赛链接](https://ac.nowcoder.com/acm/contest/57359) # A ## 题解 **知识点:莫队,树状数组。** 区间询问显然可以离线莫队,考虑端点移动对答案的影响。 不妨先考虑右端点右移一个位置,对答案的改变。假设右端点右移后在 $r$ ,我们先要知道 $[ ......
训练营 ABCDEGHI 2023

2023牛客暑期多校训练营5

之前落下的每一场比赛都是要补回来的。。。 [G Go to Play Maimai DX](https://ac.nowcoder.com/acm/contest/57359/G "Go to Play Maimai DX") 题解的想法比较简单,由于找到满足1,2,3出现至少一次,4出现至少k次的 ......
训练营 2023

构建易于运维的 AI 训练平台:存储选型与最佳实践

伴随着公司业务的发展,数据量持续增长,存储平台面临新的挑战:大图片的高吞吐、超分辨率场景下数千万小文件的 IOPS 问题、运维复杂等问题。除了这些技术难题,我们基础团队的人员也比较紧张,负责存储层运维的仅有 1 名同事,因而组件的易用性,一直也是我们评估的重要维度。 我们尝试过文件系统包括有 NFS ......
平台 AI

2023牛客暑期多校训练营5

## B.Circle of Mistery 题意:有一个由n个点组成的图,现在给出每个点的权值,构造一个排列a,将i与a[i]相连,满足至少有一个从节点1出发的环,其上各点权值之和大于等于k,并且使得排列a中的逆序对数量最少,求出最少的逆序对个数。 ### Solution 我们考虑到要想尽可能减 ......
训练营 2023

代码随想录算法训练营第四十三天| 583. 两个字符串的删除操作 72. 编辑距离

583. 两个字符串的删除操作 要求: 删除最少的步数,来让这两个字符串相等 思路: 求末尾的最长公共子序列的长度,然后减去他们的长度 代码: 1 // 要求:两个字符串,删除任意一个字符后,让这两个字符相等 2 // dp[n][m] 以n-1结尾的字符串变成节点为m-1为子序列的最大个数 3 / ......
随想录 训练营 字符串 随想 算法

代码随想录算法训练营第四十二天| 392.判断子序列 115.不同的子序列

392.判断子序列 要求: 判断第一个字符串是否是第二个字符串的子序列 思路1: 设置成deque,如果长度为0则是 代码1: 1 // 要求: 判断s 是否是t的子序列 2 // 思路: 将s作为queue,如果头相等,那么就弹出,遍历后,查看是否为0 3 // 4 bool isSubseque ......
序列 随想录 训练营 随想 算法

代码随想录算法训练营第七天| LeetCode 454.四数相加II 15. 三数之和 18. 四数之和

454.四数相加II 卡哥建议:本题是使用map巧妙解决的问题,好好体会一下 哈希法如何提高程序执行效率,降低时间复杂度,当然使用哈希法会提高空间复杂度,但一般来说我们都是舍空间换时间, 工业开发也是这样。 题目链接/文章讲解/视频讲解:https://programmercarl.com/0454 ......
之和 随想录 训练营 随想 算法

代码随想录算法训练营第四十一天| 1143.最长公共子序列 1035.不相交的线 53. 最大子序和

1143.最长公共子序列 要求: 可以跳过,找出来最长符合的节点 难点: 如何跳过了之后仍然保留之前的值 思路: 如果不符,并不是dp[i-1][j-2]等于之前的值,而是dp[i][j] 等于它的相关节点 以上很重要 代码 : 1 // 要求: 两个子数组,可以删减跳过,找出最长的长度 2 // ......
随想录 训练营 序列 随想 算法

[代码随想录]Day06-哈希表 part02

## 题目:[454. 四数相加 II](https://leetcode.cn/problems/4sum-ii/) ### 思路: 首先,因为下标不同,因此相同的序列可能会出现很多次。 A + B + C + D = 0,那么当知道保存了A+B的和之后,就看有没有A + B = 0 - C - ......
随想录 随想 代码 part Day

赵和旭 CSP-J 基础训练营讲课笔记

# 输出 ``` #include using namespace std; signed main(){ cout using namespace std; signed main(){ int x,y; int sum; cout>x; cout>y; sum=x+y; cout using n ......
训练营 基础 笔记 CSP-J CSP

代码随想录算法训练营第五天|力扣242.有效的字母异位词、力扣242.两个数组的交集、力扣202.快乐数、力扣1.两数之和

# 哈希表 ## 哈希表理论基础 哈希表,又称为散列表(Hash Table),是根据关键码的值而直接进行访问的数据结构 其中,数组就是一张哈希表;表中关键码就是数组的索引下标,然后通过下标直接访问数组中的元素 - 哈希表解决的问题:一般哈希表都是用来快速判断一个元素是否出现在集合中 - 哈希函数: ......
随想录 之和 训练营 数组 交集

代码随想录算法训练营第三天| LeetCode 242.有效的字母异位词 349. 两个数组的交集 1. 两数之和

242.有效的字母异位词 卡哥建议: 这道题目,大家可以感受到数组用来做哈希表给我们带来的遍历之处。 题目链接/文章讲解/视频讲解: https://programmercarl.com/%E5%93%88%E5%B8%8C%E8%A1%A8%E7%90%86%E8%AE%BA%E5%9F%BA%E ......
随想录 之和 训练营 数组 交集

[代码随想录]Day05-哈希表 part01

## 题目:[242. 有效的字母异位词](https://leetcode.cn/problems/valid-anagram/) ### 思路: 很简单,就是看两个字符串每个字母出现的次数是不是相同的。 可以用两个数组来比较,也可以用一个数组比较。 ### 代码: 一个数组 ```go func ......
随想录 随想 代码 part Day

PyTorch 中的多 GPU 训练和梯度累积作为替代方案

动动发财的小手,点个赞吧! 在[本文](https://towardsdatascience.com/multiple-gpu-training-in-pytorch-and-gradient-accumulation-as-an-alternative-to-it-e578b3fc5b91 "So ......
梯度 PyTorch 方案 GPU

算法训练 与1连通的点的个数

主要思想是并查集,不懂的可以先了解下这个算法再来做题就明白了。c++实现: #include<iostream> #include<vector> using namespace std; int f[10000]; //找根节点 int find(int x) { if (f[x] != x) f ......
算法 个数

2023牛客暑期多校训练营4

## A.Bobo String Construction 题意:给出一个01字符串t,要求构造一个长为n的01字符串s,使得新的字符串t+s+t不会有超过两个子串t ### Solution 答案要么全0串要么全1串 带进去看看成不成立就行了 ```c++ void solve() { int n ......
训练营 2023

代码随想录-哈希表-c++总结

哈希表内容整体简单,关键是要有利用map映射的思想,以及巩固一些c++标准库的操作 这次三数之和一题没有直接做出来,关键在于如何查重一点比较绕 15. 三数之和 - 力扣(LeetCode) 利用排序+双指针解决三数之和的思路更加清楚 此外,四数之和中,四个数相加会溢出int,应改为 ......
随想录 随想 代码

模板 最近公共祖先(LCA)

```c++ void dfs(int u, int v) {//求出每个结点的深度1 dep[u] = dep[p] + 1; fa[u][0] = p; for(int i = 1; (1 = 0; i--) {//i的初始值由节点数确定 if(dep[u] - (1 = dep[v]) { u ......
祖先 模板 LCA

2023牛客暑期多校训练营4 AFHJL

[比赛链接](https://ac.nowcoder.com/acm/contest/57358) # A ## 题解 **知识点:KMP,构造。** 考虑构造全 $0,1$ 串,至少有一个可行。 我们只需要考虑到 $t$ 的border $t'$ ,即 $t'+s+t'$ : 1. 当 $t'+s ......
训练营 AFHJL 2023

2023牛客暑期多校训练营2

# D.The Game of Eating ### 题意: 一共有m道菜,n个人轮流点,一共点k道。 第i个人对第j道菜的喜爱程度$A_i$公开, 一个人点了菜所有人都可以吃到。 每个人都希望最大化自己的喜爱程度之和,求最终的点菜集合。 ### 分析: 倒着贪心,如果最后一个人最喜欢吃的菜没被选那 ......
训练营 2023

代码随想录第四天|力扣24.两两交换链表节点、力扣19.删除链表的倒数第N个结点、力扣面试02.07链表相交、力扣142.环形链表

## 两两交换链表中的节点(力扣24.) - dummyhead .next = head; - cur = dummyhead; - while(cur.next!=null&&cur.next.next!=null) - temp = cur.next; - temp1=cur.next.nex ......
随想录 结点 环形 节点 随想

ubuntu上搭建ChatGLM2-6b环境及ptuing微调训练的坑

清华大学的chatGLM2-6B可以说是目前亚洲唯一能打的对中文支持不错的LLM大模型,网上已经有很多介绍如何在本机搭建环境的文章,就不再重复了,这里记录下最近踩的一些坑: 1、为啥要使用ubuntu? chatGLM2-6b项目里有很多.sh文件,在windows下要正常运行通常要折腾一番,最后能 ......
ChatGLM2 ChatGLM 环境 ubuntu ptuing

代码随想录算法训练营第四天| LeetCode 24. 两两交换链表中的节点 19.删除链表的倒数第N个节点 142.环形链表II

24. 两两交换链表中的节点 卡哥建议:用虚拟头结点,这样会方便很多。 本题链表操作就比较复杂了,建议大家先看视频,视频里我讲解了注意事项,为什么需要temp保存临时节点。 题目链接/文章讲解/视频讲解:https://programmercarl.com/0024.%E4%B8%A4%E4%B8% ......
节点 随想录 环形 训练营 随想

HuggingFace | 使用Roberta训练一个牛客网讨论贴文本分类模型

**训练一个NLU模型** 本文将使用trainer 训练一个牛客网讨论帖文本分类模型。详细过程如下: #### 构建数据集 数据集下载链接: [train data](https://github.com/chadqiu/newcoder-crawler/blob/main/train.csv) ......
HuggingFace 模型 文本 Roberta

go 进阶训练营 微服务可用性(上) 笔记

## 隔离 本质上是对系统和资源进行分割,从而实现当系统故障时能限定传播范围和影响范围,即发生故障后只有出问题的服务不可用,保证其他服务仍然可用。 ### 服务隔离 #### 动静隔离 mysql 表中的bufferpool 频繁过期,隔离动静表。如 稿件的基本信息,作者、封面等和稿件的播放、点赞 ......
可用性 训练营 笔记 go

基于中文金融知识的 LLaMA 系微调模型的智能问答系统:LLaMA大模型训练微调推理等详细教学

# 基于中文金融知识的 LLaMA 系微调模型的智能问答系统:LLaMA大模型训练微调推理等详细教学 基于 LLaMA 系基模型经过中文金融知识指令精调/指令微调(Instruct-tuning) 的微调模型。通过中文金融公开问答数据+爬取的金融问答数据构建指令数据集,并在此基础上对 LLaMA 系 ......
模型 LLaMA 智能 金融 教学