随想录训练营祖先随想

基于无监督训练SimCSE+In-batch Negatives策略有监督训练的语义索引召回

# 基于无监督训练SimCSE+In-batch Negatives策略有监督训练的语义索引召回语义索引（可通俗理解为向量索引）技术是搜索引擎、推荐系统、广告系统在召回阶段的核心技术之一。语义索引模型的目标是：给定输入文本，模型可以从海量候选召回库中**快速、准确**地召回一批语义相关文本。语义索 ......

语义 Negatives 索引 In-batch SimCSE更新时间 2023-08-02

语义检索系统：基于无监督预训练语义索引召回：SimCSE、Diffcse

# 基于无监督预训练语义索引召回：SimCSE、Diffcse 语义索引（可通俗理解为向量索引）技术是搜索引擎、推荐系统、广告系统在召回阶段的核心技术之一。语义索引模型的目标是：给定输入文本，模型可以从海量候选召回库中**快速、准确**地召回一批语义相关文本。语义索引模型的效果直接决定了语义相关的物 ......

语义索引 Diffcse SimCSE 系统更新时间 2023-08-02

更快的训练和推理: 对比 Habana Gaudi®2 和英伟达 A100 80GB

通过本文，你将学习如何使用 [Habana® Gaudi®2](https://habana.ai/training/gaudi2/) 加速模型训练和推理，以及如何使用 🤗 [Optimum Habana](https://huggingface.co/docs/optimum/habana/in ......

更快 Habana Gaudi A100 174更新时间 2023-08-02

代码随想录算法训练营第四十四天| 647. 回文子串 516.最长回文子序列

647. 回文子串要求：找出回文子串的个数思路：设置起始节点如果头尾相等，且是相差为1，指定回文如果相差很多，那么就看它的字串代码： 1 // 要求：找出正反相等，且连续字符，开始结束位置不同，也认为是一个 2 // dp[n][n] 起始-中止位置 3 // 4 // 如果两边相等 ......

回文随想录训练营序列随想更新时间 2023-08-02

2023牛客暑期多校训练营5 ABCDEGHI

[比赛链接](https://ac.nowcoder.com/acm/contest/57359) # A ## 题解 **知识点：莫队，树状数组。** 区间询问显然可以离线莫队，考虑端点移动对答案的影响。不妨先考虑右端点右移一个位置，对答案的改变。假设右端点右移后在 $r$ ，我们先要知道 $[ ......

训练营 ABCDEGHI 2023更新时间 2023-08-02

2023牛客暑期多校训练营5

之前落下的每一场比赛都是要补回来的。。。 [G Go to Play Maimai DX](https://ac.nowcoder.com/acm/contest/57359/G "Go to Play Maimai DX") 题解的想法比较简单，由于找到满足1，2，3出现至少一次，4出现至少k次的 ......

训练营 2023更新时间 2023-08-02

构建易于运维的 AI 训练平台：存储选型与最佳实践

伴随着公司业务的发展，数据量持续增长，存储平台面临新的挑战：大图片的高吞吐、超分辨率场景下数千万小文件的 IOPS 问题、运维复杂等问题。除了这些技术难题，我们基础团队的人员也比较紧张，负责存储层运维的仅有 1 名同事，因而组件的易用性，一直也是我们评估的重要维度。我们尝试过文件系统包括有 NFS ......

平台 AI更新时间 2023-08-02

2023牛客暑期多校训练营5

## B.Circle of Mistery 题意：有一个由n个点组成的图，现在给出每个点的权值，构造一个排列a，将i与a[i]相连，满足至少有一个从节点1出发的环，其上各点权值之和大于等于k，并且使得排列a中的逆序对数量最少，求出最少的逆序对个数。 ### Solution 我们考虑到要想尽可能减 ......

训练营 2023更新时间 2023-08-02

代码随想录算法训练营第四十三天| 583. 两个字符串的删除操作 72. 编辑距离

583. 两个字符串的删除操作要求：删除最少的步数，来让这两个字符串相等思路：求末尾的最长公共子序列的长度，然后减去他们的长度代码： 1 // 要求：两个字符串，删除任意一个字符后，让这两个字符相等 2 // dp[n][m] 以n-1结尾的字符串变成节点为m-1为子序列的最大个数 3 / ......

随想录训练营字符串随想算法更新时间 2023-08-02

代码随想录算法训练营第四十二天| 392.判断子序列 115.不同的子序列

392.判断子序列要求：判断第一个字符串是否是第二个字符串的子序列思路1：设置成deque，如果长度为0则是代码1： 1 // 要求：判断s 是否是t的子序列 2 // 思路：将s作为queue，如果头相等，那么就弹出，遍历后，查看是否为0 3 // 4 bool isSubseque ......

序列随想录训练营随想算法更新时间 2023-08-02

代码随想录算法训练营第七天| LeetCode 454.四数相加II 15. 三数之和 18. 四数之和

454.四数相加II 卡哥建议：本题是使用map巧妙解决的问题，好好体会一下哈希法如何提高程序执行效率，降低时间复杂度，当然使用哈希法会提高空间复杂度，但一般来说我们都是舍空间换时间，工业开发也是这样。题目链接/文章讲解/视频讲解：https://programmercarl.com/0454 ......

之和随想录训练营随想算法更新时间 2023-08-02

代码随想录算法训练营第四十一天| 1143.最长公共子序列 1035.不相交的线 53. 最大子序和

1143.最长公共子序列要求：可以跳过，找出来最长符合的节点难点：如何跳过了之后仍然保留之前的值思路: 如果不符，并不是dp[i-1][j-2]等于之前的值，而是dp[i][j] 等于它的相关节点以上很重要代码： 1 // 要求：两个子数组，可以删减跳过，找出最长的长度 2 // ......

随想录训练营序列随想算法更新时间 2023-08-01

[代码随想录]Day06-哈希表 part02

## 题目：[454. 四数相加 II](https://leetcode.cn/problems/4sum-ii/) ### 思路：首先，因为下标不同，因此相同的序列可能会出现很多次。 A + B + C + D = 0，那么当知道保存了A+B的和之后，就看有没有A + B = 0 - C - ......

随想录随想代码 part Day更新时间 2023-08-01

赵和旭 CSP-J 基础训练营讲课笔记

# 输出 ``` #include using namespace std; signed main(){ cout using namespace std; signed main(){ int x,y; int sum; cout>x; cout>y; sum=x+y; cout using n ......

训练营基础笔记 CSP-J CSP更新时间 2023-08-01

代码随想录算法训练营第五天|力扣242.有效的字母异位词、力扣242.两个数组的交集、力扣202.快乐数、力扣1.两数之和

# 哈希表 ## 哈希表理论基础哈希表，又称为散列表（Hash Table)，是根据关键码的值而直接进行访问的数据结构其中，数组就是一张哈希表；表中关键码就是数组的索引下标，然后通过下标直接访问数组中的元素 - 哈希表解决的问题：一般哈希表都是用来快速判断一个元素是否出现在集合中 - 哈希函数： ......

随想录之和训练营数组交集更新时间 2023-07-31

代码随想录算法训练营第三天| LeetCode 242.有效的字母异位词 349. 两个数组的交集 1. 两数之和

242.有效的字母异位词卡哥建议：这道题目，大家可以感受到数组用来做哈希表给我们带来的遍历之处。题目链接/文章讲解/视频讲解： https://programmercarl.com/%E5%93%88%E5%B8%8C%E8%A1%A8%E7%90%86%E8%AE%BA%E5%9F%BA%E ......

随想录之和训练营数组交集更新时间 2023-07-31

[代码随想录]Day05-哈希表 part01

## 题目：[242. 有效的字母异位词](https://leetcode.cn/problems/valid-anagram/) ### 思路：很简单，就是看两个字符串每个字母出现的次数是不是相同的。可以用两个数组来比较，也可以用一个数组比较。 ### 代码：一个数组 ```go func ......

随想录随想代码 part Day更新时间 2023-07-31

PyTorch 中的多 GPU 训练和梯度累积作为替代方案

动动发财的小手，点个赞吧！在[本文](https://towardsdatascience.com/multiple-gpu-training-in-pytorch-and-gradient-accumulation-as-an-alternative-to-it-e578b3fc5b91 "So ......

梯度 PyTorch 方案 GPU更新时间 2023-07-31

算法训练与1连通的点的个数

主要思想是并查集，不懂的可以先了解下这个算法再来做题就明白了。c++实现： #include<iostream> #include<vector> using namespace std; int f[10000]; //找根节点 int find(int x) { if (f[x] != x) f ......

算法个数更新时间 2023-07-31

2023牛客暑期多校训练营4

## A.Bobo String Construction 题意：给出一个01字符串t，要求构造一个长为n的01字符串s，使得新的字符串t+s+t不会有超过两个子串t ### Solution 答案要么全0串要么全1串带进去看看成不成立就行了 ```c++ void solve() { int n ......

训练营 2023更新时间 2023-07-31

代码随想录-哈希表-c++总结

哈希表内容整体简单，关键是要有利用map映射的思想，以及巩固一些c++标准库的操作这次三数之和一题没有直接做出来，关键在于如何查重一点比较绕 15. 三数之和 - 力扣（LeetCode）利用排序+双指针解决三数之和的思路更加清楚此外，四数之和中，四个数相加会溢出int，应改为 ......

随想录随想代码更新时间 2023-07-31

模板最近公共祖先（LCA）

```c++ void dfs(int u, int v) {//求出每个结点的深度1 dep[u] = dep[p] + 1; fa[u][0] = p; for(int i = 1; (1 = 0; i--) {//i的初始值由节点数确定 if(dep[u] - (1 = dep[v]) { u ......

祖先模板 LCA更新时间 2023-07-31

2023牛客暑期多校训练营4 AFHJL

[比赛链接](https://ac.nowcoder.com/acm/contest/57358) # A ## 题解 **知识点：KMP，构造。** 考虑构造全 $0,1$ 串，至少有一个可行。我们只需要考虑到 $t$ 的border $t'$ ，即 $t'+s+t'$ ： 1. 当 $t'+s ......

训练营 AFHJL 2023更新时间 2023-07-31

2023牛客暑期多校训练营2

# D.The Game of Eating ### 题意: 一共有m道菜，n个人轮流点，一共点k道。第i个人对第j道菜的喜爱程度$A_i$公开, 一个人点了菜所有人都可以吃到。每个人都希望最大化自己的喜爱程度之和，求最终的点菜集合。 ### 分析：倒着贪心，如果最后一个人最喜欢吃的菜没被选那 ......

训练营 2023更新时间 2023-07-31

代码随想录第四天|力扣24.两两交换链表节点、力扣19.删除链表的倒数第N个结点、力扣面试02.07链表相交、力扣142.环形链表

## 两两交换链表中的节点(力扣24.) - dummyhead .next = head; - cur = dummyhead; - while(cur.next!=null&&cur.next.next!=null) - temp = cur.next; - temp1=cur.next.nex ......

随想录结点环形节点随想更新时间 2023-07-30

ubuntu上搭建ChatGLM2-6b环境及ptuing微调训练的坑

清华大学的chatGLM2-6B可以说是目前亚洲唯一能打的对中文支持不错的LLM大模型，网上已经有很多介绍如何在本机搭建环境的文章，就不再重复了，这里记录下最近踩的一些坑： 1、为啥要使用ubuntu? chatGLM2-6b项目里有很多.sh文件，在windows下要正常运行通常要折腾一番，最后能 ......

ChatGLM2 ChatGLM 环境 ubuntu ptuing更新时间 2023-07-30

代码随想录算法训练营第四天| LeetCode 24. 两两交换链表中的节点 19.删除链表的倒数第N个节点 142.环形链表II

24. 两两交换链表中的节点卡哥建议：用虚拟头结点，这样会方便很多。本题链表操作就比较复杂了，建议大家先看视频，视频里我讲解了注意事项，为什么需要temp保存临时节点。题目链接/文章讲解/视频讲解：https://programmercarl.com/0024.%E4%B8%A4%E4%B8% ......

节点随想录环形训练营随想更新时间 2023-07-30

HuggingFace | 使用Roberta训练一个牛客网讨论贴文本分类模型

**训练一个NLU模型** 本文将使用trainer 训练一个牛客网讨论帖文本分类模型。详细过程如下： #### 构建数据集数据集下载链接： [train data](https://github.com/chadqiu/newcoder-crawler/blob/main/train.csv) ......

HuggingFace 模型文本 Roberta更新时间 2023-07-30

go 进阶训练营微服务可用性(上）笔记

## 隔离本质上是对系统和资源进行分割，从而实现当系统故障时能限定传播范围和影响范围，即发生故障后只有出问题的服务不可用，保证其他服务仍然可用。 ### 服务隔离 #### 动静隔离 mysql 表中的bufferpool 频繁过期，隔离动静表。如稿件的基本信息，作者、封面等和稿件的播放、点赞 ......

可用性训练营笔记 go更新时间 2023-07-30

基于中文金融知识的 LLaMA 系微调模型的智能问答系统：LLaMA大模型训练微调推理等详细教学

# 基于中文金融知识的 LLaMA 系微调模型的智能问答系统：LLaMA大模型训练微调推理等详细教学基于 LLaMA 系基模型经过中文金融知识指令精调/指令微调(Instruct-tuning) 的微调模型。通过中文金融公开问答数据+爬取的金融问答数据构建指令数据集，并在此基础上对 LLaMA 系 ......

模型 LLaMA 智能金融教学更新时间 2023-07-30

共4000篇 :27/134页 首页上一页24252627282930下一页尾页

随想录 训练营 祖先 随想

随想录训练营祖先随想