算法 深度 规则apriori

大模型入门(七)—— RLHF中的PPO算法理解

本文主要是结合PPO在大模型中RLHF微调中的应用来理解PPO算法。 一、强化学习介绍 1.1、基本要素 环境的状态S:t时刻环境的状态$S_{t}$是环境状态集中某一个状态,以RLHF中为例,序列$w1,w2,w3$是当前的状态。 个体的动作A:t时刻个体采取的动作$A_{t}$,给定序列$w1, ......
算法 模型 RLHF PPO

dede采集过程中经常用到的dedecms采集过滤规则

一般在DEDE采集的过程中需要过滤或者删除再者是注释掉一些别人的信息,比如:超链接,图片等等之类的,都需要用到这些过滤规则,把不想采集过来的资源全部都注释掉这样就大大减少了采集回来的垃圾信息,占用了自己的空间。 {dede:trim}<span(.*)>{/dede:trim} {dede:trim ......
规则 过程 dedecms dede

算法-背包问题

**01背包问题** dp[i][j] = max(dp[i-1][j], dp[i-1][j-w[i]] + v[i]); (j>=w[i]) 一维化(由于递推关系i只和i-1 有关,可进行空间压缩,**遍历j时需要逆序遍历**) for(int i=0;i=w[i];j--){ dp[j] = ......
算法 背包 问题

算法——排列组合

排列、组合适合**回溯法**,保存当前状态 什么时候使用 used 数组,什么时候使用 begin 变量 有些朋友可能会疑惑什么时候使用 used 数组,什么时候使用 begin 变量。这里为大家简单总结一下: **排列问题**,讲究顺序(即 [2, 2, 3] 与 [2, 3, 2] 视为不同列表 ......
算法

算法——格雷编码、霍夫曼编码

格雷编码 当 n=0 时,格雷码序列为 [0]。 将n-1编码翻转,翻转部分的n-1位设置位1, 获得n位编码。 霍夫曼编码 那么为什么通过哈夫曼编码后得到的二进制码不会有前缀的问题呢? 这是因为在哈夫曼树中,每个字母对应的节点都是**叶子节点**,而他们对应的二进制码是由根节点到各自节点的路径所决 ......
编码 算法

算法——前缀和 + 两数相加、相减

求数组中,连续区间的大小,可使用前缀和相减得到。 进阶变形 若想得到区间大小等于target,暴力枚举 前缀和相减。复杂度O(n^2) 优化算法:将每次求得的前缀和放入hashMap中,S[j] - S[i] == target,(j>i) 求出S[j]后,判断hashMap中是否存在 S[i] = ......
前缀 算法

算法——加减乘除计算器

**操作符号栈,数字栈** 遍历字符 * 若是低优先级运算符(加、减),不断地弹出高优先级运算符(乘、除)栈顶运算符,直到栈为空或者栈顶不为高优先级运算符(乘、除) * 若是左括号运算符,加入操作栈,若是右括号运算符,不断地弹出栈顶运算符,直到栈顶为 左括号 * 若是数字,加入数字栈 遍历完成后,若 ......
加减乘除 计算器 算法

【第1周】深度学习基础

# 一、代码练习 ## 1. pytorch基础练习 ### 1.1 数据定义 一般定义数据使用torch.Tensor ![](https://img2020.cnblogs.com/blog/2555620/202110/2555620-20211006233601422-359312721.j ......
深度 基础

动态规划算法总结

## 一些心得 1.对于一些不好处理,不好得到的值,可以将其直接存入状态中枚举,加一维。 2.dp并不一定每一个转移都是最优的,只要最优状态一定在dp数组中存在,且一定会参与转移就行了。 ## 状压dp 1.枚举 k 的子集,有一个技巧是 ``` for(int p=k;p!=0;p=(p-1)&x ......
算法 动态

ACM算法竞赛入门和进阶指南

文章目录如下,将从以下八个方面展开,接下来进入正文。 一、ACM竞赛 ACM程序设计竞赛是三人组队赛,一场比赛5个小时,通常有10~13个问题,三人合力解决,比赛时三人只能使用一台电脑。 每年有多个赛站,但每人一年只能参加两场区域赛(不算邀请赛、省赛)。 二、入门方式 可以参考下方回答。 ACM 的 ......
算法 指南 ACM

Spring Data JPA的方法命名规则-笔记

| 关键词 | SQL符号 | 样例 | 对应JPQL 语句片段 | | | | | | | And | and | findByLastnameAndFirstname | … where x.lastname = ?1 and x.firstname = ?2 | | Or | or | fin ......
规则 笔记 方法 Spring Data

代码随想录算法训练营第三十一天| 509. 斐波那契数 70. 爬楼梯 746. 使用最小花费爬楼梯

509. 斐波那契数 思路: 运用动态规划的思想 1,先定义一个数组 2,初始化 3,递推公式 4,遍历 代码: 1 int fib(int n) 2 { 3 if (n == 0) return 0; 4 if (n == 1) return 1; 5 6 vector<int> selected ......
楼梯 随想录 训练营 随想 算法

C语言算法100例实战题

适合人群:1:从来没接触过编程的小白,可以从零基础开始学习2:接触过C语言基础不扎实,可以通过学习提高自己课程介绍:1:本课全套共计100节。2:定期更新课程内容及技术体系。3:享受老师一对一技术指导与服务。4:报名后联系老师QQ:726920220,领取全套学习资料。5:购买本课程,各位同学们可享 ......
算法 实战 语言 100

深度学习(四)——torchvision中数据集的使用

前面的transform只是对单个数据图像的处理,本文着重讲对多个数据图像的处理,并介绍科研中常用数据集的下载方式。 ......
torchvision 深度 数据

回文串算法小结

为什么说回文是字符串原神. # Manacher 算法 ### 功能 求出字符串每一处的回文半径,记为 $p_i$. ### 实现方法 manacher 只能处理存在回文中心(长度为奇数)的回文串.故需要在待处理串 $T$ 的字符空隙和开头结尾添加 **相同** 的特殊字符 $ch_1$ 得到 $S ......
回文 小结 算法

基础图论算法

首先还是感谢 **Alex_Wei** 的博客 [图论基础](https://www.cnblogs.com/alex-wei/p/basic_graph_theory.html). 这篇博客可以理解成学习笔记之类的.所以记叙比较散乱是正常的.嗯. # 一.最短路 以下内容,提最短路时若不做特殊说明 ......
算法 基础

离线 log 算法

## CDQ分治 一种空间复杂度(和时间常数?)优秀的离线算法。 简介:对于偏序问题,将其中一维(记为 $x$)排序,考虑将当前区间 $[1, n]$ 以中点 $mid$ 分开,形成子区间 $[1, mid]$ 和 $[mid+1, r]$。处理 $[1, n]$ 时只考虑从两子区间出发,$x$ 跨 ......
算法 log

数据分享|Weka数据挖掘Apriori关联规则算法分析用户网购数据|附代码数据

全文链接:http://tecdat.cn/?p=32150 最近我们被客户要求撰写关于Apriori关联规则的研究报告,包括一些图形和统计输出。 随着大数据时代的来临,如何从海量的存储数据中发现有价值的信息或知识帮助用户更好决策是一项非常艰巨的任务 ( 点击文末“阅读原文”获取完整代码数据**** ......
数据 数据挖掘 算法 规则 Apriori

文心一言 VS 讯飞星火 VS chatgpt (58)-- 算法导论6.4 2题

文心一言 VS 讯飞星火 VS chatgpt (58)-- 算法导论6.4 2题 # 二、试分析在使用下列循环不变量时,HEAPSORT 的正确性:在算法的第 2~5行 for 循环每次迭代开始时,子数组 A[1..i]是一个包含了数组A[1..n]中第i小元素的最大堆,而子数组 A[i+1..n ......
文心 导论 算法 chatgpt VS

manacher 算法

title: manacher 算法 feature: false mathjax: true preview: date: 2022-08-02 16:34:46 tags: - manacher categories: 算法 cover: https://pic.imgdb.cn/item/62 ......
算法 manacher

深度学习基础知识的名词解释【无规则】

凸优化【Convex Optimization】: 求取函数(凸函数)最小值的优化问题 自回归模型: 适合预测时间序列数据 过拟合: 训练集上好(训练误差小),测试集上差(测试误差大)。 或者说属于完全记忆式模型/过度复杂模型 欠拟合 较好 过拟合 解决方法: a.减少特征数量 b.正则化 L1(特 ......

算法纪实|Day2

## **数组02** #### LeetCode 997-有序数组的平方 [有序数组的平方](https://leetcode.cn/problems/squares-of-a-sorted-array/) ##### 思考 ​ 第一眼的思路:先平方后排序,时间复杂度根据排序算法的选择决定,最快为 ......
算法 纪实 Day2 Day

蚁群算法求解TSP

title: 蚁群算法求解TSP-Matlab版 date: 2018-06-03 10:45:56 categories: [Algorithm] tags: [Matlab] 蚁群算法的作业,本来想用C++写的。研究了半天得出结论: > 🙈 > MATLAB写这个确实好写。 > > 😌 # ......
算法 TSP

人工智能、机器学习和深度学习

这一年来,AI领域层出不穷的技术和应用,真的有点让人疲于奔命。其中AIGC领域的diffusion model 和 NLP领域的 ChatGBT 引领了这一轮风潮。AI取代越来越多脑力工作者的趋势已经不可逆转,在这经济下行内卷严重的当代,竞争将越发的残酷。作为走在风口前沿的技术人,用stable d ......
人工智能 人工 深度 机器 智能

二分查找算法

**现在有一个从小到大排序的数组,给你一个目标值target,现在请你找到这个值在数组中的对应下标,如果没有,请返回-1:** `int search(int* nums, int numsSize, int target){ //请实现查找算法 } int main() { int arr[] = ......
算法

基础算法

# 基础算法 ## 1. 二分 ## 2. 贪心 ## 3. DP ### 3.1 介绍 DP 我们先从一道题引出 DP。 > 一个 $n\times m$ 的矩阵,沁志从左上角的家出发,到右下角去上学。每次只能往下或右走,问沁志从家到学校有多少种路线?答案对 $(10^9 +7)$ 取模。 > $ ......
算法 基础

归纳法证明欧几里得算法

前言 本证明思路来源于 《数学分析 Apostol》 定理 1.6 每一对非负整数a与b都有一个公因数d,形为 其中x和y都是整数,且a,b的每一个公因数都能整除这个d(显然这个d就是最大公因数) 证明 设 且 由对称性,不妨设 Step.1 当时 Step.2 假设n=0,1,2,3,…,k-1时 ......
归纳法 算法

【动手学深度学习v2】03 环境安装

**动手学深度学习v2** https://www.bilibili.com/video/BV18p4y1h7Dr?p=2&spm_id_from=pageDriver&vd_source=a55dead799d92b4a482121a8ea042a5d 云平台:阿里云计算 操作系统:Ubuntu ......
深度 环境

自动对焦算法

自动对焦算法是相机系统中的重要组成部分,其作用是在拍摄图像时自动调整相机镜头使图像达到最清晰的效果。 常见的自动对焦算法有: 唯一对焦算法:通过对图像模糊程度的分析来确定对焦位置。 基于距离的对焦算法:通过测量相机与物体之间的距离来确定对焦位置。 基于梯度的对焦算法:通过分析图像的梯度信息来确定对焦 ......
算法

python实现迪杰斯特拉算法

Dijkstra算法可以计算出在有权图中从某个起点出发到其他任何一点的最短路径长度 算法思想: 迪杰斯特拉算法主要特点是从起始点开始,采用贪心算法的策略,每次遍历到始点距离最近且未访问过的顶点的邻接节点,直到扩展到终点为止。 定义起点s,终点t,集合U表示还没有找到起点到该点的最短路径的点的集合,集 ......
算法 python