算法 树叶tensorflow模型

机器学习算法原理实现——xgboost,核心是加入了正则化和损失函数二阶泰勒展开

先看总的图: 本质上就是在传统gbdt的决策树基础上加入了正则化防止过拟合,以及为了让损失函数求解更方便,加入了泰勒展开,这样计算损失函数更方便了(除了决策树代码有差别,其他都是gbdt一样,本文仅实现xgboost的决策树)。如下: 再解释各个步骤: 。。。 让gpt来汇总下: 好了,我们直接写下 ......
正则 算法 函数 损失 原理

Llama2-Chinese项目:2.2-大语言模型词表扩充

因为原生LLaMA对中文的支持很弱,一个中文汉子往往被切分成多个token,因此需要对其进行中文词表扩展。思路通常是在中文语料库上训练一个中文tokenizer模型,然后将中文tokenizer与LLaMA原生tokenizer进行合并,最终得到一个扩展后的tokenizer模型。国内Chinese ......
词表 Llama2-Chinese 模型 Chinese 语言

算法学习笔记(mkdir

算法学习笔记 数据结构 图论 树上问题 欧拉序 图上问题 kruskal重构树 数论 数论分块 ......
算法 笔记 mkdir

基础二分算法:整数二分、浮点二分

1、整数二分 以acwing 789为例,题目要求如下: 第一行输入整数n和q,表示数组长度和询问个数。 第二行输入数组,包含n个整数。 接下来q行,每一行一个整数k,表示一个问询元素。 要求输出q行,每行包含两个整数,表示所求元素的起始位置和终止位置。 如果数组中不存在该元素,则返回 -1 -1。 ......
浮点 整数 算法 基础

算法刷题:DP专题(9.16,持续更)

算法刷题系列上期: 递归、栈/队列、树、回溯、DP(8.29) 数组指针、前缀和/差分/树状数组、滑窗/单调队列/滚动哈希、二分(8.13) 链表题(8.29) 目录动态规划基础状态状态转移函数题目三角形最小路径和 动态规划基础 状态 状态转移函数 题目 三角形最小路径和 时间:3ms 击败 77% ......
算法 专题 9.16 16

AI打游戏-肆(模型训练)

AI打游戏-肆(bilibili) 目标 pip安装依赖 (可选)安装GPU版pytorch 自定义训练配置,模型训练 步骤 文档 ultralytics官方文档 ultralytics开源项目 视频:TOLOv8训练自己的数据集 文章:安装CUDA后,pytorch仍然无法启用GPU pip安装依 ......
模型

基于间隔密度的概念漂移检测算法mdm-DDM

概念漂移 ​ 概念漂移是数据流挖掘领域中一个重要的研究点。传统的机器学习算法在操作时通常假设数据是静态的,其数据分布不会随着时间发生变化。然而对于真实的数据流来说,由于数据流天生的时间性,到达的数据的分布可能会随着时间的推移不断改变。这使得传统的批处理模型不适合对数据流的进行挖掘分析,模型更是需要有 ......
算法 密度 概念 mdm-DDM mdm

基础算法:快速排序、归并排序

1、快速排序 #include <iostream> using namespace std; const int N = 1e5 + 10; int n, q[N]; void qksort(int q[], int l, int r) { if (l >= r) return; int x = ......
算法 基础

代码随想录算法训练营第十天

代码随想录算法训练营第十天 | LeetCode 20(有效的括号) LeetCode 1047(删除字符串中的所有相邻重复项) LeetCode 150(逆波兰表达式求值) 20:有效的括号 LeetCode 20(有效的括号) 方法一 import java.util.Stack; class ......
随想录 训练营 随想 算法 代码

5.进程线程模型你知道多少?

5.进程线程模型你知道多少? 1.进程 进程创建与结束 背景知识: 进程有两种创建方式,一种是操作系统创建的一种是父进程创建的。从计算机启动到终端执行程序的过程为:0号进程 -> 1号内核进程 -> 1号用户进程(init进程) -> getty进程 -> shell进程 -> 命令行执行进程。所以 ......
线程 进程 模型

tortoise-orm 使用雪花算法生成主键ID

import time from tortoise import Tortoise, fields, run_async from tortoise.models import Model from typing import Any class Snowflake: def __init__(se ......
tortoise-orm 算法 雪花 tortoise orm

【代码随想录算法训练营第3天】704. 二分查找、27. 移除元素

Day1-数组2023.5.20 2023.9.14二刷 Leetcode704 二分查找 给定一个 n 个元素有序的(升序)整型数组 nums 和一个目标值 target ,写一个函数搜索 nums 中的 target,如果目标值存在返回下标,否则返回 -1。 初解 已经不记得二分查找了,遍历找\ ......
随想录 训练营 随想 算法 元素

机器学习算法原理实现——gbdt

前面的文章介绍了决策树的实现,我们基于之前决策树的实现(https://www.cnblogs.com/bonelee/p/17691555.html),写一个gbdt: import numpy as np from sklearn.model_selection import train_tes ......
算法 原理 机器 gbdt

lecode算法题 小总结

. . . . . . . 1 打印9x9 乘法表 # python版 for i in range(1, 10): for k in range(1, i + 1): print(f'{i}X{k} \t', end='') print('\n') # c版 #include <stdio.h> ......
算法 lecode

机器学习算法原理实现——adaboost,三个臭皮匠顶个诸葛亮

adaboost算法的基本原理是什么?举一个简单的例子说明呢 AdaBoost(Adaptive Boosting)是一种集成学习方法,其基本原理是结合多个弱学习器来构建一个强学习器。AdaBoost的工作方式如下: 权重初始化:给定一个训练数据集,首先为每个训练样本分配一个权重,开始时这些权重都是 ......
算法 adaboost 原理 机器 三个

Manacher——最快的找最长回文算法

Manacher 马拉车——Manacher算法解决的问题 给定一串字符串str,求str内的最长回文子串,我们可以从最朴素的算法开始,逐渐深入Manacher算法。 朴素穷举法 一直枚举字符串str的子串,并判断子串是否为回文。这个时间复杂度直接到\(O(n^3)\)了,一般题目都会超时。 中心扩 ......
回文 算法 Manacher

作业2:个人项目:论文查重算法

作业2:个人项目:论文查重算法 作业所属课程 计科21级12班 班级博客 作业要求 个人项目 - 作业 作业目标 设计一个论文查重算法 作业github地址:kai-wei-kfuse/kai-wei-kfuse (github.com) (test.py文件即为代码文件,如需要运行,则按以下路径打 ......
算法 项目 论文 个人

银行家舍入法(金额算法,也用于电商系统计算金额)

一、简单来说就是: 四舍、六入、五考虑,五后非零就进一,五后为零看奇偶,五前为偶应舍去,五前为奇要进一。 二、详细来说: 1:小于等于四,直接舍去该位 2:大于等于六,向前位进一 3:等于五 3.1:五后有数,向前位进一 3.2:五后全零 3.2.1:五前位数值为奇,则向前位进一(将前位凑成偶) 3 ......
金额 入法 算法 银行 系统

代码随想录算法训练营-回溯算法|455. 分发饼干、376. 摆动序列

1.贪心算法一般分为如下四步: 将问题分解为若干个子问题 找出适合的贪心策略 求解每一个子问题的最优解 将局部最优解堆叠成全局最优解 455. 分发饼干 1. 局部最优就是大饼干喂给胃口大的,充分利用饼干尺寸喂饱一个,全局最优就是喂饱尽可能多的小孩。 时间复杂度:O(nlogn) 空间复杂度:O(1 ......
算法 随想录 训练营 序列 饼干

如何成功将 API 客户的 transformer 模型推理速度加快 100 倍

🤗 Transformers 已成为世界各地数据科学家用以探索最先进 NLP 模型、构建新 NLP 模块的默认库。它拥有超过 5000 个预训练和微调的模型,支持 250 多种语言,任君取用。无论你使用哪种框架,都能用得上它。 虽然在 🤗 Transformers 中试验模型很容易,但以最高性能 ......
transformer 模型 速度 客户 API

基于机器学习的情绪识别算法matlab仿真,对比SVM,LDA以及决策树

1.算法理论概述 情绪识别是一种重要的情感分析任务,旨在从文本、语音或图像等数据中识别出人的情绪状态,如高兴、悲伤、愤怒等。本文介绍一种基于机器学习的情绪识别算法,使用三种常见的分类算法:支持向量机(SVM)、线性判别分析(LDA)和决策树,通过对比这三种算法在情绪识别任务上的性能,选取最优的算法进 ......
算法 情绪 机器 matlab SVM

m基于uw导频序列和cordic算法的基带数据帧频偏估计和补偿FPGA实现,包含testbench

1.算法仿真效果 本系统进行了Vivado2019.2平台的开发,测试结果如下: 我们可以看到,带有频偏的基带信号o_I_fre和o_Q_fre得到了有效的频偏补偿,其补偿后的数据o_Ir和o_Qr和原始的基带数据基本一致。 2.算法涉及理论知识概要 基带数据帧频偏估计和补偿是一种用于纠正数字通信系 ......
基带 序列 算法 testbench 数据

代码随想录算法训练营第九天

代码随想录算法训练营第九天 | LeetCode 232(用栈实现队列) LeetCode 225(用队列实现栈) 栈和队列理论基础 定义 栈(stack ),一种遵循先进后出(FILO—First-In/Last-Out)原则的线性存储结构。 队列(queue),一种遵循先进先出(FIFO—fir ......
随想录 训练营 九天 随想 算法

代码随想录算法训练营第10天| 232.用栈实现队列 ● 225. 用队列实现栈

栈和队列 232.用栈实现队列 stack: queue: 卡哥代码 一个入栈,一个出栈,即可模拟队列的pop操作 pop之前要检查出栈是否为空 若为空,则排出入栈里所有的元素至出栈中 class MyQueue { public: stack<int> stackIn; stack<int> st ......
队列 随想录 训练营 随想 算法

【算法进阶课】动态规划笔记

基环树DP 一些基本概念: 在一棵树上加一条边,就会构成一个环,环上会挂着一些子树。 基环树是只有一个环的仙人掌。 如果基环树的边是有向边,环上的点是p1, p2, p3, ... 则环上的边是p1->p2, p2->p3, ..., pn->p1 或者全部反过来 总之就是环上的边要么全部逆时针要么 ......
算法 笔记 动态

3 - 任务调度算法 & 同步与互斥 &队列

之前的都是按照优先级不同允许抢占(不讲道理),不管你在做什么,轮到优先级最高的任务,直接抢占执行 怎样才能讲道理呢?稍微等等嘛,等我做完活你再做 1 支持抢占,0不支持抢占 同优先级任务是否交替执行,1交替0不交 空闲任务是否礼让其他任务 礼让的话,自己的函数逻辑在时间片内只执行一遍,然后调度 不支 ......
队列 算法 amp 任务

halcon AI读取onnx模型并推理

*程序功能:读取onnx模型并推理dev_update_off()dev_close_window () read_dl_model ('squeezenet.onnx', DLModelHandle)set_dl_model_param (DLModelHandle, 'type', 'class ......
模型 halcon onnx

Python并发编程——IO模型、阻塞IO、非阻塞IO、多路复用、异步IO、IO模型比较、selectors模块、复习网络和并发知识点

文章目录 每日测验一 IO模型介绍二 阻塞IO(blocking IO)三 非阻塞IO(non-blocking IO)四 多路复用IO(IO multiplexing)五 异步IO(Asynchronous I/O)六 IO模型比较分析七 selectors模块网络并发知识点梳理网络并发知识点梳理 ......
模型 知识点 selectors 模块 知识

自回归语言模型简介

自回归语言模型(Autoregressive Language Model)是一种用于生成文本的统计模型。它基于序列数据的概率分布,通过建模当前词语与前面已生成词语的条件概率来预测下一个词语。 在自回归语言模型中,假设我们有一个文本序列,例如一段连续的句子。模型的目标是根据前面已生成的词语来预测下一 ......
模型 语言 简介

Gradio:为你的机器学习模型快速构建Web UI

Gradio是一个开源库,用于仅使用Python构建易于使用且易于共享的应用程序。它特别适用于机器学习项目,旨在使测试、共享和展示模型简单直观。 安装 Gradio的安装非常简单,直接使用pip即可安装: pip install gradio 创建第一个程序 import gradio as gr ......
模型 机器 Gradio Web UI