语言学习

深度学习炼丹-数据增强

在工业界,数据预处理步骤对模型精度的提高的发挥着重要作用。对于机器学习任务来说,广泛的数据预处理一般有四个阶段(视觉任务一般只需 Data Transformation): 数据清洗(Data Cleaning)、数据整合(Data Integration)、数据转换(Data Transforma... ......
深度 数据

深度学习炼丹-超参数调整

所谓超参数,即不是通过学习算法本身学习出来的,需要作者手动调整(可优化参数)的参数(理论上我们也可以设计一个嵌套的学习过程,一个学习算法为另一个学习算法学出最优超参数),卷积神经网络中常见的超参数有: 优化器学习率、训练 Epochs 数、批次大小 batch_size 、输入图像尺寸大小。 ......
深度 参数

Gorm源码学习-创建行记录

1. 前言 Gorm源码学习系列 Gorm源码学习-数据库连接 此文是Gorm源码学习系列的第二篇,主要梳理下通过Gorm创建表的流程。 2. 创建行记录代码示例 gorm提供了以下几个接口来创建行记录 一次创建一行 func (db *DB) Create(value interface{}) ( ......
源码 Gorm

深度学习炼丹-不平衡样本的处理

数据层面的处理方法总的来说分为数据扩充和数据采样法,数据扩充会直接改变数据样本的数量和丰富度,采样法的本质是使得输入到模型的训练集样本趋向于平衡,即各类样本的数目趋向于一致。 ......
样本 深度

.NET 云原生架构师训练营(基于 OP Storming 和 Actor 的大型分布式架构一)--学习笔记

目录 为什么我们用 Orleans Dapr VS Orleans Actor 模型 Orleans 的核心概念 为什么我们用 Orleans 分布式系统开发、测试的难度(服务发现、通信) 运维的复杂度(伸缩性与可靠性的保障) actor 拥有全局唯一身份 自动伸缩功能 Dapr VS Orlean ......
架构 分布式 Storming 笔记 Actor

【机器学习】李宏毅——自监督式学习

本文介绍了近几年比较火热的自监督式学习,并介绍了其中最具有代表性的BERT算法和GPT算法,其中对BERT算法进行了详细叙述。 ......
机器

【机器学习】李宏毅——机器学习任务攻略

【机器学习】李宏毅——机器学习任务攻略,主要内容是讲解了如果出现了测试集误差较大的情况应该如何进行判断以及解决 ......
机器 任务攻略 任务 攻略

【机器学习】李宏毅——Explainable ML(可解释性的机器学习)

在前面的学习之中,我们已经学习了很多的模型,它能够针对特定的任务,接受我们的输入并产生目标的输出。但我们并不满足于此,我们甚至希望机器告诉我们,它是如何得到这个答案的,而这就是可解释的机器学习。 Why we need Explainable ML 首先我们要明确,即使我们训练出来的模型能够得到一个 ......
解释性 机器 Explainable ML

机器学习——人脸性别识别

一、选题背景 人脸识别技术是模式识别和计算机视觉领域最富挑战性的研究课题之一,也是近年来的研究热点,人脸性别识别作为人脸识别技术的重要组成部分也受到了广泛地关注。人脸性别识别就是向计算机输入人脸图像,经过某种方法或运算,得出其性别。这种识别对人眼来说很简单,但对计算机却并不是一件容易的事情。 二、机 ......
人脸 性别 机器

【机器学习】李宏毅——Transformer

本文详细地介绍了Transformer算法,介绍了其内部重要的Encoder和Decoder,以及具体的实现过程和原理,还介绍了其训练过程以及训练过程中应该注意的种种问题。 ......
Transformer 机器

【机器学习】李宏毅——线性降维

降维,可以用下面这张图来很简单的描述,就是将不同的、复杂的多种树都抽象成最简单的树的描述,也就是我们不关心这棵树长什么样子有什么特别的特征,我们只需要降维,知道它是一棵树即可。 维度下降实际上就是找到一个function,使得输入x得到输出z,而输出z的维度要比输入x的维度小。具体有几种方面,下面就 ......
线性 机器

【机器学习】李宏毅——Unsupervised Learning

读这篇文章之间欢迎各位先阅读我之前写过的线性降维的文章。这篇文章应该也是属于Unsupervised Learning的内容的。 Neighbor Embedding Manifold Learning(流形学习) 在实际的数据中,很可能会存在这一种分布: 左边这个分布可以看成原先在二维平面上的分布 ......
Unsupervised Learning 机器

BUU_RE学习记录1

#一、easyre #1.010打开,直接搜flag,得到flag #二、reverse1 #1.先查壳,得知是64位无壳,直接用IDA打开 #2.shiftF12查找字符串,发现关键语句 #3.查看相应代码,F5反编译 #4.发现关键的比较函数,看一下分别比较的字符串 #5.发现是输入的str1和 ......
BUU_RE BUU RE

【机器学习】李宏毅——生成式对抗网络GAN

本文非常详细的介绍什么是生成式对抗网络GAN,以及GAN内部的实现原理,包括各种GAN的训练技巧和变形等等内容。 ......
机器 网络 GAN

【机器学习】李宏毅——Anomaly Detection(异常检测)

本篇文章主要介绍了Anomaly Detection(异常检测)的思路具体实现方法,以及可能在实际应用中遇到的各种情况。 ......
Detection 机器 Anomaly

【机器学习】李宏毅——Adversarial Attack(对抗攻击)

本文主要介绍了Adversarial Attack(对抗攻击)当前的研究现状,包括如何攻击、攻击的类别,以及原始模型如何进行防御等相关知识点。 ......
Adversarial 机器 Attack

【机器学习】李宏毅——类神经网络训练不起来怎么办

如何判断导数值为零的点的类型 当发现训练数据集误差不再下降的时候,不是只有卡在局部最小值的情况,还有另外一种情况是处于鞍点,鞍点位置处虽然其导函数为零,但是其既不是局部最大值也不是局部最小值,如图: 因此,我们把局部最小值和鞍点这种点统称为驻点(critical point),但这两种情况是截然不同 ......
神经网络 神经 机器 怎么办 网络

【机器学习】李宏毅——Recurrent Neural Network(循环神经网络)

假设我们当前要做一个人工智能客服系统,那该系统就需要对用户输入的话语进行辨认,例如用户输入: I want to arrive Taipei on November 2nd 那么该系统就能够辨认出来Taipei是目的地,而后面是时间。那么我们可以用一个简单的前向网络来实现这个事情,输出为这个单词属于 ......
神经网络 Recurrent 神经 机器 Network

【机器学习】李宏毅——Flow-based Generative Models

本文主要介绍了Flow-based Generative Models的概念,以及其内部各个模块的主要思想,可结合我之前写过的生成模型的博客共同阅读。 ......
Flow-based Generative 机器 Models based

【机器学习】李宏毅——自注意力机制(Self-attention)

前面我们所讲的模型,输入都是一个向量,但有没有可能在某些场景中输入是多个向量,即一个向量集合,并且这些向量的数目并不是固定的呢? 这一类的场景包括文字识别、语音识别、图网络等等。 那么先来考虑输出的类型,如果对于输入是多个数目不定的向量,可以有以下这几种输出方式: 每个向量对应一个输出:输出的数目与 ......

【机器学习】李宏毅——AE自编码器(Auto-encoder)

1、What 在自编码器中,有两个神经网络,分别为Encoder和Decoder,其任务分别是: Encoder:将读入的原始数据(图像、文字等)转换为一个向量 Decoder:将上述的向量还原成原始数据的形式 而目标是希望还原出来的结果能够与原始数据尽可能的接近。其中的向量可称为Embedaing ......
编码器 Auto-encoder 编码 机器 encoder

深度学习-网络训练流程说明

1.背景 分类神经网络模型:Mobilenetv3。 深度学习框架:PyTorch。 Mobilenetv3简单的手写数字识别: 任务输入:一系列手写数字图片,其中每张图片都是28x28的像素矩阵。 任务输出:经过了大小归一化和居中处理,输出对应的0~9数字标签。 项目参考代码:https://gi ......
深度 流程 网络

Java开发学习(四十五)----MyBatisPlus查询语句之映射匹配兼容性

1、映射匹配兼容性 我们已经能从表中查询出数据,并将数据封装到模型类中,这整个过程涉及到一张表和一个模型类: 之所以数据能够成功的从表中获取并封装到模型对象中,原因是表的字段列名和模型类的属性名一样。那么问题就来了: 问题1:表字段与编码属性设计不同步 当表的列名和模型类的属性名发生不一致,就会导致 ......
兼容性 MyBatisPlus 语句 Java

Java开发学习(四十六)----MyBatisPlus新增语句之id生成策略控制及其简化配置

在前面有一篇博客:Java开发学习(四十一) MyBatisPlus标准数据层(增删查改分页)开发,我们在新增的时候留了一个问题,就是新增成功后,主键ID是一个很长串的内容。 我们更想要的是按照数据库表字段进行自增长,在解决这个问题之前,我们先来分析下ID该如何选择: 不同的表应用不同的id生成策略 ......
MyBatisPlus 语句 策略 Java

在 win11 下搭建并使用 ubuntu 子系统(同时测试 win10)——(附带深度学习环境搭建)

对于一个深度学习从事者来说,Windows训练模型有着诸多不便,还好现在Windows的Ubuntu子系统逐渐完善,近期由于工作需求,配置了Windows的工作站,为了方便起见,搭建了Ubuntu子系统,网上教程比较多,但是都或多或少存在一些小问题(也许是他们没有遇到), 于是我自己在尝试中,将自己 ......
子系统 win 深度 同时 环境

ArcGIS QGIS学习二:图层如何只显示需要的部分几何面数据(附最新坐标边界下载全国省市区县乡镇)

前言 当我们用GIS软件打开一个SHP文件的时候,会显示出里面全部的几何图形,假如我只想要其中的一部分数据显示出来,其他的均不要显示,有那么几种操作方法。 我们可以通过把需要显示的几何面复制到另外一个图层里面来单独显示,但如果需要显示的区域一变,又要重新搞,不是很方便。 下面将记录一下我学到的解决方 ......
县乡镇 省市区 县乡 坐标 边界

一文读懂!异常检测全攻略!从统计方法到机器学习 ⛵

本文系统介绍了『单变量异常检测』和『多变量异常检测』识别技术,包括传统的统计方法(四分位距、标准差),以及前沿的机器学习模型(孤立森林、DBSCAN、LOF局部离群因子)。 ......
全攻略 机器 方法

边玩边学!交互式可视化图解!快收藏这18个机器学习和数据科学网站!⛵

机器学习算法理论比较枯燥乏味,但有许多有趣且有用的网站,您可以像游戏一样交互式操作,并同时学习机器学习概念、模型和应用知识。以下是 ShowMeAI 为大家整理的18个交互式机器学习网站,学起来! ......
交互式 机器 科学 数据 网站

前端学习 linux —— 软件安装(Ubuntu)

软件安装(Ubuntu) 本篇主要讲解 ubuntu 中软件的安装、apt 的源、内网部署案例(graylog 为例),最后是 python 开发准备。 apt 和 rpm 在linux 第一篇我们知道如果机器是 ubuntu 则可用 apt-get/dpkg 安装软件,如果是centos 则可用 ......
前端 Ubuntu linux 软件

读 RocketMQ 源码,学习并发编程三大神器

笔者是 RocketMQ 的忠实粉丝,在阅读源码的过程中,学习到了很多编程技巧。 这篇文章,笔者结合 RocketMQ 源码,分享并发编程三大神器的相关知识点。 1 CountDownLatch 实现网络同步请求 CountDownLatch 是一个同步工具类,用来协调多个线程之间的同步,它能够使一 ......
神器 源码 RocketMQ 三大