算法 机器 生物 信息

地下城地图图块生成算法

一. 概述 生成地下城,包含房间和迷宫通路。类似: 示例效果一 示例效果二 二. 思路 1.生成迷宫通路 从房间的边缘坐标XY为奇数的格子生成迷宫,确保房间和迷宫通路之间有间隔墙壁(除了蓝色格子视为墙壁)。 迷宫通路生长每次探测两个格子,确保迷宫通路间有间隔墙壁。 2.生成过程 三. 代码示例 位置 ......
算法 地图

小技巧 EntityFrameworkCore 实现 CodeFirst 通过模型生成数据库表时自动携带模型及字段注释信息

今天分享自己在项目中用到的一个小技巧,就是使用 EntityFrameworkCore 时我们在通过代码去 Update-Database 生成数据库时如何自动将代码模型上的注释和字段上的注释携带到数据库中,方便后续在数据库直接查看各个表和各个字段的含义。 实现效果如下: 可以看到我们每张表都有明确 ......

一文带你入木三分地理解字符串KMP算法(next指针解法)

1. KMP算法简介 温馨提示:在通篇阅读完并理解后再看简介效果更佳 以下简介由百度百科提供https://baike.baidu.com/item/KMP%E7%AE%97%E6%B3%95/10951804: KMP算法是一种改进的字符串匹配算法,由D.E.Knuth,J.H.Morris和V. ......
入木三分 解法 字符串 指针 算法

【机器学习】李宏毅——机器学习任务攻略

【机器学习】李宏毅——机器学习任务攻略,主要内容是讲解了如果出现了测试集误差较大的情况应该如何进行判断以及解决 ......
机器 任务攻略 任务 攻略

【机器学习】李宏毅——Explainable ML(可解释性的机器学习)

在前面的学习之中,我们已经学习了很多的模型,它能够针对特定的任务,接受我们的输入并产生目标的输出。但我们并不满足于此,我们甚至希望机器告诉我们,它是如何得到这个答案的,而这就是可解释的机器学习。 Why we need Explainable ML 首先我们要明确,即使我们训练出来的模型能够得到一个 ......
解释性 机器 Explainable ML

机器学习——人脸性别识别

一、选题背景 人脸识别技术是模式识别和计算机视觉领域最富挑战性的研究课题之一,也是近年来的研究热点,人脸性别识别作为人脸识别技术的重要组成部分也受到了广泛地关注。人脸性别识别就是向计算机输入人脸图像,经过某种方法或运算,得出其性别。这种识别对人眼来说很简单,但对计算机却并不是一件容易的事情。 二、机 ......
人脸 性别 机器

【机器学习】李宏毅——Transformer

本文详细地介绍了Transformer算法,介绍了其内部重要的Encoder和Decoder,以及具体的实现过程和原理,还介绍了其训练过程以及训练过程中应该注意的种种问题。 ......
Transformer 机器

【机器学习】李宏毅——线性降维

降维,可以用下面这张图来很简单的描述,就是将不同的、复杂的多种树都抽象成最简单的树的描述,也就是我们不关心这棵树长什么样子有什么特别的特征,我们只需要降维,知道它是一棵树即可。 维度下降实际上就是找到一个function,使得输入x得到输出z,而输出z的维度要比输入x的维度小。具体有几种方面,下面就 ......
线性 机器

【机器学习】李宏毅——自监督式学习

本文介绍了近几年比较火热的自监督式学习,并介绍了其中最具有代表性的BERT算法和GPT算法,其中对BERT算法进行了详细叙述。 ......
机器

【机器学习】李宏毅——Unsupervised Learning

读这篇文章之间欢迎各位先阅读我之前写过的线性降维的文章。这篇文章应该也是属于Unsupervised Learning的内容的。 Neighbor Embedding Manifold Learning(流形学习) 在实际的数据中,很可能会存在这一种分布: 左边这个分布可以看成原先在二维平面上的分布 ......
Unsupervised Learning 机器

【机器学习】李宏毅——生成式对抗网络GAN

本文非常详细的介绍什么是生成式对抗网络GAN,以及GAN内部的实现原理,包括各种GAN的训练技巧和变形等等内容。 ......
机器 网络 GAN

【机器学习】李宏毅——Anomaly Detection(异常检测)

本篇文章主要介绍了Anomaly Detection(异常检测)的思路具体实现方法,以及可能在实际应用中遇到的各种情况。 ......
Detection 机器 Anomaly

【机器学习】李宏毅——Adversarial Attack(对抗攻击)

本文主要介绍了Adversarial Attack(对抗攻击)当前的研究现状,包括如何攻击、攻击的类别,以及原始模型如何进行防御等相关知识点。 ......
Adversarial 机器 Attack

【机器学习】李宏毅——类神经网络训练不起来怎么办

如何判断导数值为零的点的类型 当发现训练数据集误差不再下降的时候,不是只有卡在局部最小值的情况,还有另外一种情况是处于鞍点,鞍点位置处虽然其导函数为零,但是其既不是局部最大值也不是局部最小值,如图: 因此,我们把局部最小值和鞍点这种点统称为驻点(critical point),但这两种情况是截然不同 ......
神经网络 神经 机器 怎么办 网络

【机器学习】李宏毅——Recurrent Neural Network(循环神经网络)

假设我们当前要做一个人工智能客服系统,那该系统就需要对用户输入的话语进行辨认,例如用户输入: I want to arrive Taipei on November 2nd 那么该系统就能够辨认出来Taipei是目的地,而后面是时间。那么我们可以用一个简单的前向网络来实现这个事情,输出为这个单词属于 ......
神经网络 Recurrent 神经 机器 Network

【机器学习】李宏毅——Flow-based Generative Models

本文主要介绍了Flow-based Generative Models的概念,以及其内部各个模块的主要思想,可结合我之前写过的生成模型的博客共同阅读。 ......
Flow-based Generative 机器 Models based

【机器学习】李宏毅——自注意力机制(Self-attention)

前面我们所讲的模型,输入都是一个向量,但有没有可能在某些场景中输入是多个向量,即一个向量集合,并且这些向量的数目并不是固定的呢? 这一类的场景包括文字识别、语音识别、图网络等等。 那么先来考虑输出的类型,如果对于输入是多个数目不定的向量,可以有以下这几种输出方式: 每个向量对应一个输出:输出的数目与 ......

【机器学习】李宏毅——AE自编码器(Auto-encoder)

1、What 在自编码器中,有两个神经网络,分别为Encoder和Decoder,其任务分别是: Encoder:将读入的原始数据(图像、文字等)转换为一个向量 Decoder:将上述的向量还原成原始数据的形式 而目标是希望还原出来的结果能够与原始数据尽可能的接近。其中的向量可称为Embedaing ......
编码器 Auto-encoder 编码 机器 encoder

你真的了解 RSA 加密算法吗?

作者:小傅哥 博客:https://bugstack.cn 源码:https://github.com/fuzhengwei/java-algorithms 沉淀、分享、成长,让自己和他人都能有所收获!😄 记得那是我毕业🎓后的第一个秋天,申请了域名,搭建了论坛。可惜好景不长,没多久进入论坛后就出 ......
算法 RSA

斐波那契散列算法和hashMap实践

斐波那契散列和hashMap实践 适合的场景:抽奖(游戏、轮盘、活动促销等等) 如果有不对的地方,欢迎指正! HashMap实现数据散列: 配置项目,引入pom.xml: <dependency> <groupId>com.alibaba</groupId> <artifactId>fastjson ......
算法 hashMap

[信息抽取]基于ERNIE3.0的多对多信息抽取算法:属性关系抽取

本项目讲解了基于ERNIE信息抽取技术,对属性和关系的抽取涉及多对多抽取,主要是使用可ERNIEKIT组件,整体效果非常不错,当然追求小样本学习的可以参考之前UIE项目或者去官网看看paddlenlp最新的更新,对训练和部署进行了提速。 ......
信息 算法 属性 ERNIE3 ERNIE

一文读懂!异常检测全攻略!从统计方法到机器学习 ⛵

本文系统介绍了『单变量异常检测』和『多变量异常检测』识别技术,包括传统的统计方法(四分位距、标准差),以及前沿的机器学习模型(孤立森林、DBSCAN、LOF局部离群因子)。 ......
全攻略 机器 方法

边玩边学!交互式可视化图解!快收藏这18个机器学习和数据科学网站!⛵

机器学习算法理论比较枯燥乏味,但有许多有趣且有用的网站,您可以像游戏一样交互式操作,并同时学习机器学习概念、模型和应用知识。以下是 ShowMeAI 为大家整理的18个交互式机器学习网站,学起来! ......
交互式 机器 科学 数据 网站

机器学习分类模型评价指标之ROC 曲线、 ROC 的 AUC 、 ROI 和 KS

前文回顾: 机器学习模型评价指标之混淆矩阵 机器学习模型评价指标之Accuracy、Precision、Recall、F-Score、P-R Curve、AUC、AP 和 mAP 1. 基本指标 1.1 True Positive Rate(TPR) $TPR = \frac{TP}{TP+FN}$ ......
曲线 ROC 模型 机器 指标

贪心算法篇——区间问题

贪心算法篇——区间问题 本次我们介绍贪心算法篇的区间问题,我们会从下面几个角度来介绍: 区间选点 区间分组 区间覆盖 区间选点 我们首先来介绍第一道题目: /*题目名称*/ 区间选点 /*题目介绍*/ 给定 N 个闭区间 [ai,bi],请你在数轴上选择尽量少的点,使得每个区间内至少包含一个选出的点 ......
区间 算法 问题

【开源】全网首个支持国密算法的微信支付 C#/.NET SDK(附 SM2/SM3/SM4 跨语言联调的踩坑要点)

前言 前文回顾:《【开源】这可能是封装微信 API 最全的 C#/.NET SDK 了》 自 2021 年 8 月公开发布后,本项目已开源一年有余。在此期间,受到了很多开发者的关注和使用,也接收了很多热心开源的开发者给予的帮助,无论是上报了缺陷或建议,还是发起了 PR,亦或是在社群内回答他人的提问, ......
全网 算法 要点 SM 语言

NLP手札1. 金融信息负面及主体判定方案梳理&代码实现

这个系列会针对NLP比赛,经典问题的解决方案进行梳理并给出代码复现~算是找个理由把代码从TF搬运到torch。Chapter1是CCF BDC2019的赛题:金融信息负面及主体判定,属于实体关联的情感分类任务,相关代码实现以及Top方案梳理详见ClassisSolution/fin_new_enti... ......
手札 主体 代码 方案 金融

基于Sklearn机器学习代码实战

本文主要跟随Datawhale的学习路线以及内容教程,详细介绍了机器学期常见的多个基础算法的基于sklearn的实现过程,内容丰富。 ......
实战 机器 Sklearn 代码

深度学习数学基础-概率与信息论

概率论是用于表示不确定性声明的数学框架。它不仅提供了量化不确定性的方法,也提供了用于导出新的不确定性声明(statement)的公理。概率论的知识在机器学习和深度学习领域都有广泛应用,是学习这两门学科的基础。 ......
信息论 数学基础 概率 深度 数学

【图像处理笔记】SIFT算法原理与源码分析

【图像处理笔记】总目录 0 引言 特征提取就是从图像中提取显著并且具有可区分性和可匹配性的点结构。常见的点结构一般为图像内容中的角点、交叉点、闭合区域中心点等具有一定物理结构的点,而提取点结构的一般思想为构建能够区分其他图像结构的响应函数或者从特征线或轮廓中进行稀疏采样。Harris角点检测器便是运 ......
图像处理 算法 源码 图像 原理