learning

浅谈在Q-learning中加入nn网络

现在想实现一个基础的强化学习CartPole。我要使用c语言完成整个项目,方便后续部署到开发板(也许方便吧)。 现在已经完成: 模拟cart(车)和pole(杆)的运动部分,根据位置,速度,角度,角速度四个特征量来动态更新,使用静态结构体变量在程序中全局的共享和访问这些值。 可视化部分,选用2D游戏 ......
Q-learning learning 网络

Reinforcement Learning 学习笔记 1

什么是强化学习(reinforcement learning)? 假设一个场景,一个智能体(agent) 和环境(env)交互,智能体基于当前环境\(S_t\)每产生一个动作\(A_t\),环境便给它一个反馈,也被称为奖励(reward)\(R_{t+1}\), 随后,智能体的状态变为\(S_{t+ ......
Reinforcement Learning 笔记

Learn Git in 30 days—— 第 27 天:通过分支在同一个远端仓库中进行版控

写的非常好的一个Git系列文章,强烈推荐 原文链接:https://github.com/doggy8088/Learn-Git-in-30-days/tree/master/zh-cn 如果在公司内部只有一个共用的 Git 远端仓库,大家都有存取权限的情況下,可能会遇到一些协同作业上的问题,那就是 ......
分支 仓库 Learn days Git

The Road to learn React

React基础 组件内部状态 组件内部状态也称之为局部状态,允许保存、修改和删除存储在组件内部的属性 使用ES6类组件可以在构造函数种初始化组件的状态,构造函数只会在组件初始化的时候调用一次 const list = [ { title: 'React', url: 'https://faceboo ......
React learn Road The to

Paper Reading: Learning from Weak-Label Data: A Deep Forest Expedition

目录研究动机文章贡献本文方法标签补码结构标签频率估计与补码标志机制LCForest 整体框架实验结果实验设置基因功能分析任务实验文本分类任务实验场景分类任务实验医学自然语言处理实验优点和创新点 Paper Reading 是从个人角度进行的一些总结分享,受到个人关注点的侧重和实力所限,可能有理解不到 ......

Learning Hard C# 学习笔记: 8.C#中的特性 - 委托

介绍了委托的调用和它引入的原因,之后从IL的角度揭秘了委托的本质。最后介绍了委托链的概念:我们可以使用“+”运算符把一个委托添加到委托链实例中,也可以使用“-”运算符把委托实例从委托链中移除。 ......
Learning 特性 笔记 Hard

Learning Hard C# 学习笔记: 6.C#中的接口

本章主要介绍了接口的定义、实现以及对其方法的调用;分析了隐式接口实现与显式接口实现间的区别,总结了两种实现使用的一般场景;最后分析了抽象类与接口之间的差异,给出了它们在面向对象编程中的应用。 ......
Learning 接口 笔记 Hard

Learning Hard C# 学习笔记: 5.C#中的面向对象编程

本章详细介绍了C#中面向对象的3个特性——封装、继承和多态。通过这些内容,我们了解了将字段定义为私有的原因,学习了如何去继承一个类,以及如何去覆写和隐藏基类成员。最后,本章还简单地介绍了.NET中所有类的父类——System.Object 。 ......
Learning 对象 笔记 Hard

Learning Hard C# 学习笔记: 4.C#中的类

类是面向对象语言都有的一种数据类型, 它的存在在于将现实中的概念抽象概括为代码中的数据类型. 4.1 什么是类? 以人类这个概念为例, 人类就可以作为一个类, 人类是一个种群, 这个种群中包包含许多个体, 这些个体可以当作一个对象. 比如说小明就是人类中的一个个体, 他是人类这个概念具体化之后推导而 ......
Learning 笔记 Hard

Learning Hard C# 学习笔记: 3.C#语言基础

前言 由于最近工作开始重新使用了C#, 框架也是.Net4.5, 看了下, 这本书是比较合适的, 所以就重新学习了下, 由于之前本人已有C#相关基础, 所以不会所有内容都做笔记, 只会对不熟悉或者比较重要的内容做笔记. 3.2 基础数据类型 3.2.4 枚举类型 枚举类型属于值类型, 用于定义一组命 ......
语言基础 Learning 语言 基础 笔记

Deep Learning入门

深度学习入门(更新中) 概述 前置知识: 线性代数 微积分 概率论 python基础语法(包含面向对象的知识) 深度学习框架pytorch的基本api调用 学习资料: PyTorch深度学习快速入门教程 跟李沐学AI 《动手学深度学习》 — 动手学深度学习 2.0.0 documentation ( ......
Learning Deep

Pink Noise Is All You Need: Colored Noise Exploration in Deep Reinforcement Learning

郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Published as a conference paper at ICLR 2023 ABSTRACT ......

mlpack is an intuitive, fast, and flexible header-only C++ machine learning library

https://github.com/mlpack/mlpack README.md a fast, header-only machine learning library Home | Documentation | Community | Help | IRC Chat Download: c ......

Learning Auxiliary Monocular Contexts Helps Monocular 3D Object Detection (3)

损失函数分为3种类型: (1) 对于热力图,用以下的Focal Loss计算: (2) 对于深度,采用Laplacian aleatoric uncertainty loss function for depth计算: (3) 对于尺寸采用L1 Loss计算: ......

scikit-learn

sklearn是Python的一个第三方机器学习库,全称为scikit-learn。它提供了多种机器学习方法,如分类、回归和聚类算法等,包括支持向量机、随机森林、梯度提升、k均值和DBSCAN等。用户可以通过调用sklearn库中的模块来执行大多数机器学习任务,而无需自己实现算法。在安装和使用skl ......
scikit-learn scikit learn

【流行前沿】DRAG Divergence-based Adaptive Aggregation in Federated learning on Non-IID Data

今天再分享一篇9月的联邦学习领域处理异构数据分布的文章。看挂名是复旦的王昕,总的来说只能算是踏实的工作,但是新意上确实不太够。 文章的主要处理对象是解决异构数据在联邦训练中的client-drift问题,当然与很多相似论文一样,也将这个方法迁移到了拜占庭攻击的防范上。不过这个robustness仅通 ......

Learn Git in 30 days—— 第 26 天:多人在同一个远端仓库中进行版控

写的非常好的一个Git系列文章,强烈推荐 原文链接:https://github.com/doggy8088/Learn-Git-in-30-days/tree/master/zh-cn 一个人用的版本控制,只能算是当作原始码历史备份工具,在大多数的情況下,版本控制机制都是设计给多人共同使用的,尤其 ......
仓库 多人 Learn days Git

Learn Git in 30 days—— 第 25 天:使用 GitHub 远端仓库 - 观念篇

写的非常好的一个Git系列文章,强烈推荐 原文链接:https://github.com/doggy8088/Learn-Git-in-30-days/tree/master/zh-cn 上一篇大家学会了如何下载远端仓库 (git clone, git pull) 与上传远端仓库 (git push ......
仓库 观念 GitHub Learn days

论文解读(CR-Match)《Revisiting Consistency Regularization for Semi-Supervised Learning》

Note:[ wechat:Y466551 | 可加勿骚扰,付费咨询 ] 论文信息 论文标题:Revisiting Consistency Regularization for Semi-Supervised Learning论文作者:Yue Fan、Anna Kukleva、Bernt Schie ......

Learn Git in 30 days—— 第 24 天:使用 GitHub 远端仓库 - 入门篇

写的非常好的一个Git系列文章,强烈推荐 原文链接:https://github.com/doggy8088/Learn-Git-in-30-days/tree/master/zh-cn GitHub 是目前全世界最多人采用的 Git 线上管理平台,他包含了完整的 Git 远端仓库实作,还有完整的议 ......
仓库 GitHub Learn days Git

Machine Learning for Beginners(scikit-learn module)

Machine Learning Common Lifycycle Import the Data Clean the Data Split the Data into Training/Test Sets Create a Model Train the Model Make Prediction ......

Learn Everyday English for Speaking

专有名词 salmon:三文鱼 chocolate fountain:巧克力喷泉 drum and bass: 鼓和贝斯 Spaghetti:意大利面 adrenaline:肾上腺素 首句English You're telling me? 还用你说。这是一个表示“你不用告诉我,我已经知道了”的表达 ......
Everyday Speaking English Learn for

Learn Git in 30 days—— 第 23 天:修正 commit 过的版本历史记录 Part 5

写的非常好的一个Git系列文章,强烈推荐 原文链接:https://github.com/doggy8088/Learn-Git-in-30-days/tree/master/zh-cn 我们上一篇文章谈到的 Rebase 是用来将现有的两个分支进行「重新指定基础版本」,执行 Rebase 之后,也 ......
版本 commit 历史 Learn days

Learn Git in 30 days——第 22 天:修正 commit 过的版本历史记录 Part 4 (Rebase)

写的非常好的一个Git系列文章,强烈推荐 原文链接:https://github.com/doggy8088/Learn-Git-in-30-days/tree/master/zh-cn 我们之前已经讲了三种不同的修正版本的方法,严格上来说 git revert 与 git cherry-pick  ......
版本 commit Rebase 历史 Learn

Learn Git in 30 days——第 21 天:修正 commit 过的版本历史记录 Part 3

写的非常好的一个Git系列文章,强烈推荐 原文链接:https://github.com/doggy8088/Learn-Git-in-30-days/tree/master/zh-cn 在版本控制过程中,还有个常见的状況,那就是当你在一个分支中开发了一段时间,但后来决定整个分支都不要了,不过当中却 ......
版本 commit 历史 Learn days

Ranking Distillation: Learning Compact Ranking Models With High Performance for Recommender System

目录概符号说明Ranking Distillation代码 Tang J. and Wang K. Ranking Distillation: Learning compact ranking models with high performance for recommender system. ......

Efficient Off-Policy Meta-Reinforcement Learning via Probabilistic Context Variables

郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Proceedings of the 36th International Conference on Machine Learning, PMLR 97:5331-5340, 2019 ......

MonoNeRF: Learning Generalizable NeRFs from Monocular Videos without Camera Poses

1. 论文简介 论文题目:MonoNeRF: Learning Generalizable NeRFs from Monocular Videos without Camera Poses Paper地址:chrome-extension://efaidnbmnnnibpcajpcglclefind ......

Meta-Reinforcement Learning of Structured Exploration Strategies

郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! NeurIPS 2018 ......