learning summary second the

浅谈在Q-learning中加入nn网络

现在想实现一个基础的强化学习CartPole。我要使用c语言完成整个项目,方便后续部署到开发板(也许方便吧)。 现在已经完成: 模拟cart(车)和pole(杆)的运动部分,根据位置,速度,角度,角速度四个特征量来动态更新,使用静态结构体变量在程序中全局的共享和访问这些值。 可视化部分,选用2D游戏 ......
Q-learning learning 网络

BCEWithLogitsLoss报错RuntimeError: result type Float can't be cast to the desired output type Long

loss = F.binary_cross_entropy_with_logits(input, target) input错写成了Long类型,target错写成了Int类型 input与target需要的是float类型 ......

Reinforcement Learning 学习笔记 1

什么是强化学习(reinforcement learning)? 假设一个场景,一个智能体(agent) 和环境(env)交互,智能体基于当前环境\(S_t\)每产生一个动作\(A_t\),环境便给它一个反馈,也被称为奖励(reward)\(R_{t+1}\), 随后,智能体的状态变为\(S_{t+ ......
Reinforcement Learning 笔记

CF1051F The Shortest Statement

很经典的题了,不如说这种带有\(m-n\)很小这类限制的题的处理方法基本都如出一辙 由于图连通因此先搞个生成树出来,考虑非树边的数量很少,因此对于每组询问可以先用LCA求出两点间只经过树边的最短距离 考虑每条树边会如何影响答案,其实无非就是会经过这条树边的某个端点罢了,因此我们把非树边的端点都拿出来 ......
Statement Shortest 1051F 1051 The

Learn Git in 30 days—— 第 27 天:通过分支在同一个远端仓库中进行版控

写的非常好的一个Git系列文章,强烈推荐 原文链接:https://github.com/doggy8088/Learn-Git-in-30-days/tree/master/zh-cn 如果在公司内部只有一个共用的 Git 远端仓库,大家都有存取权限的情況下,可能会遇到一些协同作业上的问题,那就是 ......
分支 仓库 Learn days Git

The Road to learn React

React基础 组件内部状态 组件内部状态也称之为局部状态,允许保存、修改和删除存储在组件内部的属性 使用ES6类组件可以在构造函数种初始化组件的状态,构造函数只会在组件初始化的时候调用一次 const list = [ { title: 'React', url: 'https://faceboo ......
React learn Road The to

G. Vlad and the Mountains

G. Vlad and the Mountains 题意:给你每个点的高度,从a到b需要消耗h[b]-h[a]的体力值(所以说下坡时体力值可以增加),询问一开始你有e的体力值,问是否可以从u->v点 分析: 1.a->b最终消耗的体力值一定为h[b]-h[a],如果一开始的体力值都达不到肯定无法过 ......
Mountains Vlad and the

QT在debug环境下的异常报错 This application failed to start because no Qt platform plugin could be initialized. Reinstalling the application may fix this problem.

查看错误信息:试试Release 检查 控制台 (/SUBSYSTEM:CONSOLE) 输入错误信息,修改全部报错信息后再试试Debug模式可不可以运行。 方案一:高级系统设置-环境变量- QT_QPA_PLATFORM_PLUGIN_PATH C:\Qt\Qt5.12.12\5.12.12\ms ......

‘Proof of the pudding’: Global variables and PAGE_EXECUTE_WRITECOPY

‘Proof of the pudding’: Global variables and PAGE_EXECUTE_WRITECOPY UNCATEGORIZED PRODUCTION DEBUGGING, WINDBG LEAVE A COMMENT Today I was teaching a ......

【NIPS2021】Twins: Revisiting the Design of Spatial Attention in Vision Transformers

来自美团技术团队♪(^∀^●)ノシ 论文地址:https://arxiv.org/abs/2104.13840 代码地址:https://git.io/Twins 一、写在前面 本文提出了两种视觉转换器架构,即Twins-PCPVT和Twins-SVT。 Twins-PCPVT 将金字塔 Trans ......

Paper Reading: Learning from Weak-Label Data: A Deep Forest Expedition

目录研究动机文章贡献本文方法标签补码结构标签频率估计与补码标志机制LCForest 整体框架实验结果实验设置基因功能分析任务实验文本分类任务实验场景分类任务实验医学自然语言处理实验优点和创新点 Paper Reading 是从个人角度进行的一些总结分享,受到个人关注点的侧重和实力所限,可能有理解不到 ......

smb this client does not support the negotiated dialect

global添加以下配置信息 [global] min protocol = LANMAN2 min protocol = SMB2 max protocol = SMB2 client min protocol = SMB2 client max protocol = SMB2 ......
negotiated dialect support client does

F. Lisa and the Martians

F. Lisa and the Martians 问题求y =(a[i] ^ x)& (a[j] ^ x)最大,可知x可自由选择,那么我们就考虑y怎么取最大值 1.根据&,可知a[i]a[j]1时,二进制该位置为1,若x可使得俩位置为1,那么就转换成最多的a[i]==a[j]的位置,也就是a[i]^ ......
Martians Lisa and the

Exception in thread "main" java.lang.UnsupportedClassVersionError: org/example/JobMain has been compiled by a more recent version of the Java Runtime (class file version 61.0), 问题的解决(未解决)

问题描述 使用hadoop在虚拟机里面运行打包的程序出错: 问题解决 真的服了,貌似是jdk的版本啥的问题,搜了好多,就是解决不了,求助求助啊! ......

The 2021 ICPC Asia Macau Regional Contest

A. So I'll Max Out My Constructive Algorithm Skills 首先一行正一行反的把所有的行拼到一起,然后判断一下正着走时候合法不合法就反过来走就好。 #include <bits/stdc++.h> using namespace std; #define ......
Regional Contest Macau 2021 ICPC

The 2022 ICPC Asia Jinan Regional Contest

A. Tower 首先用了 dp 验证出把一个数字变成另一个数字的最优解一定是能除就先进行除法,然后再使用加一减一。 这样我们就有\(O(\log n)\)的复杂度求出把一个数变成另一个数的最小代价。 然后就是猜测最终的目标一定是某个数除了若干次二得到的。所以就枚举一下目标即可。 #include ......
Regional Contest Jinan 2022 ICPC

Learning Hard C# 学习笔记: 8.C#中的特性 - 委托

介绍了委托的调用和它引入的原因,之后从IL的角度揭秘了委托的本质。最后介绍了委托链的概念:我们可以使用“+”运算符把一个委托添加到委托链实例中,也可以使用“-”运算符把委托实例从委托链中移除。 ......
Learning 特性 笔记 Hard

Learning Hard C# 学习笔记: 6.C#中的接口

本章主要介绍了接口的定义、实现以及对其方法的调用;分析了隐式接口实现与显式接口实现间的区别,总结了两种实现使用的一般场景;最后分析了抽象类与接口之间的差异,给出了它们在面向对象编程中的应用。 ......
Learning 接口 笔记 Hard

Learning Hard C# 学习笔记: 5.C#中的面向对象编程

本章详细介绍了C#中面向对象的3个特性——封装、继承和多态。通过这些内容,我们了解了将字段定义为私有的原因,学习了如何去继承一个类,以及如何去覆写和隐藏基类成员。最后,本章还简单地介绍了.NET中所有类的父类——System.Object 。 ......
Learning 对象 笔记 Hard

asp.net mvc Core 网页错误提示:An unhandled exception occurred while processing the request.处理请求时发生未处理的异常。

网页错误提示: An unhandled exception occurred while processing the request. InvalidOperationException: The entity type 'IdentityUserLogin<string>' requires ......

The 2018 ACM-ICPC Asia Qingdao Regional Contest, Online (The 2nd Universal Cup

The 2018 ACM-ICPC Asia Qingdao Regional Contest, Online (The 2nd Universal Cup. Stage 1: Qingdao) J - Press the Button \(1 \leq a, b, c, d \leq 10^6\) ......
The Universal ACM-ICPC Regional Contest

Learning Hard C# 学习笔记: 4.C#中的类

类是面向对象语言都有的一种数据类型, 它的存在在于将现实中的概念抽象概括为代码中的数据类型. 4.1 什么是类? 以人类这个概念为例, 人类就可以作为一个类, 人类是一个种群, 这个种群中包包含许多个体, 这些个体可以当作一个对象. 比如说小明就是人类中的一个个体, 他是人类这个概念具体化之后推导而 ......
Learning 笔记 Hard

Learning Hard C# 学习笔记: 3.C#语言基础

前言 由于最近工作开始重新使用了C#, 框架也是.Net4.5, 看了下, 这本书是比较合适的, 所以就重新学习了下, 由于之前本人已有C#相关基础, 所以不会所有内容都做笔记, 只会对不熟悉或者比较重要的内容做笔记. 3.2 基础数据类型 3.2.4 枚举类型 枚举类型属于值类型, 用于定义一组命 ......
语言基础 Learning 语言 基础 笔记

The 2023 CCPC Online Contest (The 2nd Universal Cup, Stage 3: Binjiang)

题解: https://files.cnblogs.com/files/clrs97/CCPC-Online-2023-%E9%A2%98%E8%A7%A3.pdf Code: A. Almost Prefix Concatenation #include<cstdio> #include<cstr ......
The Universal Binjiang Contest Online

The 20th Zhejiang Provincial Collegiate Programming Contest Sponsored by TuSimple

题解: https://files.cnblogs.com/files/clrs97/2023_ZJCPC_Tutorial.pdf Code: A. Look and Say #include<bits/stdc++.h> using namespace std; int main() { ios ......

The 2023 ICPC Asia EC Regionals Online Contest (I) - Problem C. Multiply Then Plus

离线询问,建立时间线段树,那么每条直线存在的时间是一个区间,对应时间线段树上$\mathcal{O}(\log n)$个节点,每个询问对应时间线段树上某个叶子到根的$\mathcal{O}(\log n)$ 个节点。 对于时间线段树中的某个节点,它代表的直线集合是静态的,问题转化为静态区间查询。对于 ......
Regionals Multiply Contest Problem Online

The 2023 ICPC Asia EC Regionals Online Contest (I) - Problem H. Range Periodicity Query

对于一个周期长度$p$来说,如果它不是$S_k$的周期,那么它一定不是$S_{k+1}$的周期,因此可以二分出分界线$t_p$满足它是$S_p,S_{p+1},S_{p+2},\dots,S_{t_p}$的周期,但不是$S_{t_p+1}$的周期。对于一个询问$(k,l,r)$,问题等价于寻找区间中 ......
Periodicity Regionals Contest Problem Online

The 2023 ICPC Asia Hong Kong Regional Programming Contest (The 1st Universal Cup, Stage 2:Hong Kong)

题解: https://files.cnblogs.com/files/clrs97/2022Hong_Kong_Tutorial.pdf Code: A. TreeScript #include <bits/stdc++.h> using namespace std; using LL = lon ......
Hong Kong Programming The Universal

The 2022 ICPC Asia Hangzhou Regional Programming Contest

题解: https://files.cnblogs.com/files/clrs97/2022ICPCHangzhouTutorial.pdf Code: A. Modulo Ruins the Legend #include<bits/stdc++.h> using namespace std; ......
Programming Hangzhou Regional Contest 2022

Madoka and The Best University (cf E)( 枚举一个其中一个元素,欧拉函数,gcd)

#include<iostream> #include<cstring> using namespace std; const int Maxn=1e7; int phi[Maxn];//记录数的约数个数(欧拉函数) bool vis[Maxn];//记录数字是否访问 int prime[Maxn] ......
University 函数 元素 Madoka Best