RL

用 Gaussian Process 建模 state-action 空间相关性，加速 Multi-Fidelity RL

基于 14 年的 MFRL 论文，利用相邻 state-action 的空间相关性来加速学习，用 gaussian processes 建模 env dynamics（model-based）/ Q function（model-free），得到了两种跟 14 年 MFRL 很相似的算法。 ......

相关性 Multi-Fidelity state-action Gaussian Fidelity更新时间 2023-04-16

数据结构玩转数据结构 12-6 LR和RL的实现

0 课程地址 https://coding.imooc.com/lesson/207.html#mid=14351 1 重点关注 1.1 破坏二分搜索树的四种情况左左LL:新插入的节点导致不平衡，向上回溯找到第一个不平衡的节点在左孩子的左侧右右RR:新插入的节点导致不平衡，向上回溯找到第一个不平 ......

数据结构结构数据 12更新时间 2023-04-16

打着 multi-fidelity RL 旗号，然而幼稚监督学习 + 迁移学习

RL episode 长度 = 1，先用 PPO 在 low-fidelity env 上学；维护一个 reward 的方差，如果方差足够小，就从 low-fidelity env 迁移到 high-fidelity env。 ......

旗号 multi-fidelity fidelity multi RL更新时间 2023-04-15

AD823AARZ-RL-ASEMI代理亚德诺AD823AARZ-RL车规级芯片

编辑-Z AD823AARZ-RL芯片参数：型号：AD823AARZ-RL −3dB带宽：17 MHz 全功率响应：4.8 MHz 斜率：30 V/µs 输入电压噪声：14 nV/√Hz 输入电流噪声：1 fA/√Hz 初始偏移量：0.12mV 输入偏置电流：0.3 pA 输入失调电流：0.3 p ......

AARZ AARZ-RL-ASEMI 823 芯片 AARZ-RL更新时间 2023-04-15

电网管理中的分层决策 matlab源代码我们应用强化学习(RL)方法来用于实时电网可靠性提出了一个交错的双mdp模型，启发了电网可靠性管理的层次决策问题

电网管理中的分层决策 matlab源代码，代码按照高水平文章复现，保证正确电网管理是一个多时间尺度决策和随机行为的难题。在面对不确定性的情况下解决这一问题需要一种具有易于处理的算法的新方法。引入了一个新的复杂系统的层次决策模型。我们应用强化学习(RL)方法来用于实时电网可靠性。我们设计了一 ......

电网可靠性源代码实时模型更新时间 2023-04-13

ASEMI代理AD823AARZ-RL原装ADI车规级AD823AARZ-RL

编辑：ll ASEMI代理AD823AARZ-RL原装ADI车规级AD823AARZ-RL 型号：AD823AARZ-RL 品牌：ADI /亚德诺封装：SOIC-8 批号：2023+ 安装类型：表面贴装型引脚数量：8 类型：车规级芯片 AD823AARZ-RL特性单电源供电轨到轨输出摆幅输 ......

AARZ-RL AARZ 原装 823 ASEMI更新时间 2023-04-10

RL 的探索策略 | Exploration for RL

最近在草率地调研 RL 的 exploration。这篇文章也比较草率，仅能起到辅助作用，不能代替读 review 或更精细的读 paper。 1 主要参考资料 https://www.sciencedirect.com/science/article/pii/S1566253522000288 ......

Exploration 策略 RL for更新时间 2023-04-06

多精度 simulator 中的 RL：一篇 14 年 ICRA 的古早论文

论文题目：Reinforcement learning with multi-fidelity simulators，是 14 年的 ICRA 会议的论文。师兄说是 robotics 顶会，但中稿率蛮高的。 ......

精度 simulator 论文 ICRA 14更新时间 2023-04-03

共38篇 :2/2页 首页上一页12下一页尾页