reinforcement learning

machine learning-2023-07-19

questions【链接】 │ │──math │ │──线性回归 │ │──逻辑回归 │ └──梯度下降 │ │──python │ │──numpy(科学计算库) │ │──pandas(数据分析处理库) │ │──matplotlib(数据可视化库) │ └──scikit-learn(机器学 ......
learning machine 2023 07 19

Learn about some useful truck diagnostic scanner tools

Have you ever experienced the frustration of unexpected breakdowns with your truck? Or maybe you’re tired of paying expensive diagnostic fees at your ......
diagnostic scanner useful Learn about

Learning hard C#学习笔记——读书笔记 07

## 1.值类型和引用类型 ### 1.1 什么是值类型和引用类型 * 值类型:包括简单类型,枚举类型,结构体类型等,值类型通常被分配在线程的堆栈上,变量保存的内容就是实例数据本身 * 引用类型:引用类型实例则被分配在托管堆上,变量保存的是实例数据的内存地址,引用类型主要包括类类型、接口类型、委托类 ......
笔记 Learning hard 07

大语言模型的预训练4:指示学习Instruction Learning详解以及和Prompt Learning,In-content Learning区别

# 大语言模型的预训练[4]:指示学习Instruction Learning:Entailment-oriented、PLM oriented、human-oriented详解以及和Prompt Learning,In-content Learning区别 # 1.指示学习的定义 Instruct ......

大语言模型的预训练[5]:语境学习、上下文学习In-Context Learning:精调LLM、Prompt设计和打分函数设计以及ICL底层机制等原理详解

大语言模型的预训练[5]:语境学习、上下文学习In-Context Learning:精调LLM、Prompt设计和打分函数设计以及ICL底层机制等原理详解 ......
上下文 语境 底层 In-Context 函数

Learning hard C#学习笔记——读书笔记 06

本文介绍了 C# 中委托的定义、使用、为什么引入委托以及委托的本质。同时,还介绍了委托链的使用,即将多个委托链接在一起,提高程序的可扩展性。 ......
笔记 Learning hard 06

《DeepChain: Auditable and Privacy-Preserving Deep Learning with Blockchain-based Incentive》论文笔记

本文的研究背景: 在各种机器学习任务中,深度学习可以实现比传统机器学习算法更高的精度。最近,保护隐私的深度学习引起了信息安全界的极大关注,其中训练数据和训练模型都不会被暴露。联合学习是一种流行的学习机制,其中多方将局部梯度上传到服务器,服务器使用收集的梯度更新模型参数。然而,在联合学习中存在许多被忽 ......

大语言模型的预训练[3]之Prompt Learning:Prompt Engineering、Answer engineering、Multi-prompt learning、Training strategy详解

大语言模型的预训练[3]之Prompt Learning:Prompt Engineering、Answer engineering、Multi-prompt learning、Training strategy详解 ......

[AAAI 2023]Self-Supervised Bidirectional Learning for Graph Matching

# Self-Supervised Bidirectional Learning for Graph Matching ## 动机 Graph Matching(GM)是个NP难问题。随着机器学习的兴起,该问题也有望被更高效地解决。然而,现有的监督学习仍然需要为了训练去计算大量的ground tru ......

Learning hard C#学习笔记——读书笔记 05

本文介绍了C#编译成IL语言(Intermediate Language)的过程,以及使用ILDasm.exe工具查看IL代码的方法。文章通过一个Hello World程序,在ILDasm.exe工具中展示了MANIFEST清单和IL代码。 ......
笔记 Learning hard 05

Learning hard C#学习笔记——读书笔记 04

## 1.什么是接口 接口可以认为是一种规范,它是一种类的构建规范,它里面定义了一系列的方法和类型,但是没有具体的实现,需要继承它的类去自我实现 ## 2.接口的定义 使用 VS2022 在解决方案管理器这里,添加新建项 在添加新建项模板这里,选择接口 最后创建出来的接口如下 ```C# using ......
笔记 Learning hard 04

Unified Conversational Recommendation Policy Learning via Graph-based Reinforcement Learning

图的作用: 图结构捕捉不同类型节点(即用户、项目和属性)之间丰富的关联信息,使我们能够发现协作用户对属性和项目的偏好。因此,我们可以利用图结构将推荐和对话组件有机地整合在一起,其中对话会话可以被视为在图中维护的节点序列,以动态地利用对话历史来预测下一轮的行动。 由四个主要组件组成:基于图的 MDP ......

粗读Multi-Task Recommendations with Reinforcement Learning

论文: Multi-Task Recommendations with Reinforcement Learning 地址: https://arxiv.org/abs/2302.03328 # 摘要 In recent years, Multi-task Learning (MTL) has yi ......

2023-7-learning-note

- [任务1.学习Apex,Trigger,以及对象字段的简单使用](#任务1学习apextrigger以及对象字段的简单使用) - [Trigger](#trigger) - [学习Apex](#学习apex) - [List](#list) - [任务2.学习Visualforce 页面的开发, ......
learning-note learning 2023 note

Learning hard C#学习笔记——读书笔记 03

本文介绍了C#面向对象编程语言的三个基础特征:封装、继承和多态。其中,封装可以通过public、private、protected、internal等关键字来实现,目的是保护程序内部数据的完整性;继承可以帮助实现基类的内容复用,但也要结合场景使用;多态是指相同类型对象调用相同方法却表现出不同行为,使... ......
笔记 Learning hard 03

Learning hard C#学习笔记——读书笔记 02

每每说到类,不得不介绍的就是类的定义,它是一个抽象的概念,它是一个模板,制造对象的模板 ## 1.定义一个类 ```C# class Preson { // 类的成员变量 } ``` > 默认情况下,class关键字没有显式的使用`internal`修饰符来定义类,但是没有必要这样做,默认的修饰符就 ......
笔记 Learning hard 02

Learned Helplessness

来源于英文版维基百科 [Learned Helplessness](https://en.wikipedia.org/wiki/Learned_helplessness) Learned helplessness is the behavior exhibited by a subject afte ......
Helplessness Learned

什么是 Entity Framework Core? - Training - Microsoft Learn

> 了解 Entity Framework (EF) Core 的定义,以及如何将其与 API 一起使用。 大多数重要的 Web 应用程序都需要对数据可靠地运行操作,如创建、读取、更新和删除 (CRUD)。 它们还需要在应用程序重启之间保留这些操作所做的任何更改。 尽管有各种选项可用于在 .NET ......
Framework Microsoft Training Entity Learn

LizRice--Learning EBPF

> 主要参考Liz Rice主讲的youtube视频:https://www.youtube.com/watch?v=TJgxjVTZtfw > 这里做lab记录,持续更新ing > 线上实验环境:https://play.instruqt.com/isovalent/invite/miht6dgd ......
Learning LizRice EBPF

FastReport 在C#中的应用-Learning_1

#### 1.报表模板设计 ![image](https://img2023.cnblogs.com/blog/391359/202307/391359-20230712195327027-1449090728.png) #### 2.c# 代码 ``` csharp using FastRepor ......
FastReport Learning

2023-7-learning-note

- [任务1.学习Apex,Trigger,以及对象字段的简单使用](#任务1学习apextrigger以及对象字段的简单使用) - [Trigger](#trigger) - [任务2.学习Visualforce 页面的开发,能够做出与后台交互的Visualforce页面](#任务2学习visua ......
learning-note learning 2023 note

Exploiting Noise as a Resource for Computation and Learning in Spiking Neural Networks

郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! https://arxiv.org/abs/2305.16044 Summary Keywords Introduction Results Noisy spiking neural network and noise-driven le ......

The Deep Learning Compiler: A Comprehensive Survey

The Deep Learning Compiler: A Comprehensive Survey - [AI编译器综述](#ai编译器综述) - [摘要](#摘要) - [介绍](#介绍) - [背景](#背景) - [深度学习框架](#深度学习框架) - [深度学习硬件](#深度学习硬件) - ......
Comprehensive Compiler Learning Survey Deep

[ICDE 2022]How Learning Can Help Complex Cyclic Join Decomposition

# [ICDE 2022]How Learning Can Help Complex Cyclic Join Decomposition ## 总结 主要贡献是把子图匹配策略的cost的判断改为了GNN实现的预测(写得挺模棱两可的) ## 动机 解决子图匹配的一个重要问题是解决复杂循环连接查询。文章 ......
Decomposition Learning Complex Cyclic ICDE

Regret Minimization Experience Replay in Off-Policy Reinforcement Learning

**发表时间:**2021 (NeurIPS 2021) **文章要点:**理论表明,更高的hindsight TD error,更加on policy,以及更准的target Q value的样本应该有更高的采样权重(The theory suggests that data with highe ......

2023-7-learning-note

- [任务1](#任务1) - [任务2](#任务2) - [apex:pageBlockButtons 样式调整,修改前:](#apexpageblockbuttons-样式调整修改前) - [修改后](#修改后) - [代码](#代码) - [官网解释:](#官网解释) - [任务3](#任务3 ......
learning-note learning 2023 note

non-deep Machine Learning Notes

# Table of Content ## Supervised Learning ### 1. Linear Model Linear Regression Logistic Regression ### 2. Support Vector Machine, SVM ### 3. Generati ......
non-deep Learning Machine Notes deep

4.5 Unsupervised Learning: Word Embedding

# 1. Introduction(引入) 词嵌入(word embedding)是降维算法(Dimension Reduction)的典型应用. 最经典的做法就是1-of-N Encoding,它指的就是每一个字都是以向量来表示,只有在自己所属的那个字词索引上为1,其余为0,因此如果世界上的英文字 ......
Unsupervised Embedding Learning Word 4.5

ML-for-AGV-Dispatching:Learn.py逐段解读

import numpy as np import Routing import random as rd import tensorflow as tf import matplotlib.pyplot as plt import pandas as pd from sklearn import ......

Multi-Modal Attention Network Learning for Semantic Source Code Retrieval 解读

# Multi-Modal Attention Network Learning for Semantic Source Code Retrieva Multi-Modal Attention Network Learning for Semantic Source Code Retrieval,题 ......