representation sparsification learning robust

A Novel Noise Injection-based Training Scheme for Better Model Robustness

郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ https://arxiv.org/abs/2302.10802 ......

Injection-based Robustness Injection Training Better更新时间 2023-08-01

《Decision Transformer: Reinforcement Learning via Sequence Modeling》论文学习

一、Introduction 先前的研究工作表明，Transformer可以对处于高维分布的语义概念进行大规模建模抽象，比较典型地体现如：基于自然语言的零样本泛化（zero-shot generalization）分布外图像生成（out-of-distribution image generat ......

Reinforcement Transformer Decision Learning Modeling更新时间 2023-08-01

Learning hard C#学习笔记——读书笔记 08

这篇文章介绍了什么是事件，以及如何在C#中使用事件。事件是在生活中发生的事情，它涉及到事件的发布者和事件的订阅者，当事件发生时，发布者会发布消息，订阅者会接收通知并做出相应的处理。在C#中，我们可以使用event关键字定义一个事件，然后订阅和取消事件的方法与委托链的取消和链接相同。 ......

笔记 Learning hard 08更新时间 2023-07-31

Improved deep reinforcement learning for robotics through distribution-based experience retention

![](https://img2023.cnblogs.com/blog/1428973/202307/1428973-20230729080850680-1663030080.png) **发表时间：**2016（IROS 2016） **文章要点：**这篇文章提出了experience repl ......

distribution-based reinforcement distribution experience retention更新时间 2023-07-29

Bidirectional Encoder Representations from Transformers

BERT（Bidirectional Encoder Representations from Transformers）是由Google在2018年提出的自然语言处理（NLP）模型。它是一个基于Transformer架构的预训练模型，通过无监督学习从大量的文本数据中学习通用的语言表示，从而能够更好... ......

Representations Bidirectional Transformers Encoder from更新时间 2023-07-28

Learning Auxiliary Monocular Contexts Helps Monocular 3D Object Detection(1)

MonoCon的网络结构和MonoDLE几乎一样,只是添加了辅助学习(Auxiliary Learning, AL)模块. 网络结构如上图所示,对于3D目标检测来说,预测2D框是没有必要的,但是MonoCon在训练阶段仍然计算了2D框的损失函数,但是在推理的时候,并不会预测2D框,这就是所谓的辅助学 ......

Monocular Auxiliary Detection Learning Contexts更新时间 2023-07-27

深入Scikit-learn：掌握Python最强大的机器学习库

> 本篇博客详细介绍了Python机器学习库Scikit-learn的使用方法和主要特性。内容涵盖了如何安装和配置Scikit-learn，Scikit-learn的主要特性，如何进行数据预处理，如何使用监督学习和无监督学习算法，以及如何评估模型和进行参数调优。本文旨在帮助读者深入理解Scikit- ......

Scikit-learn 机器 Scikit Python learn更新时间 2023-07-27

The importance of experience replay database composition in deep reinforcement learning

![](https://img2023.cnblogs.com/blog/1428973/202307/1428973-20230727110633815-1407402877.png) **发表时间：**2015（Deep Reinforcement Learning Workshop, NIPS ......

reinforcement composition importance experience database更新时间 2023-07-27

CF1184A3 Heidi Learns Hashing (Hard)

令 $c_i={w_1}_i-{w_2}_i$，相当于找到 $(r,P)$，满足： $$\sum\limits_{i=0}^nc_ir^i\equiv 0 \pmod P$$ 把这个东西写成多项式形式，令 $f(x)=\sum\limits_{i=0}^nc_ix^i$，即找到一个 $(r,P)$， ......

Hashing Learns 1184A Heidi 1184更新时间 2023-07-26

Unsupervised Learning of Depth and Ego-Motion from Video(CVPR2017)论文阅读

深度估计问题从输入的单目或双目图像，计算图像物体与摄像头之间距离（输出距离图），双目的距离估计应该是比较成熟和完善，但往单目上考虑主要还是成本的问题，所以做好单目的深度估计有一定的意义。单目的意思是只有一个摄像头，同一个时间点只有一张图片。就象你闭上一只眼睛，只用一只眼睛看这个世界的事物一样，距离 ......

Unsupervised Ego-Motion Learning Motion 论文更新时间 2023-07-26

机器翻译 | Improving Neural Machine Translation Robustness via Data Augmentation: Beyond Back Translation论文总结

论文地址：https://arxiv.org/abs/1910.03009 ### 动机神经机器翻译(NMT)模型在翻译**干净文本**时已被证明是强大的，但它们**对输入中的噪声非常敏感**。改进NMT模型的鲁棒性可以看作是对噪声的“域”适应的一种形式。最先进的方法严重依赖于大量的反向翻译数据 ......

Translation Augmentation Robustness Improving 机器更新时间 2023-07-26

Selective Experience Replay for Lifelong Learning

![](https://img2023.cnblogs.com/blog/1428973/202307/1428973-20230725234343269-1373726308.png) **发表时间：**2018（AAAI 2018） **文章要点：**这篇文章想解决强化学习在学多个任务时候的遗忘 ......

Experience Selective Lifelong Learning Replay更新时间 2023-07-25

论文阅读笔记：Quasi-Newton solver for robust non-rigid registration

论文题目：[Quasi-Newton solver for robust non-rigid registration](https://openaccess.thecvf.com/content_CVPR_2020/html/Yao_Quasi-Newton_Solver_for_Robust_N ......

Quasi-Newton registration non-rigid 笔记 Newton更新时间 2023-07-25

通过docker安装的jira提示We've detected a potential problem with JIRA's Dashboard configuration that your administrator can correct. Click here to learn more

正常通过docker安装jira后,访问是不会出问题的但是如果使用nginx代理后,就是在nginx里配置了proxy_pass http://localhost:2800 再访问后,就会报错We've detected a potential problem with JIRA's Dashbo ......

configuration administrator Dashboard potential detected更新时间 2023-07-24

Paper Reading: Exploratory Undersampling for Class-Imbalance Learning

本文是不平衡分类问题的经典论文，文中提出了 2 种不平衡集成学习模型都是简单而有效的 baseline 方法。 EasyEnsemble 方法直接对多数类样本进行采样得到几个子集，并使用这些子集分别训练基分类器。BalanceCascade 是使用训练好的分类器来指导后续分类器的采样过程，即在上一个... ......

Class-Imbalance Undersampling Exploratory Imbalance Learning更新时间 2023-07-22

Meta Learning（元学习）

Meta Learning（元学习）元学习：学习如何学习：也是找一个函数，这个函数是学习算法，输出训练好的模型假如教机器做了训练影像分类、影像识别等任务的模型，再去教机器训练语音识别的模型时，他可能学的更好，虽然语音和影像没有什么关系，但机器在多次的学习训练其他模型过程中，可能学到了如何去学习 ......

Learning Meta更新时间 2023-07-22

Life Long Learning（机器终身学习）

Life Long Learning（机器终身学习） Selective Synaptic plasticity（选择性突触可塑性）只让类神经网路中，某一些神经元或某些神经元间的连接具有可塑性（只有部分的连接是有可塑性的，有些连接必须被固化，不能改变或移动他的数值）为什么会灾难性遗忘：假设模型 ......

Learning 终身机器 Life Long更新时间 2023-07-22

概述增强式学习（Reinforcement Learning）

概述增强式学习（Reinforcement Learning） Supervised Learning（自监督学习）：告诉机器输入和输出，用有标注的训练资料训练出的Network Reinforcement Learning（增强式学习）：给机器一个输入，我们不知道最佳输出是什么（适用于标注困难或者 ......

Reinforcement Learning更新时间 2023-07-22

machine learning-2023-07-19

questions【链接】 │ │──math │ │──线性回归 │ │──逻辑回归 │ └──梯度下降 │ │──python │ │──numpy（科学计算库） │ │──pandas（数据分析处理库） │ │──matplotlib（数据可视化库） │ └──scikit-learn（机器学 ......

learning machine 2023 07 19更新时间 2023-07-19

Learn about some useful truck diagnostic scanner tools

Have you ever experienced the frustration of unexpected breakdowns with your truck? Or maybe you’re tired of paying expensive diagnostic fees at your ......

diagnostic scanner useful Learn about更新时间 2023-07-19

Learning hard C#学习笔记——读书笔记 07

## 1.值类型和引用类型 ### 1.1 什么是值类型和引用类型 * 值类型：包括简单类型，枚举类型，结构体类型等，值类型通常被分配在线程的堆栈上，变量保存的内容就是实例数据本身 * 引用类型：引用类型实例则被分配在托管堆上，变量保存的是实例数据的内存地址，引用类型主要包括类类型、接口类型、委托类 ......

笔记 Learning hard 07更新时间 2023-07-19

大语言模型的预训练4：指示学习Instruction Learning详解以及和Prompt Learning,In-content Learning区别

# 大语言模型的预训练[4]：指示学习Instruction Learning：Entailment-oriented、PLM oriented、human-oriented详解以及和Prompt Learning,In-content Learning区别 # 1.指示学习的定义 Instruct ......

Learning Instruction In-content 指示模型更新时间 2023-07-19

大语言模型的预训练[5]：语境学习、上下文学习In-Context Learning：精调LLM、Prompt设计和打分函数设计以及ICL底层机制等原理详解

大语言模型的预训练[5]：语境学习、上下文学习In-Context Learning：精调LLM、Prompt设计和打分函数设计以及ICL底层机制等原理详解 ......

上下文语境底层 In-Context 函数更新时间 2023-07-19

Learning hard C#学习笔记——读书笔记 06

本文介绍了 C# 中委托的定义、使用、为什么引入委托以及委托的本质。同时，还介绍了委托链的使用，即将多个委托链接在一起，提高程序的可扩展性。 ......

笔记 Learning hard 06更新时间 2023-07-19

《DeepChain: Auditable and Privacy-Preserving Deep Learning with Blockchain-based Incentive》论文笔记

本文的研究背景：在各种机器学习任务中，深度学习可以实现比传统机器学习算法更高的精度。最近，保护隐私的深度学习引起了信息安全界的极大关注，其中训练数据和训练模型都不会被暴露。联合学习是一种流行的学习机制，其中多方将局部梯度上传到服务器，服务器使用收集的梯度更新模型参数。然而，在联合学习中存在许多被忽 ......

Privacy-Preserving Blockchain-based Blockchain Preserving DeepChain更新时间 2023-07-18

大语言模型的预训练[3]之Prompt Learning：Prompt Engineering、Answer engineering、Multi-prompt learning、Training strategy详解

大语言模型的预训练[3]之Prompt Learning：Prompt Engineering、Answer engineering、Multi-prompt learning、Training strategy详解 ......

Prompt Multi-prompt Engineering engineering Learning更新时间 2023-07-18

[AAAI 2023]Self-Supervised Bidirectional Learning for Graph Matching

# Self-Supervised Bidirectional Learning for Graph Matching ## 动机 Graph Matching（GM）是个NP难问题。随着机器学习的兴起，该问题也有望被更高效地解决。然而，现有的监督学习仍然需要为了训练去计算大量的ground tru ......

Self-Supervised Bidirectional Supervised Learning Matching更新时间 2023-07-18

Learning hard C#学习笔记——读书笔记 05

本文介绍了C#编译成IL语言（Intermediate Language）的过程，以及使用ILDasm.exe工具查看IL代码的方法。文章通过一个Hello World程序，在ILDasm.exe工具中展示了MANIFEST清单和IL代码。 ......

笔记 Learning hard 05更新时间 2023-07-18

Learning hard C#学习笔记——读书笔记 04

## 1.什么是接口接口可以认为是一种规范，它是一种类的构建规范，它里面定义了一系列的方法和类型，但是没有具体的实现，需要继承它的类去自我实现 ## 2.接口的定义使用 VS2022 在解决方案管理器这里，添加新建项在添加新建项模板这里，选择接口最后创建出来的接口如下 ```C# using ......

笔记 Learning hard 04更新时间 2023-07-18

Unified Conversational Recommendation Policy Learning via Graph-based Reinforcement Learning

图的作用：图结构捕捉不同类型节点（即用户、项目和属性）之间丰富的关联信息，使我们能够发现协作用户对属性和项目的偏好。因此，我们可以利用图结构将推荐和对话组件有机地整合在一起，其中对话会话可以被视为在图中维护的节点序列，以动态地利用对话历史来预测下一轮的行动。由四个主要组件组成：基于图的 MDP ......

Learning Conversational Recommendation Reinforcement Graph-based更新时间 2023-07-17

共530篇 :10/18页 首页上一页78910111213下一页尾页