理论r-drop论文drop

SHARPNESS-AWARE MINIMIZATION FOR EFFICIENTLY IMPROVING GENERALIZATION论文阅读笔记

Intro 在训练集上最小化损失很可能导致泛化性低,因为当今模型的过参数化会导致training loss的landscape异常复杂且非凸,包含很多local/global minima,因此优化器的选择至关重要。loss landscape的几何性质(特别是minima的flatness)与泛化 ......

OSPF理论基础

由于静态路由由网络管理员手工配置,因此当网络发生变化时,静态路由需要手动调整,这制约了静态路由在现网大规模的应用。 动态路由协议因其灵活性高、可靠性好、易于扩展等特点被广泛应用于现网。在动态路由协议之中,OSPF(Open Shortest Path First,开放式最短路径优先)协议是使用场景非 ......
理论 基础 OSPF

运动控制理论(2)——实践例子

目的:要知道末端点的位置。 直观的向量法 最直接的办法,以向量相加的形式求。 *3个向量都是参考0系构建。 坐标转换法 p1 是以1系下的局部坐标。 R是旋转矩阵,各列是以0系为参考的正交基。 v1是平移向量,也是以0系为参考的。 合并起来变成了T。 T = R3*3t3*3 ,将旋转和平移分开两个 ......
例子 理论

POT超阈值模型和极值理论EVT分析|附代码数据

全文链接:http://tecdat.cn/?p=16845 最近我们被客户要求撰写关于极值理论的研究报告,包括一些图形和统计输出。 本文依靠EVT对任何连续分布的尾部建模。尾部建模,尤其是POT建模,对于许多金融和环境应用至关重要 POT模型其主要动机是为高洪水流量的概率模型提供实用工具。但是,E ......
极值 阈值 模型 理论 代码

运动控制理论(二)——机械臂控制

正算 已知各个关机的角度,θ1,θ2,θ3,以及臂长,求末端位置。 ......
理论 机械

深度学习之机器学习理论

(一)机器学习(Machine Learning):就是让计算机具备从大量数据中学习的能力之一系列方法。机器学习使用很多统计方法,统计学家也称之为统计学习,但本质上起源于计算机科学的人工智能。 (二)机器学习的分类:机器学习主要分为两类,即监督学习(supervised learning)与非监督学 ......
深度 机器 理论

美国财团是如何控制美国教育界的 —— 哈佛史上最短任期!53岁女校长宣布辞职,博士论文被指抄袭

相关: 哈佛史上最短任期!53岁女校长宣布辞职,博士论文被指抄袭 ......
教育界 财团 任期 校长 博士

[论文阅读] Self-conditioned Image Generation via Generating Representations

Pre title: Self-conditioned Image Generation via Generating Representations accepted: arXiv 2023 paper: https://arxiv.org/abs/2312.03701 code: https:/ ......

Learning Dynamic Query Combinations for Transformer-based Object** Detection and Segmentation论文阅读笔记

Motivation & Intro 基于DETR的目标检测范式(语义分割的Maskformer也与之相似)通常会用到一系列固定的query,这些query是图像中目标对象位置和语义的全局先验。如果能够根据图像的语义信息调整query,就可以捕捉特定场景中物体位置和类别的分布。例如,当高级语义显示图 ......

数据库基本理论知识

1. 数据库 数据库是一个以某种有组织的方式存储的数据集合。最简单的方法是将数据库想象为一个文件柜。这个文件柜是一个存放数据的物理位置,不管数据是什么,也不管数据如何组织。 数据库 (database):保存有组织的数据的容器(通常是一个文件或者一组文件)。 数据库软件应该称为数据库管理系统(DBM ......
理论 数据库 知识 数据

哲学:想和做(“理论”必须作用域“实现”)

哲学:想和做(“理论”必须作用域“实现”) 想和做。理论和实现。 想、理论,都是“思维”活动,“虚拟”行为;做、实现,都是“实践”活动,“真实”行为。虚拟行为,指“行为”没有改变客观世界;真实行为,指“行为”改变了客观世界。 理论、想,在“虚拟环境”中,构建一条在现实环境中实现目标的可行路径。理论、 ......
哲学 作用 理论

论文写作方法

公式居中编号靠右 https://www.bilibili.com/video/BV1Xd4y1Z7Xi/?spm_id_from=333.337.search-card.all.click&vd_source=f0c0211a242fdec2b56aa48b9d63c70e 公式编辑器:matht ......
论文写作 方法 论文

【略读论文|大模型相关】Zero-Shot Relational Learning on Temporal Knowledge Graphs with Large Language Models

时间:2023 学校:慕尼黑大学 创新点: 1.据我们所知,这是第一个试图在TKGF背景下研究零射击关系学习的工作。 2.我们设计了一种基于llm的方法zrLLM,并设法在零射击关系推理中增强各种基于嵌入的TKGF模型。 3.实验结果表明,zrLLM有助于大大提高所有考虑的TKGF模型对包含未见零射 ......

机器学习周刊 第4期:动手实战人工智能、计算机科学热门论文、免费的基于ChatGPT API的安卓端语音助手、每日数学、检索增强 (RAG) 生成技术综述

LLM开发者必读论文:检索增强(RAG)生成技术综述! 目录: 1、动手实战人工智能 Hands-on Al 2、huggingface的NLP、深度强化学习、语音课 3、Awesome Jupyter 4、计算机科学热门论文 5、LLM开发者必读论文:检索增强 (RAG) 生成技术综述 6、App ......
人工智能 实战 人工 语音 助手

机器学习周刊03:如何学习深度学习?2024 年学习生成式 AI 路线图、如何构建高效的RAG系统、苹果 腾讯最新论文、阿里DreaMoving

腾讯推出的 AppAgent,是一个多模态智能体,通过识别当前手机的界面和用户指令直接操作手机界面,能像真实用户一样操作手机! 机器学习周刊:关注Python、机器学习、深度学习、大模型等硬核技术 1、如何学习深度学习? 最近X上有推友重提这篇文章,是网友看过 Jeremy 教授的 fast.ai ......
路线图 DreaMoving 深度 周刊 路线

01. 理论 ⑵ :SQL分类、数据类型

char 和 varchar 的区别 char: 定长字符串(最多 255),插入长度小于固定长度时,用空格填充; 因为长度固定,所以存取更快,甚至能快 50%,但也会占用更多空间; varchar: 可变长字符串(最多65532),按数据长度存储。 MySQL 货币字段类型选择 用 DECIMAL ......
理论 类型 数据 SQL 01

收敛理论

点态收敛\(\newcommand{\F}{\mathcal{F}}\newcommand{\B}{\mathcal{B}}\newcommand{\Var}{\text{Var}}\newcommand{\E}{\mathbb{E}}\) 在定义连续随机变量的期望时候,我们是用一列离散的随机变量期 ......
理论

耗散结构理论的意义

耗散结构理论的意义 正确答案 耗散结构理论把热力学第二定律和达尔文进化论统一起来,把物理世界的规律性和生物世界的规律性统一起来,加深了我们对自然界本质的认识。具体说来表现在如下几个方面:(1)它使我们重新认识了时间的本质。时间问题,历来是哲学和各门科学共同关心的问题。普利高津在耗散结构理论中着重讨论 ......
意义 理论 结构

代码随想录算法训练营第二十四天 | 回溯算法理论基础,77. 组合

一、回溯算法理论基础 学习: 1. 基本概念 回溯法是一种搜索方式 回溯的本质是穷举,是递归的副产品,即回溯算法就是递归算法 回溯解决的问题都能理解成树形结构,一般是在集合中递归查找子集。集合的大小构成树的宽度(n叉树),递归的深度构成了树的深度 2. 回溯解决的问题 (1)组合问题:N个数里面按一 ......
算法 随想录 训练营 随想 理论

ICLR 2022: Anomaly Transformer论文阅读笔记+代码复现

本论文全名为Anomaly Transformer: Time Series Anomaly Detection with Association Descrepancy(通过关联差异进行时序异常检测),主要提出了一种无监督的异常点检测算法,并在6个benchmarks上测试,获取良好结果。 论文链 ......
Transformer Anomaly 代码 笔记 论文

C 理论复习

C 理论知识拾遗 为了应付学校的期末理论考试,总结了一下 ppt 上的知识点,并搜索了一些相关资料,编写时添加了自己的一点理解而成。 计算机基础 1 bit(位)= 8 bytes(字节) 补码、原码和反码 标识符 (Identifiers) 标识符是 数组、下划线、字母(小写或大写);和 \u 及 ......
理论

NeurIPS 2023 | 腾讯 AI Lab 18 篇入选论文解读

前言 NeurIPS 2023(Neural Information Processing Systems)神经信息处理系统大会是当前全球最负盛名的 AI 学术会议之一,将于 12 月 10 日在美国新奥尔良召开。官方信息显示,本届会议共有 12343 篇有效论文投稿,接收率为 26.1%,略高于 ......
NeurIPS 论文 2023 Lab 18

Hadoop理论知识

1、Hadoop是什么? Hadoop是一个由Apache基金会所研发的分布式系统基础架构。主要解决海量数据存储和海量数据的分析计算问题。 2、Hadoop的特点? (1)高可靠性:Hadoop底层维护多个数据副本,所以即使Hadoop某个计算元素或存储出现故障,也不会导致数据的丢失。 (2)高扩展 ......
理论 知识 Hadoop

Hive理论知识

1、什么是Hive? Hive是基于Hadoop的一个数据仓库工具,它提供了类似SQL的查询语言来进行大规模的数据分析和处理。Hive将结构化的数据映射到Hadoop分布式文件系统(HDFS)上,并通过MapReduce任务执行查询操作。 2、数据模型有哪些? 星形模式(Star Schema):星 ......
理论 知识 Hive

算法分析与设计 第十次理论作业

算法分析与设计 第十次理论作业 目录算法分析与设计 第十次理论作业一. 填空题(共1题,20分)二. 判断题(共3题,60分)三. 单选题(共1题,20分) 一. 填空题(共1题,20分) (填空题) 根据本课程的学习内容,列举出一种既可以用动态规划算法、也可以用回溯法和分支限界法求解的问题:___ ......
算法 理论

算法分析与设计 第九次理论作业

算法分析与设计 第九次理论作业 目录算法分析与设计 第九次理论作业一. 单选题(共3题,30分)二. 填空题(共5题,50分)三. 简答题(共1题,20分) 一. 单选题(共3题,30分) (单选题, 10分) 优先队列通常采用( )来实现。 A. 栈 B. 堆 C.队列 D.二叉查找树 正确答案: ......
算法 理论

算法分析与设计 第八次理论作业

算法分析与设计 第八次理论作业 目录算法分析与设计 第八次理论作业一. 单选题(共1题,10分)二. 填空题(共3题,30分)三. 判断题(共3题,30分)四. 简答题(共1题,30分) 一. 单选题(共1题,10分) (单选题, 10分) 关于装载问题,以下叙述不正确的是()。 A. 装载问题是一 ......
算法 理论

算法分析与设计 第七次理论作业

算法分析与设计 第七次理论作业 目录算法分析与设计 第七次理论作业一. 单选题(共2题,20分)二. 填空题(共8题,80分) 一. 单选题(共2题,20分) (单选题) 回溯法在搜索解空间树时所采取的策略是( )。 A. 广度优先加剪枝 B. 活结点优先 C. 深度优先加剪枝 D. 优先级高的结点 ......
算法 理论

算法分析与设计 第六次理论作业

算法分析与设计 第六次理论作业 目录算法分析与设计 第六次理论作业一. 单选题(共4题,50分)二. 填空题(共3题,37.5分)三. 简答题(共1题,12.5分) 一. 单选题(共4题,50分) (单选题) 关于哈夫曼算法的正确性,以下叙述中正确的是( )。 A.最优前缀码问题只满足贪心选择性质, ......
算法 理论

【性能测试入门必看】性能测试理论知识

一、性能测试理论知识 1、常用的七种性能测试方法 (1) 后端性能测试:其实,你平时听到的性能测试,大多数情况下指的是后端性能测试,也就是服务器端性能测试。后端性能测试,是通过性能测试工具模拟大量的并发用户请求,然后获取系统性能的各项指标,并且验证各项指标是否符合预期的性能需求的测试手段。 (2) ......
性能 理论 知识
共1221篇  :1/41页 首页上一页1下一页尾页