foundation efficient language models

SHARPNESS-AWARE MINIMIZATION FOR EFFICIENTLY IMPROVING GENERALIZATION论文阅读笔记

Intro 在训练集上最小化损失很可能导致泛化性低，因为当今模型的过参数化会导致training loss的landscape异常复杂且非凸，包含很多local/global minima，因此优化器的选择至关重要。loss landscape的几何性质（特别是minima的flatness）与泛化 ......

SHARPNESS-AWARE GENERALIZATION MINIMIZATION EFFICIENTLY SHARPNESS更新时间 2024-01-13

An improved LSTM-based model for identifying high working intensity load segments of the tractor load spectrum

一区top Computers and Electronics in Agriculture 题目： “基于改进 lstm 的拖拉机载荷谱高工作强度载荷段识别模型” (pdf) “An improved LSTM-based model for identifying high working in ......

load identifying LSTM-based intensity improved更新时间 2024-01-13

Coding Languages used in Smart cars

Smart cars utilize a variety of programming languages for different purposes within their systems. The choice of programming language often depends on ......

Languages Coding Smart used cars更新时间 2024-01-11

【略读论文|大模型相关】Zero-Shot Relational Learning on Temporal Knowledge Graphs with Large Language Models

时间：2023 学校：慕尼黑大学创新点： 1.据我们所知，这是第一个试图在TKGF背景下研究零射击关系学习的工作。 2.我们设计了一种基于llm的方法zrLLM，并设法在零射击关系推理中增强各种基于嵌入的TKGF模型。 3.实验结果表明，zrLLM有助于大大提高所有考虑的TKGF模型对包含未见零射 ......

Relational Zero-Shot Knowledge Learning Language更新时间 2024-01-09

《An End-to-end Model for Entity-level Relation Extraction using Multi-instance Learning》阅读笔记

代码原文地址预备知识： 1.什么是MIL？多示例学习（MIL）是一种机器学习的方法，它的特点是每个训练数据不是一个单独的实例，而是一个包含多个实例的集合（称为包）。每个包有一个标签，但是包中的实例没有标签。MIL的目的是根据包的标签来学习实例的特征和分类规则，或者根据实例的特征来预测包的标签。 ......

Multi-instance Entity-level End-to-end Extraction Learning更新时间 2024-01-06

南阳师范大学外国语学院 Foreign language school

省内外高校郑州大学河南大学河南师范大学信阳师范学院安阳师范学院省外洛阳师范学院商丘师范学院北京外国语大学上海外国语大学广东外语外贸大学西安外国语大学天津外国语大学大连外国语大学四川外国语大学 ......

外国语师范大学师范 language 外国更新时间 2024-01-04

3_5 Interpreters for Languages with Abstraction

3_5 Interpreters for Languages with Abstraction The Calculator language provides a means of combination through nested call expressions. However, ther ......

Interpreters Abstraction Languages with for更新时间 2024-01-03

sqlalchemy 查询已存在表(无model定义)

已存在的表信息,该表不是由sqlalchemy创建。想要对该表做CRUD，可以通过sqlalchemy提供的一个解析方法完成。 ......

sqlalchemy model更新时间 2024-01-03

Diffusion Model理解

Diffusion Model理解整体理解拆楼（正向过程）可以直接一步步加噪声做，建楼（反向过程）需要使用模型来学习苏剑林. (Jun. 13, 2022). 《生成扩散模型漫谈（一）：DDPM = 拆楼 + 建楼》文章中截图从右向左是正向过程，\(q(x_t|x_{t-1})\) 是加噪 ......

Diffusion Model更新时间 2024-01-03

learned_inertial_model_odometry 复现

据集 BlackBrid 数据集，总大小4.9TB，但是可以按需获取其下载程序 python sequenceDownloader.py FLIGHT ENVIRONMENT DATASETFOLDER 举例说明 FLIGHT clover/yawForward/maxSpeed5p0 ENVIR ......

learned_inertial_model_odometry inertial odometry learned model更新时间 2024-01-02

SciTech-BigDataAIML-Tensorflow-Introduction to modules, layers, and models

Introduction to modules, layers, and models Model: To do machine learning in TensorFlow, you are likely to need to define, save, and restore a model. ......

SciTech-BigDataAIML-Tensorflow-In BigDataAIML Tensorflow troduction SciTech更新时间 2024-01-02

大模型评测-微软亚洲研究院：A Survey on Evaluation of Large Language Models论文分享

《A Survey on Evaluation of Large Language Models》一、论文介绍：微软亚洲研究院公开了介绍大模型评测领域的论文《A Survey on Evaluation of Large Language Models》。该论文一共调研了219篇文献，以评测内容 ......

Evaluation 研究院 Language 模型 Survey更新时间 2024-01-02

TF246017: Team Foundation Server 未能连接到数据库。请验证是否已正确指定实例，承载数据库的服务器是否能够正常运行，且没有网络问题阻止与服务器通信

最近在工作中使用TFS中突然遇到TFS未能连接到数据库的问题，当初TFS服务是自己部署的，问题也得自己解决。下面是当时在VS和TFS服务器管理工具上的错误截图。经过一番查找，是运维那边改服务器管理员账号administrator的密码了，刚好之前部署TFS服务的时候是把服务器的administra ......

数据库服务器数据 Foundation 实例更新时间 2023-12-31

10.基于模型的测试方法 Model-based Testing

Model-based Testing 介绍 Model-based Testing is an application of model-based design for designing and optionally also executing artifacts to perform so ......

Model-based 模型 Testing 方法 Model更新时间 2023-12-31

SPSS modeler用关联规则Apriori模型对笔记本电脑购买事务销量数据研究

全文链接：https://tecdat.cn/?p=34709 原文出处：拓端数据部落公众号自2011年全球PC出货量达到历史最高的3.64亿台后，全球PC市场出货量已经连续四年下滑。市场调研公司Gartner最新数据显示，2015年Q3全球PC销量同比降低7.7%，至7370万台。IDC数据更加 ......

销量模型规则事务 Apriori更新时间 2023-12-28

Language Models are Unsupervised Multitask Learners

郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ OpenAI blog, 2019 ......

Unsupervised Multitask Language Learners Models更新时间 2023-12-28

InstructGPT《InstructGPT: Training language models to follow instructions with human feedback》解读

背景 GPT-3 虽然在各大 NLP 任务以及文本生成的能力上令人惊艳，但是他仍然还是会生成一些带有偏见的，不真实的，有害的造成负面社会影响的信息，而且很多时候，他并不按人类喜欢的表达方式去说话。在这个背景下，OpenAI 提出了一个概念“Alignment”，意思是模型输出与人类真实意图对齐，符合 ......

InstructGPT instructions Training language feedback更新时间 2023-12-27

【Mathematical Model】Python拟合多元方程（线性回归）

Python中可以使用多种库进行拟合方程，其中最常用的是NumPy和SciPy。NumPy是一个用于处理数组和矩阵的库，而SciPy则提供了大量的科学计算函数，包括拟合算法。之前已经分享过一元一/二次方程的拟合，有兴趣的可以查看：Python拟合一元方程。今天给大家分享下如何使用Python拟合多元... ......

线性方程 Mathematical Python Model更新时间 2023-12-27

GPT-3《Language Models are Few-Shot Learners》解读

GPT-3 和 GPT-2差别 1. 效果上，超出 GPT-2 非常多，能生成人类难以区分的新闻文章；2. 主推 few-shot，相比于 GPT-2 的 zero-shot，具有很强的创新性；3. 模型结构略微变化，采用 sparse attention 模块；4. 海量训练语料 45TB（清洗后 ......

Few-Shot Language Learners Models Shot更新时间 2023-12-26

django项目中存在多个app时models 表没有创建成功

场景使用django 创建的项目，项目下有多个app，在第二个app中的models中创建表，执行生成表的命令没有生效。解决 #1、执行命令需要指定app名称 python manage.py makemigrations --empty team # team 为app名称 #2、再次正常运 ......

多个项目 django models app更新时间 2023-12-26

LocPatcH An efficient long-read hybrid error correction algorithm based on local pHMM

该文档主要介绍了一种基于装配的方法和概率隐藏马尔科夫模型 (pHMM) 用于纠正长读序列的错误。文档详细描述了对酵母数据进行实验的结果、纠正方法的拓扑结构以及实验设置和数据集。这种基于装配的纠正方法相对于直接纠正存在哪些优势？ pHMM 的拓扑结构是怎样的？在实验中使用了什么样的数据集？提示： ......

correction efficient algorithm long-read LocPatcH更新时间 2023-12-26

GPT-2 《Language Models are Unsupervised Multitask Learners》解读

背景 GPT1采用了pre-train + fine-tuning训练方式，也就是说为了适应不同的训练任务，模型还是需要在特定任务的数据集上微调，仍然存在较多人工干预的成本。GPT-2 想彻底解决这个问题，通过 zero-shot，在迁移到其他任务上的时候不需要额外的标注数据，也不需要额外的模型训练 ......

Unsupervised Multitask Language Learners Models更新时间 2023-12-25

GPT-1论文《Improving Language Understanding by Generative Pre-Training》解读

背景 GPT-1 采用了两阶段训练的方式： 1. 第一阶段 pre-training，在海量文本上训练，无需label，根据前k-1个词预测第k个单词是什么，第一阶段的训练让模型拥有了很多的先验知识，模型具有非常强的泛化性 2. 第二阶段在特定任务上fine-tuning，让模型能适应不同的任务，提 ......

Understanding Pre-Training Generative Improving Language更新时间 2023-12-25

【Mathematical Model】Python拟合一元一/二次方程（线性回归）

Python中可以使用多种库进行拟合方程，其中最常用的是NumPy和SciPy。NumPy是一个用于处理数组和矩阵的库，而SciPy则提供了大量的科学计算函数，包括拟合算法。 ......

线性 Mathematical Python Model更新时间 2023-12-25

无法获得数据库 'model' 上的排他锁。请稍后重试该操作

标题: Microsoft SQL Server Management Studio 数据库 "XXXX" 的创建失败。 (Microsoft.SqlServer.Smo) 有关帮助信息，请单击: https://go.microsoft.com/fwlink?ProdName=Microsof ......

稍后数据库数据 model 39更新时间 2023-12-25

【Mathematical Model】Ransac线性回归&Python代码

Ransac算法，也称为随机抽样一致性算法，是一种迭代方法，用于从一组包含噪声或异常值的数据中估计数学模型。Ransac算法特别适用于线性回归问题，因为它能够处理包含异常值的数据集，并能够估计出最佳的线性模型。 ......

线性 Mathematical 代码 Ransac Python更新时间 2023-12-25

A novel local-global dependency deep learning model for soil mapping

程哥的一区文章 “A novel local-global dependency deep learning model for soil mapping” (Li 和 Zhang, 2022, pp. -) (pdf) 研究问题：“工程 “ discrete” 特征不能反映环境协变量之间的相 ......

local-global dependency learning mapping global更新时间 2023-12-23

《OneLLM: One Framework to Align All Modalities with Language》论文学习

一、Abstract 随着LLM的兴起，由于其强大的语言理解和推理能力，在学术和工业界中越来越受欢迎。LLM的进展也启发了研究人员将LLM作为多模态任务的接口，如视觉语言学习、音频和语音识别、视频理解等，因此多模态大语言模型(Multimodal Large Language Model， MLLM ......

Modalities Framework Language OneLLM 论文更新时间 2023-12-21

《Learning Transferable Visual Models From Natural Language Supervision》论文学习

一、Abstract 最先进的计算机视觉系统被训练用以预测一组预定的固定目标类别。这种受限的监督方式限制了它们的通用性和可用性，因为需要额外的标记数据来指定任何新的视觉概念。因此，直接从关于图像的原始描述文本中学习是一个有希望的替代方法，它利用了更广泛的因特网监督来源。我们证明了预测哪个标题与哪张 ......

Transferable Supervision Learning Language Natural更新时间 2023-12-20

R语言有限混合模型(FMM,finite mixture model)及其EM算法聚类分析间歇泉喷发时间

原文链接：http://tecdat.cn/?p=22609 原文出处：拓端数据部落公众号摘要本文提供了一套用于分析各种有限混合模型的方法。既包括传统的方法，如单变量和多变量正态混合的EM算法，也包括反映有限混合模型的一些最新研究的方法。许多算法都是EM算法或基于类似EM的思想，因此本文包括有限 ......

间歇泉间歇算法模型 mixture更新时间 2023-12-19

共600篇 :1/20页 首页上一页1234下一页尾页