模型

cleaning of llm corpus 大模型语料清洗

cleaning of llm corpus 大模型语料清洗 数据是人工智能领域发展的基础要素之一。随着大规模预训练模型及相关技术不断取得突破,在相应研究中使用高效数据处理工具提升数据质量变得越来越重要。llm_corpus_quality集成了包含清洗、敏感词过滤、广告词过滤、语料质量自动评估等功 ......
语料 cleaning 模型 corpus llm

Eloquent 模型使用详解 Has One Through 远程一对一

远程一对一也好,经过型,穿过型一对一也好,都能表示这种模型的关联方式:一种非直接的关系定义 这里使用官方的例子:👩‍🔧修理工,🚗车,👨‍💼车主来说明 上下文解释 👩‍🔧修理工 mechanics 负责维修 👨‍💼车主 owners 的 🚗车 cars,这里假设一个车主只有一张车, ......
一对一 Eloquent 模型 Through Has

从Bitcask存储模型谈超轻量级KV系统设计与实现

本文从从Bitcask存储模型讲起,谈轻量级KV系统设计与实现。从来没有最好的K-V系统,只有最适合应用业务实际场景的系统,做任何的方案选择,要结合业务当前的实际情况综合权衡,有所取有所舍。 ......
超轻量 模型 Bitcask 系统

开发篇1:使用原生api和Langchain调用大模型

对大模型的调用通常有以下几种方式:方式一、大模型厂商都会定义http风格的请求接口,在代码中可以直接发起http请求调用;方式二、在开发环境中使用大模型厂商提供的api;方式三、使用开发框架Langchain调用,这个就像java对数据库的调用一样,可以直接用jdbc也可以使用第三方框架,第三方框架 ......
Langchain 模型 api

darknet-yolov4训练自己的模型记录

最近又整了一块jetson nano的板子,就拿过来正好用一下,这个跑yolo还是很有用的,这里也记录一下过程。 1、jetson nano变化 之前也玩过jetson nano,但是最近却发现这个nano和之前的不一样了,是这样的 就是原来都是sd卡烧录,但是这个是emmc了 最大的区别就是原来使 ......
darknet-yolov 模型 darknet yolov

扩散模型

有不少介绍扩散模型的资料,其中"Understanding Diffusion Models: A Unified Perspective"论文是我读到的解释最详细也是最易于理解的一个。 数学符号 用粗体字母表示向量, 如\( \mathbf{x}, \mathbf{z}\) 用字母\(\mathb ......
模型

机器学习-概率图模型系列-隐含马尔科夫模型-33

目录1. Hidden Markov Model2. HMM模型定义 注:参考链接 https://www.cnblogs.com/pinard/p/6945257.html 1. Hidden Markov Model 隐马尔科夫模型(Hidden Markov Model,以下简称HMM)是比较 ......
模型 概率 机器 33

[Maven] 02 - POM模型与常见插件

POM 模型 1 依赖关系 Maven 一个核心的特性就是依赖管理。当我们处理多模块的项目(包含成百上千个模块或者子项目),模块间的依赖关系就变得非常复杂,管理也变得很困难。针对此种情形,Maven 提供了一种高度控制的方法。 通俗理解: 依赖谁就是将谁的 jar 包添加到本项目中。可以依赖中央仓库 ......
插件 模型 常见 Maven POM

如何开发医疗保险欺诈识别监测模型中的模型选择与构建?

开发医疗保险欺诈识别监测模型时,选择合适的模型和构建有效的模型是至关重要的。以下是一些建议: 模型选择: 逻辑回归: 适用于线性关系,简单、快速,容易解释。 决策树和随机森林: 能够处理非线性关系,对异常值和噪声相对鲁棒,易于解释。 支持向量机(SVM): 在高维空间中表现良好,对于复杂的非线性关系 ......
模型 医疗保险 医疗

如何开发医疗保险欺诈识别监测模型中的模型训练与调优?

医疗保险欺诈识别模型的训练与调优是一个关键的步骤,它直接影响模型的性能。以下是一些建议: 1. 数据准备与预处理: 数据清理: 处理缺失值、异常值,确保数据的质量。 特征工程: 提取有助于欺诈检测的特征,可能需要与领域专家一起进行。 数据平衡: 处理正负样本不平衡,可以考虑欠采样、过采样或使用权重调 ......
模型 医疗保险 医疗

如何开发医疗保险欺诈识别监测模型中的特征工程?

在开发医疗保险欺诈识别监测模型时,特征工程是一个关键的步骤,它有助于提取、转换和选择最相关的特征,以改善模型的性能。以下是在开发医疗保险欺诈识别监测模型时进行特征工程的一些建议: 基本特征提取: 提取基本的医疗保险相关特征,如就医次数、就医地点、就医科室、医疗费用等。 时序特征: 如果数据包含时间信 ......
医疗保险 模型 特征 医疗 工程

医疗保险欺诈识别监测模型分析

以下是开发医疗保险欺诈识别监测模型的一般性步骤: 数据集分析与预处理: 对给定的16000条数据集进行初步分析,了解数据的结构、特征。 进行数据清洗,处理缺失值、异常值等。 进行多维特征信息分析,以了解医疗保险欺诈的潜在特征。 特征工程: 提取能够描述医疗保险欺诈的特征因子集合。这可能需要领域专业知 ......
医疗保险 模型 医疗

开发医疗保险欺诈识别监测模型如何进行数据集分析与预处理

数据集加载: 使用工具如Pandas库加载数据。使用pd.read_csv()等函数加载数据集到DataFrame。 初步数据探索: 使用head()、info()、describe()等方法查看数据的前几行、基本信息和统计摘要。 使用shape属性获取数据集的大小。 处理缺失值: 使用isnull ......
医疗保险 模型 医疗 数据

1.12_redis 的存取在最后 晚上_浙江本地环境的header不能用线上的_header中host和refer分别代表什么意思?_模型的save()参数是数组怎么理解?

方便点1: 问题: 为什么这个浙江的这个线上的header用到本地就不行,而熊师爷的这个却可以? 线上的 header中的host 本地的 header中的host 根据上面弄得对照关系 header中host和refer分别代表什么意思? 活1: 分析如下: 上面分析出现的问题:既然只统计:开业状 ......
header 数组 模型 意思 参数

POT超阈值模型和极值理论EVT分析|附代码数据

全文链接:http://tecdat.cn/?p=16845 最近我们被客户要求撰写关于极值理论的研究报告,包括一些图形和统计输出。 本文依靠EVT对任何连续分布的尾部建模。尾部建模,尤其是POT建模,对于许多金融和环境应用至关重要 POT模型其主要动机是为高洪水流量的概率模型提供实用工具。但是,E ......
极值 阈值 模型 理论 代码

从工程化角度,详解鹏程·脑海大模型训练过程

从工程化的角度,对鹏城.脑海大模型训练语料处理、模型训练优化、模型应用等方面做出了全面详细的经验分享。 ......
模型 脑海 角度 过程 工程

人工智能应用的“繁花时代”,各大企业何以破局AI模型挑战

​ AI技术的崛起,为各行业发展带来巨大变革和超强的创新潜力。然而,各大企业在拥抱AI的进程中并非一路坦途,“繁花盛开”的背后隐藏着AI模型生产与管理环节的诸多痛点。 先来看看部分金融企业在人工智能技术的应用现状:工商银行运用超过2200个智能模型,通过OCR技术实现支票、业务委托书等业务凭证要素的 ......
人工智能 繁花 人工 模型 智能

【OpenVINO】基于 OpenVINO Python API 部署 RT-DETR 模型

RT-DETR是在DETR模型基础上进行改进的,一种基于 DETR 架构的实时端到端检测器,它通过使用一系列新的技术和算法,实现了更高效的训练和推理,我们将将在Python、C++、C# 三个平台实现OpenVINO 部署RT-DETR模型实现深度学习推理加速, 在本文中,我们将首先介绍基于 Ope... ......
OpenVINO 模型 RT-DETR Python DETR

综合评价模型

层次分析法(AHP)(太主观) 。。。 熵权法(客观定权) 秩和比法 ......
模型

模型层choice字段使用

1 模型表:Student表,写接口应该选择继承哪个视图类2 推荐使用自动生成路由的方式(继承ViewSetMixin及它的字类)3 但是目前来说,你先实现功能即可(至于选择哪个,慢慢体会) 4 choice的使用 -在模型类中使用 sex = models.SmallIntegerField(ch ......
字段 模型 choice

【专题】2023年大语言模型综合评测报告PDF合集分享(附原数据表)

原文链接:https://tecdat.cn/?p=33624 原文出处:拓端数据部落公众号 自2022年年末以来,人工智能大模型已成为技术领域甚至全球创新领域最受关注的话题。以ChatGPT为代表的大模型产品发展迅速,预测数据显示,到2030年,AIGC市场规模有望超过万亿元。2023年,国内主要 ......
评测报告 数据表 模型 语言 专题

浦语书生大模型实战训练营03笔记和作业

1.1配置环境 进入命令行,安装pytorch环境 bash /root/share/install_conda_env_internlm_base.sh InternLM conda activate InternLM # 升级pippython -m pip install --upgrade ......
训练营 书生 实战 模型 笔记

R语言PLS-DA模型分析不同中医组别患者间差异指标数据可视化

全文链接 :https://tecdat.cn/?p=34809 原文出处:拓端数据部落公众号 PLS-DA (Partial Least Squares Discriminant Analysis) 是一种多变量统计分析方法,常用于处理具有多个预测变量和多个响应变量的数据。在本文中,我们帮助客户使 ......
组别 患者 模型 差异 中医

生成模型—VAE

生成模型—VAE(Variational Auto-Encoder) 为进一步了解面部反应生成模型的原理,故详细学习VAE。 Auto-encoder 感谢李宏毅老师的视频! 自编码器是一种无监督学习的神经网络模型,可以用于数据降维、特征压缩、特征提取、数据生成等任务。其主要思想是尝试将输入数据通过 ......
模型 VAE

Gorm 数据库表迁移与表模型定义

Gorm 数据库表迁移与表模型定义 一、Docker快速创建MySQL实例 1.1 创建 因为这里我们是测试学习使用,单独安装MySQL 比较费时费力,所以这里使用Docker方便快速掌握Gorm 相关知识。 如果你没有docker环境,可以参考:【一文搞定】Linux、Mac、Windows安装D ......
模型 数据库 数据 Gorm

扩散模型

该模型是学习从噪音中如何去除噪音生成一个他已经学会的图片,所以一开始输入模型的是噪音,但是经过一次处理效果不会非常好,所以要循环迭代很多次,得到最终生成结果。 模型预测的实际上是噪音,也就是说要将输入图片减去模型预测的噪音,得到生成结果。 这里没有讲的太细,我的理解是神经网络需要的输入是正态分布的噪 ......
模型

解析flywheel飞轮模型以及它的落地路径

Brian Halligan提出的flywheel飞轮模型,比RARRA模型更进了一步。不止关注用户留存,更关注的是现有用户如何推动企业增长。 HubSpot创始人Brian Halligan在Inbound2018大会上说,他们从此以后就彻底跟营销漏斗说再见了,要用flywheel飞轮模型。 我本 ......
飞轮 路径 flywheel 模型

大模型调优方法:提示工程、RAGs 与微调对比

每一个搭建大语言模型应用的AI工程师都会面临一个难题,如何选择一个合适调优方法。就算是强大的预训练LLM也可能无法直接满足项目中的特定需求。如项目需要一个特定结构的应用程序,如预训练缺失上下文的重要文件,再比如有特定术语和结构的高专业性的行业领域,面对这些问题,需要有特定的方法来调整LLM。 要决定 ......
模型 方法 工程 RAGs

大语言模型LLM幻觉的解决方法:检索增强生成RAG

当你向大语言模型LLMs集成的问答系统平台咨询医疗方面的问题,比如呼吸道感染应该怎么治疗,它可能直接给出答案,但不会提供这个答案的依据来源,这是因为大语言模型应用过程中还存在答案透明度不足的缺陷导致。此外,大语言模型还有知识更新的滞后性、在处理复杂任务时的准确性的问题。 为了解决这些问题,检索增强生 ......
幻觉 模型 语言 方法 LLM

常见3D模型汇总

3D模型查看器: 3D查看器 (Windows自带) Blender MeshLab (基于VCGlib) 3D模型来源: 美工建模 (fbx) 三维重建 (ply/obj) 3D-AIGC 3D模型格式: obj fbx glb (glTF2.0):https://github.com/Khron ......
模型 常见
共3386篇  :1/113页 首页上一页1下一页尾页