实战datawhale diffuser模型

pytorch强制转换模型的所有参数都变成统一类型

可以调用模型的父类Module中的type方法，例如model.type(torch.float64)，将网络模型model的参数和缓冲区强制转换为torch.float64类型，这样就可以训练torch.float64类型的数据了，还可以指定其他类型。另外还有一些强制转换为某一种类型的方法：flo ......

模型参数 pytorch 类型更新时间 2023-12-06

大模型环境搭建（二）

二：Conda 安装 1.下载链接:https://repo.anaconda.com/miniconda/Miniconda3-latest-Windows-x86_64.exe 2.安装完之后,要修改以下他的执行策略！点开始菜单，打开：Anaconda Powershell Prompt (mi ......

模型环境更新时间 2023-12-06

大模型环境搭建（一）

一：Python 安装安装简介：电脑系统:Win11 安装Python版本：3.10.11 第一步,下载Python 打开官网：https://www.python.org/ 国内镜像：https://mirrors.huaweicloud.com/python/ 第三步,确认Python,pi ......

模型环境更新时间 2023-12-06

大语言模型底层架构丨带你认识Transformer

本文分享自华为云社区《大语言模型底层架构你了解多少？大语言模型底层架构之一Transfomer的介绍和python代码实现》，作者：码上开花_Lancer 。语言模型目标是建模自然语言的概率分布，在自然语言处理研究中具有重要的作用，是自然语言处理基础任务之一。大量的研究从n 元语言模型（n-gr ......

底层 Transformer 架构模型语言更新时间 2023-12-06

KubeKey 升级 KubeSphere 和 Kubernetes 补丁版本实战指南

作者：运维有术前言知识点定级：入门级 KubeKey 如何升级 KubeSphere 补丁版本 KubeKey 如何升级 Kubernetes 补丁版本 KubeSphere 和 Kubernetes 升级准备及验证 KubeKey 升级 KubeSphere 和 Kubernetes 的常见 ......

KubeSphere Kubernetes 实战补丁 KubeKey更新时间 2023-12-06

机器学习-逻辑回归：从技术原理到案例实战

在本篇文章中，我们对逻辑回归这一经典的机器学习算法进行了全面而深入的探讨。从基础概念、数学原理，到使用Python和PyTorch进行的实战应用，本文旨在从多个角度展示逻辑回归的内在机制和实用性。关注TechLead，分享AI全维度知识。作者拥有10+年互联网服务架构、AI产品研发经验、团队管理经 ......

实战逻辑原理机器技术更新时间 2023-12-06

小程序开发实战案例之二｜如何实现小程序支付

上一章讲完如何获取用户信息授权后，下一步就可以进行小程序支付了。本期就来介绍下支付宝小程序支付如何实现。 PS：接入前的准备工作可以参考：接入准备；接入指南可参考：接入指南～获取小程序支付权限获取权限分为三步：分别是账号开通 JSAPI 支付、账号与小程序账号绑定以及小程序绑定 JSA ......

实战案例程序更新时间 2023-12-06

三维模型的顶层合并构建的优势方面浅析

三维工厂K3DMaker是一款三维模型浏览、分析、轻量化、顶层合并构建、几何校正、格式转换、调色裁切等功能专业处理软件。可以进行三维模型的网格简化、纹理压缩、层级优化等操作，从而实现三维模型轻量化。轻量化压缩比大，模型轻量化效率高，自动化处理能力高；采用多种算法对三维模型进行几何精纠正处理，精度高，... ......

顶层模型方面优势更新时间 2023-12-06

第二章若依JFlow流程模型设计

这篇文章主要讲解了如何使用JFlow框架创建业务场景和流程模型，绘制流程图及注意事项，以及单节点的表单绘制和需要注意的细节 ......

模型流程第二章 JFlow更新时间 2023-12-05

语言大模型（LLMs）的特点

语言大模型(Large Language Models, LLMs)是近年来自然语言处理领域的重要发展之一。其主要特点是: 海量参数:LLMs包含了上十亿个参数,特别是GPT-3包含了1759亿个参数。这些大规模的参数使其可以学习非常复杂的模式和表征。巨量数据集:LLMs通过海量数据进行预训练,例 ......

模型特点语言 LLMs更新时间 2023-12-05

聊聊神经网络模型流程与卷积神经网络的实现

神经网络模型流程神经网络模型的搭建流程，整理下自己的思路，这个过程不会细分出来，而是主流程。在这里我主要是把整个流程分为两个主流程，即预训练与推理。预训练过程主要是生成超参数文件与搭设神经网络结构；而推理过程就是在应用超参数与神经网络。卷积神经网络的实现在聊聊卷积神经网络CNN中，将卷积神 ......

神经网络卷积神经网络模型更新时间 2023-12-05

Systemd 入门教程：实战篇

一、开机启动对于那些支持 Systemd 的软件，安装的时候，会自动在/usr/lib/systemd/system目录添加一个配置文件。如果你想让该软件开机启动，就执行下面的命令（以httpd.service为例）。 $ sudo systemctl enable httpd 上面的命令相当于 ......

入门教程实战 Systemd 教程更新时间 2023-12-05

PostgreSQL: select for update实战

场景需要获取用户申请的流水号，其值记录在number_of_form表中。但当多个用户同时申请时，会出现单号重复的情况，现在需要保证单据号码的一致性解决方案以我搜寻来看，大体有两种做法。悲观锁：总是假设最坏的情况，也就是每次拿数据的时候，都认为别人会修改，所以每次拿数据，都会对符合条件的数据 ......

PostgreSQL 实战 select update for更新时间 2023-12-05

PyTorch造大模型“加速包”，不到1000行代码提速10倍！英伟达科学家：minGPT以来最好的教程式repo之一

前言 PyTorch团队让大模型推理速度加快了10倍。且只用了不到1000行的纯原生PyTorch代码！本文转载自量子位仅用于学术分享，若侵权请联系删除欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 CV各大方向专栏与各个部署框架最全教程整理 ......

程式科学家模型 PyTorch 代码更新时间 2023-12-05

JeecgBoot 框架升级至 Spring Boot3 的实战步骤

总有人问 JeecgBoot 何时支持 jdk17 和 springboot3，目前官方已经推出了 SpringBoot 3 分支，大家可以提前下载体验 https://github.com/jeecgboot/jeecg-boot/tree/springboot3 ......

实战 JeecgBoot 框架步骤 Spring更新时间 2023-12-05

网络编程之IO模型

我们讨论网络编程中的IO模型时，需要先明确什么是IO以及IO操作为什么在程序开发中是很关键的一部分，首先我们看下IO的定义。 IO的定义 IO操作（Input/Output操作）是计算机系统中的一种重要操作，用于数据的输入和输出，通常涉及到计算机与外部设备（如硬盘、网卡、键盘、鼠标、打印机等）之间的 ......

网络编程模型网络更新时间 2023-12-05

【实战技能】单步运行源码分析，一期视频整明白FreeRTOS内核源码框架和运行机制，RTOS Trace链表功能展示

从源码的角度来看，OS内核源码就是通过各种链表组装起来的，FreeRTOS就是下面几个链表组成的。FreeRTOS的调度，任务切换就是倒腾这几个链表。而其它的几款OS是一个链表就一撸到底了，FreeRTOS是搞了好几个。所以视频里面就重点介绍下这个，其它的支持的也做个拓展说明。搞清楚这几个链表也就 ......

源码内核实战框架 FreeRTOS更新时间 2023-12-05

c++17实战手册（1）

目录C++17概述 C++17概述 C++是基于C语言（ISO/ IEC 9899 : 2011标准定义）扩展形成的程序设计语言，对C语言提供的机制作了以下扩充：更多的数据类型类模板异常名字空间额外的库机制 ......

实战手册 17更新时间 2023-12-05

三-select模型

select模型是对简单C/S模型的优化，他解决了accept函数阻塞等待连接的问题。并且允许应用程序同时监视多个套接字，从而实现简单的并发请求。通过调用select函数确认一个或多个套接字当前的状态，并根据当前状态进行相应操作。在select模型模型中，select函数是最关键的。 select模 ......

模型 select更新时间 2023-12-05

HTTPS处于OSI模型中哪个层？

HTTPS（Hypertext Transfer Protocol Secure）位于 OSI（Open Systems Interconnection）模型的应用层和传输层之间。在 OSI 模型中，从底层到顶层依次是：物理层、数据链路层、网络层、传输层、会话层、表示层和应用层。HTTPS 是在应 ......

模型 HTTPS OSI更新时间 2023-12-05

关于三维模型几何坐标校正的技术方法探讨

坐标几何模型方法技术更新时间 2023-12-05

使用Huggingface创建大语言模型RLHF训练流程的完整教程

ChatGPT已经成为家喻户晓的名字，而大语言模型在ChatGPT刺激下也得到了快速发展，这使得我们可以基于这些技术来改进我们的业务。但是大语言模型像所有机器/深度学习模型一样，从数据中学习。因此也会有garbage in garbage out的规则。也就是说如果我们在低质量的数据上训练模型，那 ......

Huggingface 模型流程语言教程更新时间 2023-12-05

机器学习-学习率：从理论到实战，探索学习率的调整策略

本文全面深入地探讨了机器学习和深度学习中的学习率概念，以及其在模型训练和优化中的关键作用。文章从学习率的基础理论出发，详细介绍了多种高级调整策略，并通过Python和PyTorch代码示例提供了实战经验。关注TechLead，分享AI全维度知识。作者拥有10+年互联网服务架构、AI产品研发经验、团 ......

实战机器策略理论更新时间 2023-12-05

Java开发者的Python快速实战指南：实用工具之PDF转DOCX文档（可视化界面）

pdf转docx文档是一个非常实用的功能，我只是简单地实现了一个可视化界面供用户操作。我这么做的目的之一是想更多地掌握gradio的使用方法，同时也加强对Python流行第三方包的熟悉程度，因为这些第三方包是快速开发的关键。我也希望你能从中有所收获，我已经公布了本期的源码地址，如果你觉得还不错，或者... ......

实用工具开发者实战界面文档更新时间 2023-12-05

因果推断9-18 链状结构、叉状结构、对撞结构、D-分割、模型检验和等价类

https://www.bilibili.com/video/BV1tk4y127L1/?spm_id_from=333.788&vd_source=3ad05e655a5ea14063a9fd1c0dcdee3e 所以得到一个结论，如果在一个链结构里面，比如X->Y->Z，condition到中间 ......

结构链状等价因果模型更新时间 2023-12-04

使用 PyTorch 完全分片数据并行技术加速大模型训练

本文，我们将了解如何基于 PyTorch 最新的完全分片数据并行 (Fully Sharded Data Parallel，FSDP) 功能用 Accelerate 库来训练大模型。动机 🤗 随着机器学习 (ML) 模型的规模、大小和参数量的不断增加，ML 从业者发现在自己的硬件上训练甚至加载 ......

模型 PyTorch 数据技术更新时间 2023-12-04

给 Web 前端工程师看的用 Rust 开发 wasm 组件实战

本文先介绍了 wasm-pack 官方的教程，还有其他组件测试、发布等的流程先不在这里介绍了。以下用一个实际开发中的模块来说一下开发 wasm 组件过程中遇到的问题和解决方法。 ......

前端实战组件工程师工程更新时间 2023-12-04

Day12 jvm 内存模型JMM

1. jvm 内存模型 JMM 原帖链接 JMM控制 Java 线程之间的通信，决定一个线程对共享变量的写入何时对另一个线程可见。每条线程在自己的工作内存中对共享变量（副本）进行操作，JMM再负责把这些操作同步到主内存中 JVM1.8 用Meta space（元空间）（在JVM外的本地内存中）取代 ......

模型内存 Day jvm JMM更新时间 2023-12-04

做算力的浪潮信息为什么还要再卷大模型？

避免重复造轮子，前提是轮子已经造得很好。大模型有多卷？现在国内已经有180个以上生成式大模型，科技大厂、互联网大厂纷纷入局，既有百度、浪潮信息、阿里、腾讯等一众巨头，也有专攻AI的讯飞、商汤等垂直领域小巨头，以及“日日新”的创业企业。今天A厂商发布大模型，各种参数对比下来堪称最强，第二天B厂商 ......

浪潮模型信息更新时间 2023-12-04

从HumanEval到CoderEval: 你的代码生成模型真的work吗？

本文主要介绍了一个名为CoderEval的代码生成大模型评估基准，并对三个代码生成模型（CodeGen、PanGu-Coder和ChatGPT）在该基准上的表现进行了评估和比较。 ......

代码生成 HumanEval CoderEval 模型代码更新时间 2023-12-04

共5260篇 :19/176页 首页上一页16171819202122下一页尾页