torchvision torch cuda 10.2

文心一言 VS 讯飞星火 VS chatgpt （112）-- 算法导论10.2 3题

三、用go语言，用一个单链表L实现一个队列。要求操作 ENQUEUE 和 DEQUEUE 的运行时间仍为O(1)。文心一言：在 Go 语言中，使用单链表实现队列的操作，包括入队（ENQUEUE）和出队（DEQUEUE），并保持操作的时间复杂度为 O(1)，需要利用两个指针，一个指向队头，另一个指 ......

文心导论算法 chatgpt VS更新时间 2023-10-13

安装NVIDIA，CUDA, cuDNN的个人笔记

安装nvdian： sudo chmod +x NVIDIA-Linux-X86_64-440.100.run sudo ./NVIDIA-Linux-X86_64-440.100.run -no-x-check 在后面加上不对Xserver进行检查的命令（红色）就可以安装成功！查看INVIDIA ......

笔记 NVIDIA cuDNN 个人 CUDA更新时间 2023-10-13

Linux安装cuda和cudnn教程

https://blog.csdn.net/qq_34848334/article/details/131015697?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522169708238516800192266848%2522%252C ......

教程 Linux cudnn cuda更新时间 2023-10-13

Linux系统CUDA安装及踩坑记录

https://zhuanlan.zhihu.com/p/501473091 我的Linux系统背景：系统和驱动都已安装。系统是centos 8。查看自己操作系统的版本信息：cat /etc/issue或者是 cat /etc/lsb-release 用nvidia-smi可以看到显卡驱动和可支 ......

系统 Linux CUDA更新时间 2023-10-13

文心一言 VS 讯飞星火 VS chatgpt （111）-- 算法导论10.2 2题

二、用go语言，用一个单链表 L实现一个栈。要求操作 PUSH和 POP 的运行时间仍为 O(1)。文心一言：在 Go 语言中，我们可以用结构体来实现一个单链表，然后再用栈的相关操作。以下是一个可能的实现方式： package main import "fmt" // 定义一个Node结构体， ......

文心导论算法 chatgpt VS更新时间 2023-10-12

Linux （Ubuntu）安装 cuda 11.7

使用的Linux系统为 Ubuntu 18.04，显卡为GeForce RTX 3060 ，驱动版本号为515.57，安装CUDA 11.7。第一步：查看显卡是否正常，显示如下则表示没有问题。（版本要对应正确）命令： lspci|grep NVIDIA 第二步：选择下载对应的CUDA包，官网地址 ......

Ubuntu Linux 11.7 cuda 11更新时间 2023-10-11

文心一言 VS 讯飞星火 VS chatgpt （110）-- 算法导论10.2 1题

一、用go语言，单链表上的动态集合操作 INSERT 能否在 O(1)时间内实现？DELETE 操作呢？文心一言：在单链表中，INSERT 和 DELETE 操作的时间复杂度通常是 O(n)，其中 n 是链表中的元素数量。这主要是因为当你插入或删除元素时，你需要遍历链表来找到正确的插入或删除位置 ......

文心导论算法 chatgpt VS更新时间 2023-10-10

CUDA/cudnn/CUDA Toolkit/NVCC区别简介

CUDA：为“GPU通用计算”构建的运算平台。 cudnn：为深度学习计算设计的软件库。 CUDA Toolkit (nvidia)： CUDA完整的工具安装包，其中提供了 Nvidia 驱动程序、开发 CUDA 程序相关的开发工具包等可供安装的选项。包括 CUDA 程序的编译器、IDE、调试器等， ......

CUDA Toolkit 简介 cudnn NVCC更新时间 2023-10-09

cuda 多版本切换

https://developer.nvidia.com/rdp/cudnn-download cuda 多版本切换在安装了多个版本的cuda之后可以在/usr/local下看到已安装的多个版本，如：cuda-8.0 cuda-10.0等。还会看到一个名为cuda的文 ......

版本 cuda更新时间 2023-10-09

查看 CUDA 版本正确方法（亲测有效）

一、正确方法：打开cmd，输入 nvcc --version 二、错误方法： 1.cmd输入，以下 nvidia-smi 这个方法不对，这里的11.2 指的是可驱动的最高版本。下载CUDA的版本应低于11.2。 https://blog.csdn.net/baidu_30506559/article ......

版本方法 CUDA更新时间 2023-10-09

搭建Pytorch2.1+CUDA12.1+Anaconda+Pycharm深度学习环境

环境： Win11 22H2 需要的安装包： Anaconda3-2021.05-Windows-x86_64.exe Python 3.11. pycharm-professional-2021.2.1.exe CUDA12.1与CUDNN V8.9.5 pytorch 2.1 选择性安装Open ......

深度 Pytorch2 Anaconda Pytorch Pycharm更新时间 2023-10-09

深度学习（判断cuda是否可用）

安装完pytorch、cuda和cudnn之后，可以先判断是否可用。 import torch print('CUDA版本:',torch.version.cuda) print('Pytorch版本:',torch.__version__) print('显卡是否可用:','可用' if(torc ......

深度 cuda更新时间 2023-10-09

上周热点回顾（10.2-10.8）

热点随笔： · 【故障公告】遭遇用心良苦的疯狂攻击：DDoS + CC攻击 (博客园团队)· 一种对数据库友好的GUID的变种使用方法 (ensleep)· BS系统的登录鉴权流程演变 (风吹草)· 会员权益-新功能发布：定时发布博文 (博客园团队)· 面试官随便问几个问题就知道你究竟做没做过微信支 ......

热点 10.2 10 10.8更新时间 2023-10-09

CUDA C编程权威指南：2.2-给核函数计时

本文主要通过例子介绍了如何给核函数计时的思路和实现。实现例子代码参考文献[7]，只需要把相应章节对应的CMakeLists.txt文件拷贝到CMake项目根目录下面即可运行。 1.用CPU计时器计时(sumArraysOnGPU-timer.cu)[7] 在主函数中用CPU计时器测试向量加法的核函数 ......

函数权威指南 CUDA 2.2更新时间 2023-10-09

学习小结（10.2~10.8）

“ ” —— 《》学习记录日期 10.2 10.3 10.4 内容考试考试考试收获又是dp、期望qwq 李超线段树加急！！！T_T 经典不会T3、T4，T2莫队还没对，T1构造错了反思 T2DP没推出来合适的状态和方程T3又是期望制裁昨天刚准备开始学李超线段树，今天就被先一步制裁了 ......

小结 10.2 10 10.8更新时间 2023-10-08

ControlNet-trt优化总结3：使用multi-stream和cuda-graph构建并行流水线

ControlNet-trt优化总结3：使用multi-stream和cuda-graph构建并行流水线上节谈到使用TRT-API来构建网络，在这一节中总结一些trick来提升模型的运行效率，这些trick在所有的trt优化中均可使用，主要有以下几点：使用cuda_graph减少kernel间的 ......

ControlNet-trt 流水线 multi-stream ControlNet cuda-graph更新时间 2023-10-08

CUDA C编程权威指南：2.1-CUDA编程模型

本文主要通过例子介绍了CUDA异构编程模型，需要说明的是Grid、Block和Thread都是逻辑结构，不是物理结构。实现例子代码参考文献[2]，只需要把相应章节对应的CMakeLists.txt文件拷贝到CMake项目根目录下面即可运行。 1.Grid、Block和Thread间的关系 GPU中最 ......

CUDA 模型权威指南 2.1更新时间 2023-10-08

CUDA_ERROR_OUT_OF_MEMORY: out of memory

2023-02-04 22:17:02.457962: I tensorflow/stream_executor/cuda/cuda_driver.cc:831] failed to allocate 152.00M (159383552 bytes) from device: CUDA_ERROR ......

CUDA_ERROR_OUT_OF_MEMORY MEMORY memory ERROR CUDA更新时间 2023-10-08

pytorch torch.nn.BatchNorm1d

pytorch torch.nn.BatchNorm1d nn.BatchNorm1d本身不是给定输入矩阵，输出归一化结果的函数，而是定义了一个方法，再用这个方法去做归一化。下面是一个例子。BN = nn.BatchNorm1d(100)input = torch.randn(20, 100)out ......

BatchNorm1d BatchNorm1 BatchNorm pytorch torch更新时间 2023-10-07

<class 'torch.nn.modules.conv.Conv1d'> torch.nn.Conv1d

1、Conv1d 定义class torch.nn.Conv1d(in_channels, out_channels, kernel_size, stride=1, padding=0, dilation=1, groups=1, bias=True) 自然语言处理中一个句子序列，一维的，所以使用C ......

Conv1d Conv1 torch Conv modules更新时间 2023-10-07

ElasticSearch8.10.2接入SpringBoot3.+

pom.xml文件引入依赖  <dependency> <groupId>co.elastic.clients< ......

ElasticSearch8 ElasticSearch SpringBoot3 SpringBoot 10.2更新时间 2023-10-06

10.2 调试事件获取DLL装载

理解了如何通过调试事件输出当前进程中寄存器信息，那么实现加载DLL模块也会变得很容易实现，加载DLL模块主要使用`LOAD_DLL_DEBUG_EVENT`这个通知事件，该事件可检测进程加载的模块信息，一旦有新模块被加载或装入那么则会触发一个通知事件，利用该方法并配合磁盘路径获取函数则可很容易的实现... ......

事件 10.2 DLL 10更新时间 2023-10-05

CUDA C编程权威指南：1-基于CUDA的异构并行计算

什么是CUDA？CUDA（Compute Unified Device Architecture,统一计算设备架构）是NVIDIA（英伟达）提出的并行计算架构，结合了CPU和GPU的优点，主要用来处理密集型及并行计算。什么是异构计算？这里的异构主要指的是主机端的CPU和设备端的GPU，CPU更擅长逻 ......

CUDA 权威指南更新时间 2023-10-05

CUDA C编程权威指南：1.1-CUDA基础知识点梳理

主要整理了N多年前（2013年）学习CUDA的时候开始总结的知识点，好长时间不写CUDA代码了，现在LLM推理需要重新学习CUDA编程，看来出来混迟早要还的。 1.CUDA 解析：2007年，NVIDIA推出CUDA（Compute Unified Device Architecture，统一计算设 ......

知识点 CUDA 权威基础指南更新时间 2023-10-05

CUDA C编程权威指南：1.2-CUDA基础知识点梳理

主要整理了N多年前（2013年）学习CUDA的时候开始总结的知识点，好长时间不写CUDA代码了，现在LLM推理需要重新学习CUDA编程，看来出来混迟早要还的。 1.闭扫描和开扫描对于一个二元运算符和一个元输入数组。如果返回输出数组为，那么是闭扫描；如果返回输出数组为，那么是开扫描。串行闭扫描算法， ......

知识点 CUDA 权威基础指南更新时间 2023-10-05

CUDA C编程权威指南：1.3-CUDA基础知识点梳理

主要整理了N多年前（2013年）学习CUDA的时候开始总结的知识点，好长时间不写CUDA代码了，现在LLM推理需要重新学习CUDA编程，看来出来混迟早要还的。 1.CUDA数组解析：CUDA数组是使用cudaMallocArray()、cudaMalloc3DArray()分配的，使用cudaFr ......

知识点 CUDA 权威基础指南更新时间 2023-10-05

2023信友队提高组复赛冲刺班 10.2赛后总结

T1：区块链赛场上还以为很难，直接打表，80pts。本来以为还不错，结果一堆人AC，吐血！算了，还是来说说正解吧，说多了都是血和泪啊啊啊！先对开头的公式进行变形，得到： nb/(b-n) xor b =a 通过大量的样例我们可以发现，当b=n+1时，nb/(b-n)取到最大值这是为什么呢？我 ......

复赛 2023 10.2 10更新时间 2023-10-02

10.2闲话

今天就返校力😭😭😭 但是上午还没返校，看 B 站看爽了。然后抽时间打了把妖妖梦 E 难度，3 残通关，诱导机体真好混关🥰🥰🥰 下午返校，高铁上手机玩爽了。 jimmy 让报牛客的模拟赛，借此从我爸那怒赚 200 块（。具体过程：我跟我爸说要报这玩意，我爸微信转我 200，然后我用我爸支 ......

10.2 10更新时间 2023-10-02

Torch not compiled with Cuda enabled 解决办法

确保下方指令运行有效： nvcc --version 进入指定虚拟环境下运行下方指令： conda install pytorch==1.11.0 torchvision==0.12.0 torchaudio==0.11.0 cudatoolkit=11.3 -c pytorch 参考来源 ......

compiled enabled 办法 Torch Cuda更新时间 2023-10-02

CUDA矩阵乘法算法分析

CUDA矩阵乘法算法分析矩阵乘法是科学计算的基本构建块。此外，矩阵乘法的算法模式具有代表性。许多其他算法与矩阵乘法共享类似的优化技术。因此，矩阵乘法是学习并行编程中最重要的例子之一。 CUDA 矩阵乘法的源代码可在 gitlab 上找到。建议使用 git 获取源代码，它允许提取可能提供的任何更新， ......

乘法矩阵算法 CUDA更新时间 2023-10-02

共400篇 :4/14页 首页上一页1234567下一页尾页