torchvision torch cuda 10.1

python-torch numpy matploit pandas

title: 深度学习基础 torch numpy pandas matplotlib numpy 数组对象是 NumPy 中最核心的组成部分,这个数组叫做 ndarray,是“N-dimensional array”的缩写。其中的 N 是一个数字,指代维度. 在 NumPy 中,数组是由 nump ......
python-torch matploit python pandas numpy

torch.clamp()函数、torch.mean()、torch.sum()、torch哈达玛积和普通乘积、torch.expand()函数和torch.expand_as()函数

torch.clamp()函数 参考博客:https://blog.csdn.net/weixin_39504171/article/details/106069230 torch哈达玛积和普通乘积 https://zhuanlan.zhihu.com/p/537877779 torch.mean( ......
torch 函数 乘积 expand expand_as

多个CUDA版本使用

显卡,显卡驱动,nvcc, cuda driver,cudatoolkit,cudnn到底是什么?请先看这个帖子https://www.cnblogs.com/marsggbo/p/11838823.html 如何使用不同版本的CUDA! 假设使用CUDA 11.7版本,在你的当前环境,注入以下环境 ......
多个 版本 CUDA

【CUDA】 NVIDIA Nsight Systems user guide

本来想通过CLI来打开Nsight System,结果几度尝试打开都是闪退。 解决方法:打开VS :扩展-管理扩展-下载,搜索Nsight,下载以下扩展,再打开VS,就能在扩展-Nsight中找到Nsight System。点Trace 进入GUI。 2.2.从GUI分析Windows目标 选择我们 ......
Systems NVIDIA Nsight guide CUDA

CUDA和cuDNN各版本下载及版本对应关系

CUDA历史版本下载地址: https://developer.nvidia.com/cuda-toolkit-archive cuDNN历史版本下载地址: https://developer.nvidia.com/rdp/cudnn-archive 其中在cuDNN历史版本下载页面可以看到与CUD ......
版本 cuDNN CUDA

cuda原子操作进行直方图计算

首先在cpu上进行计算 #include <iostream> #include <chrono> #define DATA_LEN (100 * 1024 * 1024) inline int rnd(float x) { return static_cast<int>(x * rand() / ......
直方图 原子 cuda

cuda多版本共存

torch 一会要这个版本,一会要那个版本,还要和cuda对应上。避免不了要下载多个cuda 参考文档:https://blog.csdn.net/ytusdc/article/details/85173258 1. 下载cuda 2. 安装(失败,runfile) 一直按回车 说什么未知原因 3. ......
版本 cuda

小白也能搞定!Windows10上CUDA9.0+CUDNN7.0.5的完美安装教程

前言: 为什么要在本地电脑安装 CUDA,CUDA 是什么的,用来做什么?我想,点击标题进来的小伙伴,应该都清楚这些。不管你是用来做什么,或者跟我一样为了跑 Tensorflow 的 Object Detection (目标检测)。 但是我为什么要用 CUDA9,这里版本要特别注意。因为我使用的是 ......
Windows 教程 CUDNN7 CUDA9 CUDNN

Python小练习:优化器torch.optim的使用

Python小练习:优化器torch.optim的使用 作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 本文主要介绍Pytorch中优化器的使用方法,了解optimizer.zero_grad()、loss.backward()以及optimizer. ......
Python torch optim

使用cuda常量内存进行性能优化

常量内存是在变量前面加上 __constant__,常量内存用于保存核函数执行期间不会发生变化的数据,NVIDIA想硬件提供了 64KB 的常量内存,在通常情况下,使用常量内存代替全局内存能有效的缩减内存带宽 常量内存的赋值使用 cudaMemcpyToSymbol() 函数 示例代码中我创建了一个 ......
常量 内存 性能 cuda

Linux安装cuda,cudann,tensorRT

cuda官网链接 https://developer.nvidia.com/cuda-toolkit-archive 别人的链接链接 https://zhuanlan.zhihu.com/p/72298520 配置环境变量 export LD_LIBRARY_PATH=$LD_LIBRARY_PAT ......
tensorRT cudann Linux cuda

torch梯度计算相关

torch梯度计算图 计算图中,默认只有叶子结点的梯度能够保留,如果要访问非叶子结点p的梯度数据,需要执行p.retain_grad(). torch计算图中requires_grad与detach的区别 requires_grad是torch.Tensor中的属性,表示该张量是否需要计算梯度.而d ......
梯度 torch

pytorch cuda gpu版本与detectron2、jupyter notebook安装

任意版本的pytorch、cuda的gpu版本与detectron2、jupyter notebook安装 1. 简介 本文主要介绍pytorch cuda gpu版本与detectron2、jupyter notebook安装, 主要是基于docker构建AI开发/预测用的环境. 优势与不足 优势 ......

显卡驱动+cuda+cudnn+深度学习框架

安装概览 安装显卡驱动、CUDA 和 cuDNN 可能因操作系统和 GPU 型号而异,下面是一般的步骤: 下载和安装适合你 GPU 型号的显卡驱动,可以从官方网站或者 GPU 制造商的网站下载。 下载和安装适合你 CUDA 版本的 CUDA 工具包,可以从官方网站下载。 下载和安装适合你 CUDA ......
显卡驱动 显卡 框架 深度 cudnn

win11+CUDA-11.7.1+cudnn-8.8.0

CUDA安装+vsstdio2022配置 先进行CUDA-11.7.1安装 https://developer.nvidia.com/cuda-11-7-1-download-archive 在NVIDIA-CUDA下载地址下载win.exe安装包 完成后,进行安装(注意:需要记住自定义安装目录,后 ......
cudnn 11 CUDA win

cuda、cudnn、zlib 深度学习必配三件套(Windows)

无论用tensorrt,还是onnxruntime部署。这三个都得下载配置,推荐都放到相应的cuda路径里(含dll的文件夹、含lib的文件夹)。 推荐先下载tensorrt或者onnxruntime,这样可以知道所需的cuda、cudnn版本。 1、cuda(以11.8为例) 下载地址:CUDA ......
件套 深度 Windows cudnn cuda

Red Hat CUDA安装

参考: https://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html ......
CUDA Red Hat

邻接矩阵、稀疏矩阵(torch, sparse, numpy)相互转换 [转载]

原链接:邻接矩阵转稀疏矩阵 邻接矩阵转稀疏矩阵 Example: import scipy.sparse as sp import numpy as np import torch adj_matrix = torch.randint(0,2,(4,4)) print(adj_matrix) # 输 ......
矩阵 sparse torch numpy

CUDA中的pagelocked memory

背景:在异步传输内存中,需要在HOST 端分配 pagelocked memory , 达到的效果一 CPU不会 将该内存分配到低速的虚拟内存当中,是提高传输速率, 二是异步传输需要Host端始终将该内存放在物理端,可以理解为内存地址双方约定俗成,不会再变了。 自己遇到的问题: cudaHostAl ......
pagelocked memory CUDA

闻其声而知雅意,基于Pytorch(mps/cpu/cuda)的人工智能AI本地语音识别库Whisper(Python3.10)

前文回溯,之前一篇:含辞未吐,声若幽兰,史上最强免费人工智能AI语音合成TTS服务微软Azure(Python3.10接入),利用AI技术将文本合成语音,现在反过来,利用开源库Whisper再将语音转回文字,所谓闻其声而知雅意。 Whisper 是一个开源的语音识别库,它是由Facebook AI ......
雅意 人工智能 人工 语音 Pytorch

windows上用vs2017静态编译onnxruntime-gpu CUDA cuDNN TensorRT的坎坷之路

因为工作业务需求的关系,需编译onnxruntime引入项目中使用,主项目exe是使用的vs2017+qt5.12。 onnxruntime就不用介绍是啥了撒,在优化和加速AI机器学习推理和训练这块赫赫有名就是了。 有现成的别人编译好的只有dll动态库,当然我们显然是不可能使用的,因为BOSS首先就 ......
共381篇  :13/13页 首页上一页13下一页尾页