torchvision torch cuda 10.2

torch反向传播backward()函数解析

参考网址: https://blog.csdn.net/weixin_44179269/article/details/124573992?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522170167791616800197042802 ......
函数 backward torch

OpenCV4.1.0与CUDAcuda_10.1.105联合进行图像特征点提取和特征匹配时,运行程序时错误提示:无法定位程序输入点?createBFMatchercv@DescriptorMatcher@cuda@cv......于动态链接库......

问题描述: OpenCV4.1.0与CUDAcuda_10.1.105联合进行图像特征点提取和特征匹配时,运行程序时错误提示:无法定位程序输入点?createBFMatchercv@DescriptorMatcher@cuda@cv......于动态链接库......,如下图所示: 解决办法: 如果 ......

torch版本真的很重要!!!

事情的经过就是,跑深度学习代码的时候,遇到了一系列的错误 参数维度对不上 1.运行时,发现预训练模型得到的参数跟我模型要的对不上,傻逼了,当时没看见github得issues里面就有解答,找了大半天,还尝试去改模型参数。 其实就是因为下载的预训练模型参数的版本不对,应该用旧的版本。 cuda用不了 ......
版本 torch

conda环境下Python报错:raise MissingCUDAException("CUDA_HOME does not exist, unable to compile CUDA op(s)") CUDA_HOME does not exist, unable to compile CUDA op(s)

conda环境下Python报错: (pytorch) devil@Monster:~$ pip install deepspeed Collecting deepspeed Using cached deepspeed-0.12.4.tar.gz (1.2 MB) Preparing metada ......
CUDA CUDA_HOME compile unable exist

torch.max

dim (可选): 沿着哪个维度计算最大值,默认是计算整个张量的最大值 写法1x = torch.tensor([[1, 2, 3], [4, 5, 6]]) values,_= torch.max(x, dim=0) print(values) # 输出每行的最大值 [3, 6] tensor([ ......
torch max

torch.cpu

将张量从GPU移到CPU上 import torch # 创建一个张量并将其放在GPU上 tensor_gpu = torch.randn((3, 3)).cuda() # 将张量从GPU移动到CPU tensor_cpu = tensor_gpu.cpu() ......
torch cpu

torch.detach

在深度学习中,通常使用自动微分(Autograd)来计算梯度,以便进行反向传播和优化。 在这个过程中,PyTorch会构建一个计算图,用于跟踪张量之间的计算关系。这个计算图是由各个张量之间的运算所构成的,以便在进行反向传播时计算梯度。 .detach()方法的作用是创建一个新的张量,与原始张量共享相 ......
detach torch

torch.cat

拼接tensor torch.cat(tensors, dim): 沿指定维度拼接张量。 tensor1 = torch.tensor([[1, 2, 3], [4, 5, 6]]) tensor2 = torch.tensor([[7, 8, 9], [10, 11, 12]]) # dim=0 ......
torch cat

torch.add等

数学运算: a = torch.tensor([[1, 2, 3], [4, 5, 6]]) b = torch.tensor([[7, 8, 9], [10, 11, 12]]) tensor([[1, 2, 3], [4, 5, 6]]) tensor([[ 7, 8, 9], [10, 11, ......
torch add

Windows10 下 CUDA 新旧多版本共存

前言 为了运行一个 Tensorflow1.6.0 的项目,CPU 跑了三个多小时才完成一个 epoch,还得用 GPU。但这个版本的 TF 只能在 10 以下的 CUDA 平台,但是以前的 Pytorch 也要继续啊。所以需要在本地 Windows 下安装多个版本 CUDA,其实有两种方式让 CU ......
新旧 Windows 版本 CUDA 10

torch.cuda

什么时候需要将计算放置再gpt,cuda上 数据,模型放在cuda上计算之后,还用导回cpu吗 用法 torch.cuda.is_available() torch.cuda.device() ......
torch cuda

torch保存模型

保存模型有两种方式,方式不同,在调用模型的时候也不同 我更建议用torch.jit。。。这样不需要在写模型的参数 torch.save 保存模型: import torch import torch.nn as nn # 假设 model 是你的 PyTorch 模型 class SimpleMod ......
模型 torch

使用NVIDIA HPC SDK构建cuda-samples

NVIDIA HPC SDK虽然附带了CUDA、cuBLAS等库,但安装路径与CUDA Toolkit有差异。cuda-samples有些示例用到了cuBLAS等数学库,按照文档直接make会找不到库文件。 翻找示例的Makefile想找全局的设置,发现有行ALL_CCFLAGS += $(EXTR ......
cuda-samples samples NVIDIA cuda HPC

torch用法--张量操作

创建张量: torch.tensor(data): 从数据中创建张量。用列表创建,numpy创建 维度只看[ ] # 一维张量 data_1d = [1, 2, 3] tensor_1d = torch.tensor(data_1d)# 结果tensor([1, 2, 3]) # 二维张量 data ......
张量 torch

Torch张量是什么

定义: 在PyTorch中,张量(tensor)是一种类似于多维数组的数据结构,它是PyTorch的核心数据类型。张量可以具有不同的维度,例如标量(0维张量,类似于一个数字)、向量(1维张量,类似于一维数组)、矩阵(2维张量,类似于二维数组)以及更高维度的数组。 张量的维度,矩阵的维度主要看第一个数 ......
张量 Torch

CUDA编程-性能优化

参考文档: CUDA C++ Best Practices Guide 持续更新中。。。 指令优化 使用数学库 在速度胜过精度的情况时,可以考虑使用数学库函数接口。函数名称前带有__下划线的函数名,此类函数在硬件级别上的映射,速度更快,精度稍低。例如:__sinf(x) 另请注意,每当计算同一参数的 ......
性能 CUDA

Linux CentOS安装CUDA

查看CUDA版本 nvidia-smi 一、卸载显卡驱动 sh cuda_11.3.1_465.19.01_linux.run --uninstall 二、下载显卡驱动 首先确定GPU服务器类型,驱动下载地址 三、下载CUDA 1、选择正确的CUDA版本 下载地址 这里我选择11.3版本,下载地址为 ......
CentOS Linux CUDA

cuda错误检测

cuda错误检测方法 宿主线程维护着一个初始化为cudaSuccess的cudaError_t类型变量,但出现错误时,该变量都会被错误代码替换。在调用cudaGetLastError()时,就会返回此变量,并将其置为cudaSucess。 CUDA 提供了相应的错误信息函数,常用的有以下两个: cu ......
错误 cuda

torch的用法总结

张量操作(Tensors): 创建张量(列表、numpy、0、1) 张量操作(改变形状、索引切片、) 数学操作(加 乘) 查看形状 Autograd(自动求导): 定义可训练参数:torch.nn.Parameter自动求导上下文管理器:torch.autograd损失函数:torch.nn.fun ......
torch

torch常见激活函数

torch常见激活函数 目录torch常见激活函数激活函数定义Sigmoid型S激活函数sigmoid函数Tanh函数LogSigmoid函数Softmax函数Softplus函数ReLU型及其改进ReLU函数PReLU函数LeakyReLU函数RReLU函数ReLU6函数ELU指数线性单元SELU ......
函数 激活 常见 torch

yolo v5 下载新数据集被防火墙proxy挡住,如何设置proxy. torch.hub.download_url_to_file问题;

当我们想运行yolo v5时候,我们发现有的时候,由于网关问题,proxy会成为阻碍。例如如下错误; 将代码如下修改,就能改好: 1. 原始代码: 2. 增加proxy设置: import urllib.request import torch.hub # 设置代理信息 proxy_support ......

创建Conda环境时,自动包含当前系统中的Python和CUDA等

要在创建Conda环境时自动包含当前系统中的Python和CUDA,可以使用Conda的environment.yml文件。environment.yml文件是一个文本文件,其中包含了创建Conda环境所需的依赖项信息。 下面是一个示例的environment.yml文件,其中包含了Python和C ......
环境 Python 系统 Conda CUDA

CUDA:页锁定内存(pinned memory)和按页分配内存(pageable memory )

CUDA架构而言,主机端的内存分为两种,一种是可分页内存(pageable memroy), 一种是页锁定内存(page-lock或 pinned)。 可分页内存是由操作系统API malloc()在主机上分配,页锁定内存是由CUDA函数cudaMallocHost()和cudaHostAlloc( ......
内存 memory pageable pinned CUDA

无GPU环境中运行出错解决方法:AssertionError: Torch not compiled with CUDA enabled

在執行pytorch代碼的時候,突然看到報錯 AssertionError: Torch not compiled with CUDA enabled 這說明了 1. 你pytoch确实安装了 2. 你安装的是cpu版本 作为验证,你可以在python编辑器输入下列代码 如果要在无GPU环境中运行, ......

linux配置miniconda、pytorch、torch_scatter以及cuda. - 叶辰

在西方的天际,正在云海中下沉的夕阳仿佛被溶化着,太阳的血在云海和太空中弥漫开来,映现出一大片壮丽的血红。“这是人类的落日。” 一,miniconda下载安装以及注意事项 1,下载 进入官网miniconda 正常选择最新版Miniconda3 Linux 64-bit, jetson选择Minico ......

win10下编译DCNv2报错打不开"dcn_v2_cuda.obj"

1、换了cuda11.0和torch1.7.1,找了适配cuda11.0的DCNv2,使用的vs2019的cl.exe 链接:https://github.com/rathaROG/DCNv2_Windows, 2、之前一直没注意到vscode的terminal报错cond init什么东西,意思就 ......
下编 quot DCNv2 dcn_v DCNv

tensorflow版本与CUDA、cuDNN、Python适配表

从源代码构建 | TensorFlow (google.cn) ......
tensorflow 版本 Python cuDNN CUDA

OpenCV编译(支持CUDA模块)

OpenCV编译(支持CUDA模块) 1、编译环境 windows 11 Visual Studio 2022 cmake2.8 OpenCV 4.8 2、前置条件 预安装CUDA Toolkit 11、Visual Studio 2022、cmake2.8 3、编译OpenCV 在github中找 ......
模块 OpenCV CUDA

Jetson Mediapipe GPU/CUDA Python 包构建

使用 CPU 版本的 Mediapipe 延迟真的很高,所以试着构建了 GPU 版本的 Mediapipe。 GPU Support | MediaPipe | Google for Developers 然而 Google 官方的教程非常过时且并不是针对 Python 包的教程,参考价值非常非常小 ......
Mediapipe Jetson Python CUDA GPU

如何使用 GTX750 或 1050 显卡安装 CUDA11+

前言 由于兼容性问题,使得我们若想用较新版本的 PyTorch,通过 GPU 方式训练模型,也得更换较新版本得 CUDA 工具包。然而 CUDA 的版本又与电脑显卡的驱动程序版本关联,如果是低版本的显卡驱动程序安装 CUDA11 及以上肯定会失败。 比如 GTX750Ti 或 GTX1050Ti,出 ......
显卡 1050 CUDA GTX 750
共400篇  :2/14页 首页上一页2下一页尾页