cuda

ubuntu20.04 opencv 4.2 + opencv_contrib 4.2.0 安装笔记 和 opencv 4.5.4 with cuda 安装笔记

参考: https://docs.opencv.org/4.x/d7/d9f/tutorial_linux_install.html Build with opencv_contrib # 1. Install minimal prerequisites, libgtk2.0-dev pkg-con ......
opencv 笔记 opencv_contrib contrib ubuntu

Windows10安装cuda失败

安装顺序 首先我们要清楚顺序: 1.NVIDIA Driver 2.CUDA 3.cuDNN 4.TensorFlow 安装注意 驱动和CUDA版本不是一一对应,而是可以兼容向下的,像我的电脑经常安装两三个版本的CUDA,而驱动只有一个最新版本。 由于下载local版本的CUDA安装包会带显卡驱动, ......
Windows cuda 10

Cannot re-initialize CUDA in forked subprocess.

"Cannot re-initialize CUDA in forked subprocess. " + msg) RuntimeError: Cannot re-initialize CUDA in forked subprocess. To use CUDA with multiprocessi ......

CUDA驱动深度学习发展 - 技术全解与实战

全面介绍CUDA与pytorch cuda实战 关注TechLead,分享AI全维度知识。作者拥有10+年互联网服务架构、AI产品研发经验、团队管理经验,同济本复旦硕,复旦机器人智能实验室成员,阿里云认证的资深架构师,项目管理专业人士,上亿营收AI产品研发负责人 一、CUDA:定义与演进 CUDA( ......
实战 深度 技术 CUDA

slam相关-Sophus库cmake报错target "CUDA::cusolver" not found.

报错细节 用cmake编译Sophus库时,有类似如下报错 CMake Error at test/core/CMakeLists.txt:18 (ADD_EXECUTABLE): Target "test_sim3" links to target "CUDA::cublas" but the t ......
quot cusolver Sophus target cmake

简易机器学习笔记(十)Windows下 PaddlePaddle配置CUDA加速环境

前言 大伙既然都来做这个了,那配个CUDA环境肯定是必不可少的了吧(笑) 最前面的最前面, 流程 确定当前设备支持的CUDA版本 安装CUDA Toolkit 和 GPU版的Paddlepaddle 下载cuDNN Archive 手动放置配套的cuDNN到指定文件夹 测试 1.确定当前设备支持的C ......
PaddlePaddle 简易 机器 Windows 环境

AI_GPU-硬件-驱动-cuda

硬件 GeForce 系列 是英伟达主打的消费级GPU产品线 Quadro 系列 是英伟达专业级GPU产品线,针对商业和专业应用领域进行了优化 NVIDIA Quadro P1000显卡 Jetson 系列 是面向边缘计算和人工智能应用的嵌入式开发平台,具备强大的计算和推理能力: Jetson Or ......
硬件 AI_GPU cuda GPU AI

cuda流的使用

CUDA流表示一个GPU操作队列,该队列中的操作将以添加到流中的先后顺序而依次执行。可以将一个流看做是GPU上的一个任务,不同任务可以并行执行。使用CUDA流,首先要选择一个支持设备重叠(Device Overlap)功能的设备,支持设备重叠功能的GPU能够在执行一个CUDA核函数的同时,还能在主机 ......
cuda

cuda\cudnn\torch安装

cuda toolkits 是工具包包含cuda和显卡驱动,需要选择显卡合适的版本,到官网查看 cudnn是加速的 torch是需要支持cuda的版本 cuda安装 1、https://blog.csdn.net/RenZuoym/article/details/132211730 2、下载:cud ......
cudnn torch cuda

cuda版本切换

https://zhuanlan.zhihu.com/p/589442446 vi ~/switch-cuda.sh source switch-cuda.sh source switch-cuda.sh 10.1 #!/usr/bin/env bash # Copyright (c) 2018 P ......
版本 cuda

【OpenCV】 OpenCV 源码编译并实现 CUDA 加速 (Windows)

OpenCV是一个基于Apache2.0许可(开源)发行的跨平台计算机视觉和机器学习软件库,可以运行在Linux、Windows、Android和Mac OS操作系统上。项目源码由一系列 C 函数和少量 C++ 类构成,同时提供了Python、Ruby、MATLAB等语言的接口,实现了图像处理和计算... ......
OpenCV 源码 Windows CUDA

CUDA原子操作

这节主要涉及到一个多线程情况下存在的数据竞争问题 -- 多个线程同时访问共享数据时,由于没有正确的同步机制,导致数据出现不一致的情况。 C/C++ 多线程中,可以通过互斥锁(mutex)、原子操作(atomic,C++11 也提供了原子操作库,如std::atomic,用于实现原子加法、原子赋值等操 ......
原子 CUDA

Unity3D 中正确调用CUDA程序详解

Unity3D 是一款强大的游戏开发引擎,可以实现各种各样的游戏效果。然而,在某些情况下,使用CPU来处理游戏中的复杂计算任务可能会导致性能瓶颈。为了解决这个问题,我们可以利用CUDA来使用GPU进行并行计算,从而提高游戏的性能。 对啦!这里有个游戏开发交流小组里面聚集了一帮热爱学习游戏的零基础小白 ......
Unity3D 程序 Unity3 Unity CUDA

ubuntu22.04 install cuda cudnn

https://blog.csdn.net/qq_49323609/article/details/130310522 is very good 1,first check driver nvidia-smi if no content ,show install driver first two ......
install ubuntu 22.04 cudnn cuda

winget install cuda (Nvidia.CUDA)

PS C:\Users\Administrator> winget search cuda 名称 ID 版本 匹配 源 CudaLaunch 9NBLGGH40FCJ Unknown msstore MCX Studio coti.mcxstudio v2023 Tag: cuda winget N ......
install winget Nvidia cuda CUDA

MLX vs MPS vs CUDA:苹果新机器学习框架的基准测试

如果你是一个Mac用户和一个深度学习爱好者,你可能希望在某些时候Mac可以处理一些重型模型。苹果刚刚发布了MLX,一个在苹果芯片上高效运行机器学习模型的框架。 最近在PyTorch 1.12中引入MPS后端已经是一个大胆的步骤,但随着MLX的宣布,苹果还想在开源深度学习方面有更大的发展。 在本文中, ......
基准 框架 机器 苹果 CUDA

安装 deepspeed 报错 | 【CUDA_HOME does not exist, unable to compile CUDA op(s)】

原因是因为 deepspeed 需要安装 cuda toolkit (runtime cuda), 不能使用 torch 内置的 cuda toolkit。 安装完成之后使用 nvcc -V, 输出版本则证明安装cuda toolkit 成功。 参考:[https://github.com/micr ......
CUDA deepspeed CUDA_HOME compile unable

Linux CentOS安装CUDA

查看CUDA版本 nvidia-smi 一、卸载显卡驱动 sh cuda_11.3.1_465.19.01_linux.run --uninstall 二、下载显卡驱动 ⚠️注意:建议不提前安装显卡驱动,通过cuda统一进行安装,以防版本问题! 首先确定GPU服务器类型,驱动下载地址 三、下载CUD ......
CentOS Linux CUDA

一句话解决加载模型时的CUDA out of memory

在加载模型一行后加上max_memory即可,超出显存后会自动移到内存。 model = AutoModel.from_pretrained('your_model', trust_remote_code=True, max_memory={0: "6GiB", "cpu": "10GiB"}) 记 ......
模型 一句话 memory CUDA out

cuda编程的简单案例

一个简单的案例: header.h void addKernel(const int* a, const int* b, int* c, int size); test.cu #include "cuda_runtime.h" #include "device_launch_parameters.h ......
案例 cuda

windows安装tensorflow-gpu / CUDA / cuDNN

最终安装内容:windows10 + 3060显卡 + tensorflow-gpu 2.10.0 + CUDA 11.2 + cuDNN 8.1 1. 命令行输入nvidia-smi,查看显卡对应的cuda版本。如下图,CUDA Version为12.1,则安装的CUDA版本不能高于12.1。 2 ......
tensorflow-gpu tensorflow windows cuDNN CUDA

C++代码cuda版本的opencv实现图片BGR转RGB-HWC转CHW

前几天聊天的时候,有人疑问无法实现这种转换,因为原先实践过的缘故,就把解决方案写下 int Detect::dataProcess(unsigned char *img_ptr, int h, int w){ img = cv::Mat(h, w, CV_8UC3, img_ptr); cuda:: ......
RGB-HWC 版本 代码 opencv 图片

使用ubuntu根据cuda11.2安装pytorch

在使用镜像新建了一个cuda11.2-python3.9 容器配置环境的过程中需要安装PyTorch。一开始我直接使用 pip install torch 来进行安装,但是运行程序时出现报错: RuntimeError: The NVIDIA driver on your system is too ......
pytorch ubuntu cuda 11.2 11

Linux安装cuda环境

安装cuda驱动时 需要先卸载开源的cuda驱动 参看是否安装了开源驱动nouveau lsmod | grep nouveau 关闭 cat <<EOF | sudo tee /etc/modprobe.d/blacklist-nouveau.conf blacklist nouveau opti ......
环境 Linux cuda

写cuda程序bug调通以后记得不要用gdb编译代码!

一次并行与分布式计算的作业编写cuda程序使用 shared memory 进行优化,写出来的代码有错误,然后边开启了gdb调试,用 -G -g 选项编译。 结果后面使用 __shared__ 优化后跑出来竟然还没有不用跑出来快 急得我甚至都把PPT上的代码抄上去还是很寄 最后把 Makefile ......
代码 程序 cuda bug gdb

OpenCV4.1.0与CUDAcuda_10.1.105联合进行图像特征点提取和特征匹配时,运行程序时错误提示:无法定位程序输入点?createBFMatchercv@DescriptorMatcher@cuda@cv......于动态链接库......

问题描述: OpenCV4.1.0与CUDAcuda_10.1.105联合进行图像特征点提取和特征匹配时,运行程序时错误提示:无法定位程序输入点?createBFMatchercv@DescriptorMatcher@cuda@cv......于动态链接库......,如下图所示: 解决办法: 如果 ......

conda环境下Python报错:raise MissingCUDAException("CUDA_HOME does not exist, unable to compile CUDA op(s)") CUDA_HOME does not exist, unable to compile CUDA op(s)

conda环境下Python报错: (pytorch) devil@Monster:~$ pip install deepspeed Collecting deepspeed Using cached deepspeed-0.12.4.tar.gz (1.2 MB) Preparing metada ......
CUDA CUDA_HOME compile unable exist

Windows10 下 CUDA 新旧多版本共存

前言 为了运行一个 Tensorflow1.6.0 的项目,CPU 跑了三个多小时才完成一个 epoch,还得用 GPU。但这个版本的 TF 只能在 10 以下的 CUDA 平台,但是以前的 Pytorch 也要继续啊。所以需要在本地 Windows 下安装多个版本 CUDA,其实有两种方式让 CU ......
新旧 Windows 版本 CUDA 10

torch.cuda

什么时候需要将计算放置再gpt,cuda上 数据,模型放在cuda上计算之后,还用导回cpu吗 用法 torch.cuda.is_available() torch.cuda.device() ......
torch cuda

使用NVIDIA HPC SDK构建cuda-samples

NVIDIA HPC SDK虽然附带了CUDA、cuBLAS等库,但安装路径与CUDA Toolkit有差异。cuda-samples有些示例用到了cuBLAS等数学库,按照文档直接make会找不到库文件。 翻找示例的Makefile想找全局的设置,发现有行ALL_CCFLAGS += $(EXTR ......
cuda-samples samples NVIDIA cuda HPC
共263篇  :1/9页 首页上一页1下一页尾页