heterogeneous computing parallel cuda

nvcc fatal : Unsupported gpu architecture 'compute_80' ninja: build stopped: subcommand failed.

问题描述 3090显卡，运行示例代码报错。解决方法 export PATH="$PATH:/usr/local/cuda/bin/nvcc" ......

architecture Unsupported subcommand compute stopped更新时间 2023-03-30

cuda多版本共存

torch 一会要这个版本，一会要那个版本，还要和cuda对应上。避免不了要下载多个cuda 参考文档：https://blog.csdn.net/ytusdc/article/details/85173258 1. 下载cuda 2. 安装（失败，runfile）一直按回车说什么未知原因 3. ......

版本 cuda更新时间 2023-03-29

禁用computed的更新

如标题所示，这种要求可能有点变态，但是在开发中碰到了，如果antdesign的form表单配置在computed,且 computed中存在其他定义在data或props中的响应式数，将导致form重载，重载行为例如：我现在碰到的，table的重载，那么是否存在一种方法能够阻止computed的重新 ......

computed更新时间 2023-03-29

小白也能搞定！Windows10上CUDA9.0+CUDNN7.0.5的完美安装教程

前言：为什么要在本地电脑安装 CUDA，CUDA 是什么的，用来做什么？我想，点击标题进来的小伙伴，应该都清楚这些。不管你是用来做什么，或者跟我一样为了跑 Tensorflow 的 Object Detection (目标检测)。但是我为什么要用 CUDA9，这里版本要特别注意。因为我使用的是 ......

Windows 教程 CUDNN7 CUDA9 CUDNN更新时间 2023-03-29

使用cuda常量内存进行性能优化

常量内存是在变量前面加上 __constant__，常量内存用于保存核函数执行期间不会发生变化的数据，NVIDIA想硬件提供了 64KB 的常量内存，在通常情况下，使用常量内存代替全局内存能有效的缩减内存带宽常量内存的赋值使用 cudaMemcpyToSymbol() 函数示例代码中我创建了一个 ......

常量内存性能 cuda更新时间 2023-03-28

Linux安装cuda,cudann,tensorRT

cuda官网链接 https://developer.nvidia.com/cuda-toolkit-archive 别人的链接链接 https://zhuanlan.zhihu.com/p/72298520 配置环境变量 export LD_LIBRARY_PATH=$LD_LIBRARY_PAT ......

tensorRT cudann Linux cuda更新时间 2023-03-28

Vue中watch和computed的区别和应用场景

watch中的函数是不需要调用的，computed内部的函数调用的时候不需要加()。Watch是属性监听，监听属性的变化；computed是计算属性，通过属性计算而得来的属性。watch需要在数据变化时执行异步或开销较大的操作时使用。computed 属性的结果会被缓存，除非依赖的响应式属性变化才会 ......

computed 场景 watch Vue更新时间 2023-03-28

pytorch cuda gpu版本与detectron2、jupyter notebook安装

任意版本的pytorch、cuda的gpu版本与detectron2、jupyter notebook安装 1. 简介本文主要介绍pytorch cuda gpu版本与detectron2、jupyter notebook安装, 主要是基于docker构建AI开发/预测用的环境. 优势与不足优势 ......

detectron2 detectron notebook pytorch jupyter更新时间 2023-03-27

使用computed需要遵循和避免的几点原则

遵循的原则简单明了 computed不应该过于复杂或过长，而应该是简单清晰的。它应该只负责对单个变量或getter进行处理，并且最终返回一个通常与vue模板直接关联的值。可重复利用由于computed的特殊设计方式，它们可以被许多其他computed、watch甚至方法调用，因此在设计时要尽可 ......

computed 原则更新时间 2023-03-27

显卡驱动+cuda+cudnn+深度学习框架

安装概览安装显卡驱动、CUDA 和 cuDNN 可能因操作系统和 GPU 型号而异，下面是一般的步骤：下载和安装适合你 GPU 型号的显卡驱动，可以从官方网站或者 GPU 制造商的网站下载。下载和安装适合你 CUDA 版本的 CUDA 工具包，可以从官方网站下载。下载和安装适合你 CUDA ......

显卡驱动显卡框架深度 cudnn更新时间 2023-03-23

【CF1515E Phoenix and Computers】（插入法dp）

原题链接题意给定 $n$，$M$。你有 $n$ 台电脑排成一排，你需要依次开启所有电脑。你可以手动开启一台电脑。在任意时刻，若电脑 $i-1$ 与电脑 $i+1$ 都已经开启 $(1<i<n)$，电脑 $i$ 将立刻被自动开启。你不能再开启已经开启的电脑。求你有多少种开启电脑的方案。两个方案 ......

Computers Phoenix 1515E 1515 and更新时间 2023-03-23

win11+CUDA-11.7.1+cudnn-8.8.0

CUDA安装+vsstdio2022配置先进行CUDA-11.7.1安装 https://developer.nvidia.com/cuda-11-7-1-download-archive 在NVIDIA-CUDA下载地址下载win.exe安装包完成后，进行安装(注意：需要记住自定义安装目录，后 ......

cudnn 11 CUDA win更新时间 2023-03-22

cuda、cudnn、zlib 深度学习必配三件套（Windows）

无论用tensorrt，还是onnxruntime部署。这三个都得下载配置，推荐都放到相应的cuda路径里（含dll的文件夹、含lib的文件夹）。推荐先下载tensorrt或者onnxruntime，这样可以知道所需的cuda、cudnn版本。 1、cuda（以11.8为例）下载地址：CUDA ......

件套深度 Windows cudnn cuda更新时间 2023-03-22

Red Hat CUDA安装

参考： https://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html ......

CUDA Red Hat更新时间 2023-03-22

一统天下 flutter - dart: 多线程异步编程（isolate/compute）

一统天下 flutter https://github.com/webabcd/flutter_demo 作者 webabcd 一统天下 flutter - dart: 多线程异步编程（isolate/compute）示例如下: lib\dart\isolate.dart /* * dart 多线 ......

一统天下线程 flutter compute isolate更新时间 2023-03-22

CUDA中的pagelocked memory

背景：在异步传输内存中，需要在HOST 端分配 pagelocked memory ，达到的效果一 CPU不会将该内存分配到低速的虚拟内存当中，是提高传输速率，二是异步传输需要Host端始终将该内存放在物理端，可以理解为内存地址双方约定俗成，不会再变了。自己遇到的问题： cudaHostAl ......

pagelocked memory CUDA更新时间 2023-03-22

论文阅读笔记：Parallel Iterative Solvers for Real-time Elastic Deformations (迭代法求解方程组 / 弹性形变仿真)

材料来源于 Siggraph Asia 2018 的 course note Parallel iterative solvers for real-time elastic deformations, SIGGRAPH Asia 2018 Courses, 2018. 0. 概述在形变仿真中，许 ......

迭代法形变方程组方程 Deformations更新时间 2023-03-22

论文翻译：2023_THLNet: two-stage heterogeneous lightweight network for monaural speech enhancement

论文地址：THLNet: 用于单耳语音增强的两级异构轻量级网络代码：https://github.com/dangf15/THLNet 引用格式：Dang F, Hu Q, Zhang P. THLNet: two-stage heterogeneous lightweight network f ......

论文翻译 heterogeneous enhancement lightweight two-stage更新时间 2023-03-22

闻其声而知雅意,基于Pytorch(mps/cpu/cuda)的人工智能AI本地语音识别库Whisper(Python3.10)

前文回溯，之前一篇：含辞未吐,声若幽兰,史上最强免费人工智能AI语音合成TTS服务微软Azure(Python3.10接入)，利用AI技术将文本合成语音，现在反过来，利用开源库Whisper再将语音转回文字，所谓闻其声而知雅意。 Whisper 是一个开源的语音识别库，它是由Facebook AI ......

雅意人工智能人工语音 Pytorch更新时间 2023-03-22

OpenMP Parallel Construct 实现原理与源码分析

在本篇文章当中我们将主要分析 OpenMP 当中的 parallel construct 具体时如何实现的，以及这个 construct 调用了哪些运行时库函数，并且详细分析这期间的参数传递！ ......

Construct 源码 Parallel 原理 OpenMP更新时间 2023-03-22

windows上用vs2017静态编译onnxruntime-gpu CUDA cuDNN TensorRT的坎坷之路

因为工作业务需求的关系，需编译onnxruntime引入项目中使用，主项目exe是使用的vs2017+qt5.12。 onnxruntime就不用介绍是啥了撒，在优化和加速AI机器学习推理和训练这块赫赫有名就是了。有现成的别人编译好的只有dll动态库，当然我们显然是不可能使用的，因为BOSS首先就 ......

onnxruntime-gpu 静态 onnxruntime TensorRT windows更新时间 2023-03-22

共471篇 :16/16页 首页上一页13141516下一页尾页