cuda toolkit简介cudnn

JuiceFS 简介

JuiceFS 简介 JuiceFS 是一款面向云原生设计的高性能分布式文件系统,在 Apache 2.0 开源协议下发布。提供完备的 POSIX 兼容性,可将几乎所有对象存储接入本地作为海量本地磁盘使用,亦可同时在跨平台、跨地区的不同主机上挂载读写。 JuiceFS 采用「数据」与「元数据」分离存 ......
JuiceFS 简介

Linux (Ubuntu)安装 cuda 11.7

使用的Linux系统为 Ubuntu 18.04,显卡为GeForce RTX 3060 ,驱动版本号为515.57,安装CUDA 11.7。 第一步:查看显卡是否正常,显示如下则表示没有问题。(版本要对应正确) 命令: lspci|grep NVIDIA 第二步:选择下载对应的CUDA包,官网地址 ......
Ubuntu Linux 11.7 cuda 11

GPU 虚拟化技术MIG简介和安装使用教程

使用多实例GPU (MIG/Multi-Instance GPU)可以将强大的显卡分成更小的部分,每个部分都有自己的工作,这样单张显卡可以同时运行不同的任务。本文将对其进行简单介绍并且提供安装和使用的示例。 什么是MIG NVIDIA Multi-Instance GPU (MIG) 技术是 NVI ......
简介 教程 技术 GPU MIG

Composite 组合模式简介与 C# 示例【结构型3】【设计模式来了_8】

〇、简介 1、什么是组合设计模式? 一句话解释: 针对树形结构的任意节点,都实现了同一接口,他们具有相同的操作,可以通过某一操作来遍历全部节点。 组合模式通过使用树形结构来组合对象,用来表示部分以及整体层次。组合模式属于结构型模式,多用于递归。 官方意图描述:将对象组合成树形结构,以表示“部分-整体 ......

UML简介6活动(Activity)图

6 活动图 活动图侧重于将程序处理建模为系统。它规定了实现活动所需的各个步骤--操作--之间的控制流和数据流。 在UML2中,活动图使用面向流程的语言概念,这些概念起源于定义业务流程的语言。 活动图也基于用于描述并发通信过程的既定概念,如Petri网的标记概念。活动图的特点是既支持面向对象系统建模, ......
Activity 简介 UML

深度学习(cudnn加速)

cudnn为网络每一卷积层选最优实现方法,加速网络训练。 设置如下: torch.backends.cudnn.benchmark = True 加速条件如下: 1. 输入数据在训练过程中一般不变化。 2. 数据量较大,并可以同时加载到GPU内存中。 3. 训练次数比较多。 ......
深度 cudnn

CUDA/cudnn/CUDA Toolkit/NVCC区别简介

CUDA:为“GPU通用计算”构建的运算平台。 cudnn:为深度学习计算设计的软件库。 CUDA Toolkit (nvidia): CUDA完整的工具安装包,其中提供了 Nvidia 驱动程序、开发 CUDA 程序相关的开发工具包等可供安装的选项。包括 CUDA 程序的编译器、IDE、调试器等, ......
CUDA Toolkit 简介 cudnn NVCC

UnknownError: Failed to get convolution algorithm. This is probably because cuDNN failed to initialize

/home/software/anaconda3/envs/mydlenv/lib/python3.8/site-packages/tensorflow/python/client/session.py:1751: UserWarning: An interactive session is alr ......

cuda 多版本切换

https://developer.nvidia.com/rdp/cudnn-download cuda 多版本切换在安装了多个版本的cuda之后可以在​​/usr/local​​下看到已安装的多个版本,如:​​cuda-8.0​​ ​​cuda-10.0​​等。还会看到一个名为​​cuda​​的文 ......
版本 cuda

查看 CUDA 版本 正确方法(亲测有效)

一、正确方法:打开cmd,输入 nvcc --version 二、错误方法: 1.cmd输入,以下 nvidia-smi 这个方法不对,这里的11.2 指的是可驱动的最高版本。下载CUDA的版本应低于11.2。 https://blog.csdn.net/baidu_30506559/article ......
版本 方法 CUDA

搭建Pytorch2.1+CUDA12.1+Anaconda+Pycharm深度学习环境

环境: Win11 22H2 需要的安装包: Anaconda3-2021.05-Windows-x86_64.exe Python 3.11. pycharm-professional-2021.2.1.exe CUDA12.1与CUDNN V8.9.5 pytorch 2.1 选择性安装Open ......
深度 Pytorch2 Anaconda Pytorch Pycharm

深度学习(判断cuda是否可用)

安装完pytorch、cuda和cudnn之后,可以先判断是否可用。 import torch print('CUDA版本:',torch.version.cuda) print('Pytorch版本:',torch.__version__) print('显卡是否可用:','可用' if(torc ......
深度 cuda

反射简介(Reflecyion)

反射: 优点:可以实现动态创建对象和编译,灵活性好 缺点:对性能有影响,反射基本是一个解释操作,我们可以告诉JVM,我们希望做什么并且它满足我们的需求,这些操作总是会慢于直接执行相同的操作。 反射主要的API:Class ......
Reflecyion 简介

注解(Annotation)简介,内置注解,元注解,自定义注解

注解:不是程序本身,可以对程序做出解释(这一点和注释没什么区别) 可以被其他程序(比如编译器)读取 @Functional(这是L)(这是I)Interface 函数式接口 内置注解:java本来就有的注解 @Override 重写 @Deprecated 已废弃,不推荐使用的意思 @Suppres ......
注解 Annotation 简介

Redis简介

Redis简介 Redis是什么 Rdeis是一种基于键值对(key-value)的NoSQL数据库 ps:NoSQL数据库一般泛指非关系型数据库,它的出现是为了解决大规模数据集合以及多种数据类型带来的问题。通常没有统一的架构,不同的NoSQL数据库各有所长。 Redis的特点 速度极快 ·Redi ......
简介 Redis

Bridge 桥接模式简介与 C# 示例【结构型2】【设计模式来了_7】

〇、简介 1、什么是桥接模式? 一句话解释: 通过一个类的抽象,与另一个类的抽象关联起来,当做桥。此后不管两个抽象类的实现有多少种,均可以通过这个桥来将两个对象联系起来。 桥接,顾名思义就是用桥来连接河两岸,将原本不关联的两部分联系起来,且不影响两岸的各自演化,演化出来的不同对象仍可以通过这个桥连接 ......
结构型 模式 设计模式 示例 结构

JQuery基础系统一:简介

jQuery API 中文文档: https://www.jquery123.com/ jQuery Mobile 菜鸟教程: http://www.runoob.com/jquerymobile/jquerymobile-tutorial.html 更多内容参考Github: https://gi ......
基础 简介 JQuery 系统

UML简介1介绍

1 介绍 1.1 UML的历史 面向对象起源于20世纪60年代初的工作。最初的想法是在Sketchpad等系统中实现的,它提供了一种新的、人与计算机之间的图形通信方法。 编程语言SIMULA被认为是第一种面向对象的编程语言。SIMULA主要用于开发仿真软件,并没有得到特别广泛的应用。它已经包含了类、 ......
简介 UML

CUDA C编程权威指南:2.2-给核函数计时

本文主要通过例子介绍了如何给核函数计时的思路和实现。实现例子代码参考文献[7],只需要把相应章节对应的CMakeLists.txt文件拷贝到CMake项目根目录下面即可运行。 1.用CPU计时器计时(sumArraysOnGPU-timer.cu)[7] 在主函数中用CPU计时器测试向量加法的核函数 ......
函数 权威 指南 CUDA 2.2

Redison简介

Redison是一个基于Java的开源分布式缓存系统,它提供了多种数据结构和算法,如分布式锁、分布式Map、分布式Set、分布式List等,可以用于构建高性能、高可用性的分布式应用。Redison的主要特点包括: 支持多种数据结构和算法:Redison支持多种数据结构和算法,包括分布式锁、分布式Ma ......
Redison 简介

ControlNet-trt优化总结3:使用multi-stream和cuda-graph构建并行流水线

ControlNet-trt优化总结3:使用multi-stream和cuda-graph构建并行流水线 上节谈到使用TRT-API来构建网络,在这一节中总结一些trick来提升模型的运行效率,这些trick在所有的trt优化中均可使用,主要有以下几点: 使用cuda_graph减少kernel间的 ......

apisix简介

一、简介 国产云原生微服务API网关。 Apache APISIX是一个动态、实时、高性能的API网关,提供丰富的流量管理特性,例如负载均衡、动态上游、灰度发布、服务熔断、身份认证、可观测性等。既可以处理传统的南北向流量,也可以处理服务间的东西向流量。支持多种环境部署,并提供大量插件实现不同业务场景 ......
简介 apisix

匈牙利算法简介与应用

一、分配问题应用案例: 1、男女相亲场景,10男10女为例,可让每人对每个异性进行意向度排序,若是男性优先则可以用男性意向度评分矩阵,女性优先同理,或者使用男女意向评分平均值作为意向度居正,然后用匈牙利算法求最大值,即可获得综合意向度得分最高的分配方法2、电销和催收用户分配场景,不同电销人员对不同类 ......
算法 简介

CUDA C编程权威指南:2.1-CUDA编程模型

本文主要通过例子介绍了CUDA异构编程模型,需要说明的是Grid、Block和Thread都是逻辑结构,不是物理结构。实现例子代码参考文献[2],只需要把相应章节对应的CMakeLists.txt文件拷贝到CMake项目根目录下面即可运行。 1.Grid、Block和Thread间的关系 GPU中最 ......
CUDA 模型 权威 指南 2.1

CUDA_ERROR_OUT_OF_MEMORY: out of memory

2023-02-04 22:17:02.457962: I tensorflow/stream_executor/cuda/cuda_driver.cc:831] failed to allocate 152.00M (159383552 bytes) from device: CUDA_ERROR ......

Cpp 惯用法 CRTP 简介

From Wikipedia, The curiously recurring template pattern (CRTP) is an idiom, originally in C++, in which a class X derives from a class template insta ......
简介 CRTP Cpp

每日一库:cobra 简介

当你需要为你的 Go 项目创建一个强大的命令行工具时,你可能会遇到许多挑战,比如如何定义命令、标志和参数,如何生成详细的帮助文档,如何支持子命令等等。为了解决这些问题,github.com/spf13/cobra 就可以派上用场。 github.com/spf13/cobra 是一个用于构建强大的命 ......
简介 cobra

yaml简介

1.特点 它是一种非常简单的基于文本的人类可读的语言,用于在人和计算机之间交换数据 它的缩进就像 Python 的缩进一样优雅 它不是一种编程语言,主要用于存储配置信息 它减少了JSON和XML文件中的大部分“噪音”格式,例如引号、方括号和大括号 YAML数据在编程语言之间是可移植的 YAML具有一 ......
简介 yaml

AJAX简介

1.AJAX五大特点 1.无需刷新页面就可改变页面内容,减少用户等待时间(最大特点)。 2.改善表单验证万式,不再需要打开新页面,也不再需要将整个页面数据提交。 3.按需获取数据,每次只从服务器端获取需要的数据。 4.读取外部数据,进行数据处理整合。 5.异步与服务器进行交互,在交互过程中用户无需等 ......
简介 AJAX

C++ QT 简介

介绍 安装社区版本,多种下载方式 https://www.qt.io/ https://download.qt.io/ 常用的快捷键 使用Clion 开发QT https://zhuanlan.zhihu.com/p/461896034 信号槽 信号槽是 Qt 框架引以为豪的机制之一。熟练使用和理解 ......
简介 QT