Tensor

Nvidia Tensor Core-MMA PTX编程入门

1 PTX (Parallel Thread Execution) PTX是什么，Nvidia官方描述为a low-level parallel thread execution virtual machine and instruction set architecture (ISA)，直面意思是 ......

Core-MMA Nvidia Tensor Core MMA更新时间 2023-04-14

Nvidia Tensor Core-WMMA API编程入门

1 WMMA (Warp-level Matrix Multiply Accumulate) API 对于计算能力在7.0及以上的CUDA设备，可以使用CUDA C++ API调用Tensor Core，支持形如D = AB + C的混合精度的矩阵乘运算。 template<typename Use ......

Core-WMMA Nvidia Tensor Core WMMA更新时间 2023-04-12

Nvidia Tensor Core初探

1 背景在基于深度学习卷积网络的图像处理领域，作为计算密集型的卷积算子一直都是工程优化的重点，而卷积计算一般转化为矩阵乘运算，所以优化矩阵乘运算自然成为深度学习框架最为关心的优化方向之一。鉴于此，Nvidia官方给出了一套硬件解决方案，即Tensor Core，可加速矩阵乘运算，实现混合精度计算， ......

Nvidia Tensor Core更新时间 2023-04-07

Tensor最大值最小值

1. Tensor矩阵的最大值与最小值 max_data = data.max() min_data = data.min() 注意：不要使用min(data)与max(data)，都是错误的。 2. Tensor两个值比较大小 max_data = max(data1, data2) min_da ......

最大值 Tensor更新时间 2023-03-22

Pytorch基础-tensor数据结构

torch.Tensor 是一种包含单一数据类型元素的多维矩阵，类似于 numpy 的 array。 Tensor 可以使用 torch.tensor() 转换 Python 的 list 或序列数据生成，生成的是dtype 默认是 torch.FloatTensor。 ......

数据结构 Pytorch 结构基础数据更新时间 2023-03-22