TensorIR

TensorIR: An Abstraction for Automatic Tensorized Program Optimization

Abstract 在多种多样的设备上部署深度学习模型是一个重要的话题,专用硬件的蓬勃发展引入了一系列加速原语和多维张量计算方法。这些新的加速原语和不断出现的新的机器学习模型,带来了工程上的巨大挑战。本文提出了TensorIR,是为了优化这些有张量计算原语的张量化程序而设计的编译器抽象。TensorI ......

机器学习编译(三):张量程序案例 TensorIR

**使用张量程序抽象的目的是为了表示循环和相关的硬件加速选择,如多线程、特殊硬件指令的使用和内存访问。** # 1. 一个例子 使用张量程序抽象,我们可以在较高层的抽象制定一些与特定硬件无关的较通用的 IR 优化(计算优化)。 比如, 对于两个大小为 128×128 的矩阵 A 和 B,我们进行如下 ......
张量 TensorIR 机器 案例 程序
共2篇  :1/1页 首页上一页1下一页尾页