mperf

MegEngine 使用小技巧:用 mperf 进行安卓 opencl 算子的 roofline 分析

roofline 分析是一种简单评估当前计算任务对当前平台计算/访存能力的利用情况的方法,可以帮助分析算子的优化方向和优化潜力。 ......
算子 MegEngine roofline 技巧 opencl

借助 mperf 进行矩阵乘法极致优化

作者:旷视 MegEngine 架构师 洪超 前言 单精度矩阵乘法(SGEMM)是非常典型的计算密集型算子,对 SGEMM 的优化也经常被当作算子优化从业人员的练手项目。本文将借助于 mperf,在 ARM A55 cpu 核心上对 SGEMM 的性能进行极致优化,过程中会展示 mperf 辅助性能 ......
乘法 矩阵 极致 mperf
共2篇  :1/1页 首页上一页1下一页尾页