NVIDIA Performance Primitives (NPP)

发布时间 2023-06-13 10:51:12作者: stardsd

NVIDIA Performance Primitives

GPU 上的图像和信号处理

 

NVIDIA Performance Primitives (NPP) 库提供 GPU 加速的图像、视频和信号处理函数,其执行速度比仅使用 CPU 的实现快 30 倍。借助超过 5,000 个用于图像和信号处理的基元,您可以轻松执行颜色转换、图像压缩、过滤、阈值处理和图像处理等任务。


使用 NPP 库,在计算机视觉、工业检测、机器人技术、医学成像、电信、深度学习和高性能计算等一系列领域从事图像处理和信号处理的工程师、科学家和研究人员可以快速提出通过简单的函数调用需要高性能低级图像或信号处理功能的应用程序。



欧氏距离传输 (EDT)

NPP 示例:欧氏距离变换 (EDT)

Euclidean Distance Transform

 

任何规模的性能

NPP 库优化可用计算资源的使用,使您的应用程序在数据中心、工作站和嵌入式平台上实现最佳性能。

简单设置

即用型、特定领域、高性能原语具有一组丰富的功能,支持多种图像格式。直接替换英特尔集成性能基元 (IPP) CPU 库。

专为灵活性而设计

用作独立库可在数小时内将 GPU 加速添加到您的应用程序,或用作协作库以与您现有的 GPU 代码高效地进行互操作。包括低级原语和高级功能。


比较性能

图片替代文字
测试设置IPP 2018 在 Intel Xeon Gold 6240@2GHz 3.9GHz Turbo (Cascade Lake) 服务器上运行,HT 开启;Ubuntu18.04操作系统GPU — Tesla T4(TU104) 1*16097 MiB 1*40 SM特斯拉 V100-SXM2-32GB(GV100) 1*32510 MiB 1*80 SMA100-SXM4-40GB(GA100) 1*40557 内存卡 1*108 单卡CUDA 驱动程序 — 445.33 (r445_00),CUDA 工具包 11.0加速表示所有例程的平均带宽增加

主要特征

  • 接受原始未压缩图像或信号数据
  • 支持多种RGB和YUV图像和视频格式
  • 使用 ColorTwist 函数在派生色彩空间中工作,包括 YCoCg (H.265) 和 PCA
  • 处理高保真 10 位或 12 位 HDR 视频(即冷却传感器天​​文摄影)
  • 避免边界效应;对宽度、高度对感兴趣区域 (ROI) 进行操作
  • 阿尔法通道支持
  • 单通道、三通道 (RGB) 或四通道(RGBA 图像格式
  • 支持8u、16s/16u、32f图像位深

 

Download Installer for Linux Ubuntu 22.04 x86_64

The base installer is available for download below.

Base Installer  
Installation Instructions:
wget https://developer.download.nvidia.com/compute/cuda/12.1.1/local_installers/cuda_12.1.1_530.30.02_linux.runsudo sh cuda_12.1.1_530.30.02_linux.run