特征量化编码入门指南

发布时间 2024-01-05 20:39:12作者: stardsd

 

 

 

量化编码

目的:压缩特征,节省存储空间

  • 向量(高维浮点)—-->码字的ID(一个整数)
  • 通常放在索引项中

量化方法

  • 向量量化VQ:k-means
  • 迪卡尔积型(码字空间)
    • >积量化(PQ)/OPQ/LOPQ
  • 直和型:残差向量量化:RVQ
  • 线性组合型:加性量化(AQ)、组合量化(CQ)

量化器目标:使均方误差(MSE)最小化

关于矢量量化(VQ):

矢量量化(VQ)是语音编码和图像编码节省带宽和存储的非常有效的方法。传统的矢量量化方法根据其码本生成过程主要可分为树形VQ、直和VQ、笛卡尔积VQ、格VQ、分类VQ、反馈VQ和模糊VQ七种类型。在过去的十年中,基于量化的近似最近邻(ANN)搜索发展非常迅速,并且出现了许多用于在大规模数据集的内存中搜索具有二进制代码的图像的方法。它们最令人印象深刻的特点是使用多个密码本。这就导致了两种码本的出现:线性组合码本和联合码本。这可能是未来的一个趋势。然而,这些方法只是在 ANN 搜索的速度、准确性和内存消耗之间寻找平衡,有时这三者之一会受到影响。因此,寻找一种能够在速度和精度之间取得平衡并且占用内存大小适中的矢量量化方法仍然是一个需要研究的问题。

 

迪卡尔积型(码字空间):积量化(Product Quantizer,PQ)

• 分段量化,每段一个VQ量化器

• 量化结果=各子量化结果的串连

• 码字空间=各子码书空间的直积

• 效果

      以较小的空间开销得到了较大的码字空间

 

 

直和型:残差向量量化(RVQ)

  • 多层级联量化
  • 后层以前层的残差作为输入
  • 量化结果=各层量化结果之和
  • 码字空间=各层码书空间的直和
  • 层数越多,量化误差越小

 

线性组合型:AQ

• 具有多个码书

• 量化结果=各码书量化结果之和

• 码字空间=各子码书空间的直和

 

 

 

 

相关网站:

(1) TRECVID:

http://trecvid.nist.gov

, Digital Video Retrieval at NIST

(2) Video Olympics:

http://www.videolympics.org/

(3) Video Collection:

http://www.open-video.org

(4) Leonardo’ s Project:

http://www.chiariglione.org

(5) MPEG:

http://www.mpeg.org

(6) Information Organization & Retrieval:

http://www2.sims.berkeley.edu/courses/is202/f01/index.html

(7) Movie Tools:

http://www.ricoh.co.jp/src/multimedia/MovieTool/index.html

(8) vdbms Project:

http://www.cs.purdue.edu/vdbms/

(9) DirectShow:

http://www.codeproject.com/KB/directx/directshownet.aspx