语音基本概念和参数

发布时间 2023-04-13 15:57:01作者: 小超不挑食

声压与压强

1、声压

声压是定量描述声波的最基本的物理量,它是由于声扰动产生的逾量压强,是空间位置和时间的函数。由于声压的测量比较易于实现,而且通过声压的测量也可以间接求得质点振速等其它声学参量,因此,声压已经成为人们最为普遍采用的定量描述声波性质的物理量。

2、有效声压

通常讲的声压指的是有效声压,即在一定时间间隔内将瞬时声压对时间求方均根值所得。设语音长度为 \(T\) ,离散点数为 \(N\),则有效声压的计算公式为

\[p_e = \sqrt{\frac{1}{T}\sum_{n=1}^{N} x^2 \triangle t} = \sqrt{\frac{1}{N \triangle t} \sum_{n=1}^{N} x^2 \triangle t} = \sqrt{\frac{1}{N}\sum_{n=1}^{N} x^2} \]

式中,\(x\)表示语音信号的采样点。只要保证所取的点数\(N\)足够大,即可保证计算准确性。

3、声压级(Sound Pressure Level, SPL)

  • 声音的有效声压与基准声压之比,取以 10 为底的对数,再乘以 20,即为声压级,通常以符号 \(L_p\) 表示,单位为 dB。

\[L_p = 20\lg{\frac{p_e}{p_{ref}}} \]

式中,\(p_e\)为待测声压的有效值;\(p_{ref}\)为参考声压,在空气中参考声压一般取 \(2 \times 10^{-5} Pa\)

4、声强

在物理学中,声波在单位时间内作用在其传递方向垂直的单位面积上的能量称为声强。

5、声强级(Intensity Level, IL)

用声强的物理学单位表示声音强弱很不方便。当人耳听到两个强度不同的声音时,感觉的大小大致上与两个声强比值的对数成比例。因此,用对数尺度来表示声音强度的等级,其单位为分贝(dB).

\[L_I = 10\lg{\frac{I}{I_0}} \]

在声学中使用 \(1 \times 10^{-12} W/m^2\) 作为参考声强(\(I_0\)

6、声压与声强的关系

对于球面波和平面波,声压与声强的关系是

\[I = \frac{p^2}{\rho *c} \]

式子中,\(\rho\) 为空气密度;\(c\)为声速。在标准大气压和\(20\)摄氏度的环境下,\(\rho * c = 408\)。该数值为国际单位值,也叫瑞利,成为空气对声波的特性阻抗。

响度

响度描述的是声音的响亮程度,表示人耳对声音的主观感受,其计量单位是宋。定义为声压级为40dB的1kHz纯音的响度为1宋。人耳对声音的感觉,不仅和声压有关,还和频率有关。声压级相同,频率不同的声音,听起来的响亮程度也不同。如空压机与电锯,同是100dB声压级的噪声,听起来电锯声要响的多。

按人耳对声音的感觉特性,依据声压和频率定出人对声音的主观音响感觉量,称为响度级,单位为方,符号为\(phon\)。根据国际协议规定,0dB声强级的1000Hz纯音的响度级定义为0phon。其他频率声音的声强级与响度级的对应关系,要从等响曲线才能查出。

频率与音高

以Hz为单位所测得的物理量——频率,在听者来说感知为心理量——音高,即用人的主观感觉来评价所听到的声音是高调还是低调。音高随着频率的增加而提高。

美(Mel):美是心理声学测量音高的单位。1000美是 1000Hz纯音40dB SPL(声压级)时的音高。音调高的声波具有高美值,音调低的声波美值就低。例如:将 1000Hz 纯音频率翻番至 2000Hz,其 40dB 声音的音高从 1000mel 变成 1500mel,而不是2000mel。如果要达到2000mel,频率需要达到3000Hz。

参考

《语音信号处理 第三版》,赵立