Peak、RMS、Threshold
Peak值指信号在时域中的瞬时最大幅值(正峰值或负峰值),计算方式为:
- 时域信号:直接取采样点绝对值的最大值(如正弦波峰值=幅值A)。
- 频域信号:通过FFT转换后,每根谱线的峰值仍保持时域幅值关系。
在波形图中,Peak值就是波形图的纵轴,表现为信号波形的最高点(正峰值)或最低点(负峰值)。
频谱分析仪通过峰值检波器检测信号中的最高电平:使用 Peak 直接显示当前频点的峰值电平。在音频处理中,当频谱分析仪的 Peak 值超过阈值时,触发压缩器或限制器的动态控制,阈值的计算通常基于以下方法:
- Max方法:直接取输入数据中的绝对值的最大值作为量化的最大值。这种方法简单易用,但容易受到噪声等异常数据的影响,导致动态范围不准确。
- Histogram方法:统计输入数据的直方图,根据先验知识获取某个范围内的数据,从而获得对称量化的最大值。这种方法可以减少噪声对动态范围的影响,但需要对直方图进行统计,计算复杂度较高。
- Entropy方法:将输入数据的概率密度函数近似为一个高斯分布,以最小化熵作为选择动态范围的准则。这种方法也可以在一定程度上减少噪声对动态范围的影响,但需要对概率密度函数进行拟合和计算熵,计算复杂度较高。


True Peak
- True Peak:数字音频中通过插值计算出的实际最大瞬时电平,包含采样点间可能存在的过冲值,用于防止数字削波。在原始采样点间插入新点(如4倍过采样),通过插值(如sinc函数)生成更密集的波形数据,以捕捉可能存在的采样间峰值。遍历插值后的数据,记录所有点的绝对最大值,即 True Peak 值。插值阶数越高(如8倍),越能逼近真实峰值,但计算量增大。实际工程中常采用 4 倍插值平衡精度与效率。
- 波形图纵轴振幅:直接显示时域信号的瞬时电压值,通常为采样点幅值的绝对值。波形图纵轴用于直观观察信号幅度,而 True Peak 用于确保数字音频在数模转换时不超过 0dBFS。
- 对于理想正弦波,True Peak 值等于波形图纵轴振幅的 1.414 倍(即√2倍)。
- 实际音频中,True Peak 可能因插值计算略高于波形图显示的峰值,尤其在陡峭瞬态信号中差异更明显。波形图纵轴显示的瞬时电平值与 True Peak 的差值通常为3-6dB。
Threshold
音频插件 FabFilter Pro-DS 的 Threshold 参数,基于选定频率的 Peak 值(也检测 True Peak 值,避免削波失真),而非全频段。其侧链检测会通过滤波(如高频/低频切除)聚焦特定频段,仅当该频段信号超过设定阈值时触发处理。例如,在"Single Vocal"模式下,算法会优先分析人声齿音频段(通常为 5-8kHz)的峰值电平。
在实际应用中,阈值(Threshold)的设定需要根据具体场景和需求进行调整。例如,在音频压缩技术中,动态范围的计算方法(如Max、Histogram或Entropy方法)会影响阈值的设定。此外,动态范围的定义和测量方法(如噪声系数和1B压缩点)也是阈值计算的重要参考。
| 参数类型 | 典型值范围 | 作用原理 | 人声处理应用场景 |
|---|---|---|---|
| Peak值 | -1dBFS至0dBFS | 号瞬时最大电平,超过0dBFS会导致削波失真 | 限制器设置需低于-1dBFS(如-0.3dBFS)预留动态处理空间 |
| Threshold | -40dB至-5dB | 触发压缩/限制的临界电平,低于此值信号不受影响 | 人声压缩常用-20dB至-10dB,根据动态范围调整 |
| 压缩比 | 2:1至10:1 | 决定超过Threshold部分的压缩强度(如4:1表示输入4dB输出1dB) | 人声动态控制常用3:1至5:1,过大会导致不自然 |
| Attack/Release | 1ms-100ms/10ms-500ms | 控制压缩响应速度,短Attack增强音头,长Release保持自然衰减 | 人声压缩Attack建议5-20ms,Release根据音节长度调整(如200ms) |
RMS
RMS,均方根(Root Mean Square, RMS)是衡量音频信号强度的标准方法,RMS 值反映信号的有效能量,音频处理中通过 RMS 值衡量音量大小。其计算步骤如下:
- 平方:对每个采样点的幅值取平方。
- 平均:计算所有平方值的平均值。
- 开方:对平均值取平方根,得到 RMS 值。
均方根(RMS)与波形图纵轴振幅的关系可通过以下公式表示:RMS =峰值× 0.707(正弦波),即纵轴峰值振幅的 70.7%。

