iZotope 插件2
- iZotope RX:音频修复插件。
RX
iZotope RX:是一款功能强大的音频处理软件,广泛应用于音频录制、混音、广播、声音设计和母带处理等领域。它结合了基于视觉的频谱编辑功能和专用工具,能够解决各种音频问题,如不需要的混响、点击声、削波、嗡嗡声和背景噪音等。
iZotope RX 去除咔哒声的插件:
Mouth De-click:去除嘴巴里产生的口水音、咔哒声、啪嗒声等。De-click:消除各种短脉冲噪声,例如由数字错误、嘴巴噪声和手机干扰引起的咔嗒声等。复杂算法可分析音频中振幅的不规则性,并进行平滑处理。De-crackle:去除爆裂声。比如老式的留声机、磁带、老式电影胶片中,那么短而急促并且连成片的噼啪声。音损明显,不适合全局使用,只适合针对个别地方使用。不适合全局使用,因为音损很严重。只适合,手工修音的时候,在局部使用。Interpolate:是手工修复单个的click。找到click所在的那一部分,进行修复。它是模仿周围的环境音,而将问题去除。
De-click
iZotope RX De-click,处理口水音咔哒声。全局参数设置:
- Sensitivity 灵敏度,默认值
3,超过4,高频亮丽会丢失。当达到7的时候,会严重变音。 - Frequency Skew 频率偏移。默认值
0,低于-3,会严重变音。 - Click widening 宽度,默认值
0。超过2,开始破裂感。
Mouth De-click
- 使用 iZotope RX
- Default:默认值。
- Eliminate Clicks-Low Latency:消除点击,低延迟模式。
- Eliminate clicks:消除点击。
- Reduce Smacks:消弱 Smacks,包括掌击声、劈啪声、咂嘴声和响吻声等。
- Transparent Removal:通明移除。
Mouth De-click预设:使用 iZotope RX Mouth De-click,处理口水音咔哒声。全局参数设置:
- Sensitivity 灵敏度,最大值
6。设置7,有些字会有明显音损,当达到8的时候,有些字会严重变音。 - Frequency Skew 频率偏移。默认
0,范围主要在 1K Hz以上。设置为负数,会损伤低频。若设置为-3,有些字低频会被伤,使语言听起来象感冒。若设置为-8,其范围是 200 Hz以上,若设置为-10,是全频段,有些字会音损严重,像重感冒。 - Click widening 宽度,默认值
0。超过2,开始有轻微破裂感。超过3,会变音。
De-crackle
iZotope RX De-crackle:去除爆裂声。
- Amplitude skew:振幅偏斜,选择信号电平振幅大小的主要区域。该参数的电平可调范围为-10.0至10.0,默认值为 0.0。
- 正向调节(正值):在高电平振幅信号区块范围内(高音量时间段),增强对微弱噼啪声的捕捉,适用于背景噪声较明显的场景。
- 负向调节(负值):在低电平振幅信号区块范围内(低音量时间段),增强突发性爆裂声的捕捉,适合处理咝音中突发性爆裂声。
- 中性状态(0.0):保持对所有电平信号的均衡处理(所有时间段),这是预设的通用模式。
- 简单选择:爆裂声在“大声”时出现就调正数,在“小声”时出现就调负数,如果分不清就先用 0 试试。
- 现场录音:噼啪声多出现在辅音部分(如“p”、“t”爆破音),选择预设"Voiceover Crackle Reduction"预设,将 Amplitude skew 设为负值(如-3.0至-6.0)。
De-ess
iZotope RX De-ess:去除咝音(Sibilants)。

- algorithms:算法。
- Classic:经典模式(全频段压缩)。检测咝咝音,并用宽带增益包络衰减它们。
- Spectral:频谱模式(多段压缩器)。仅衰减咝音最活跃的高频,而不影响低频。从技术上讲,此模式是一个多段压缩器。它能够压缩咝音的电平,塑造它们的频谱,并避免环境噪声的影响。每个波段可以单独运行,也可以与相邻波段连接运行(通过光谱整形滑块调整),波段阈值可以根据所需的 Sibilant 形状进行调整(通过调整光谱倾斜滑块实现)。
- Threshold:触发压缩的阈值。
- Relative:相对模式(默认),滑块上方显示 Threshold[dB]。确定语音级别,并设置与该级别相对的阈值。例如:“财(cái)”,系统会实时估算当前语音信号的平均电平,实时检测所选频段的高频能量。声母“c”产生瞬态高频能量(集中在 5 kHz 以上),“ai”能量主要集中在中下频,高频能量少。当“c”高频能量高于当前语音信号的平均电平时,触发全频段压缩。压缩量,根据检测到的强度,由内部算法自动计算出来。Threshold 滑块越向下拉,虽然,被检测到咝音越少。但是,压缩量却越大。
- Absolute:绝对模式(选中 Absolute 复选框,才启用此模式)。滑块上方显示 Threshold[dBFS]。将阈值设置为低于满量程(dBFS)的分贝水平。例如:“财(cái)”,当声母“c”达到设置的 dBFS 电平后,才会启动压缩。
- CutOff Frequency:截至频率。指定语音(要保留)和咝音(要减少)之间的交叉点。截止频率值用作声音检测的下限。只对截至频率以上的部分,进行检测,进行处理。
- Speed:设置压缩器的启动(Attack)和释放时间(release)。在这两种模式下,启动时间都取决于程序。
- Fast:快启动、快释放。如何出现抽吸现象(Pumping),尝试使用快速模式来缓解此问题。如果设置太慢,处理器将无法足够快地恢复,从而导致过高的频率衰减。
- Slow:慢启动、慢释放。如果过于平滑瞬态,也就是音头被过度压缩,丧失冲击力。请尝试使用慢速模式来缓解此问题。过快的设置会在初始瞬态阶段过多地降低高频信号,并可能引入平滑效果,从而降低有用的高频清晰度。
- Spectral shaping:频谱塑形。
- 0%:在所有频带上,使用均匀的压缩(所有高频频带按相同压缩比,进行压缩),保留原始嘶声的频谱形状。
- 100%:将嘶声的频谱“压缩成”成一个目标噪声轮廓(由 Spectral Tilt 决定),彻底改变其音色。
- Spectral Tilt:频谱倾斜。给咝音选择一种频谱斜率曲线的形状。
- 0:目标轮廓类似粉红噪声(Pink)。自然衰减,高频略弱于低频;
- 负值(-100):趋向棕噪声(Brown)。高频更少,声音更“暗”、“厚”;
- 正值(+100):趋向白噪声(White)。高频更平直,声音更“亮”、“清脆”。
- Pink:粉噪声。特点:从低频到高频,能量逐渐衰减。听起来响度均等。从频谱曲线上看,高频每八度衰减 3 dB(3dB/OCT)。
- Brown:棕噪声(布朗噪声)。特点:从低频到高频,能量逐渐衰减。能量主要集中在低频部分,2KHz高频能量非常少。听起来偏暗。从频谱曲线上看,高频每八度衰减 6 dB(6dB/OCT)。
- White:白噪声。特点:各个频段上的能量相等。听起来是沙沙的声音。中高频听起来更响。从频谱曲线上看,是一条平直的线(0dB/OCT)。

Phase
iZotope RX Phase:矫正相位。
Suggest:建议。检测最佳固定相移以降低信号峰值。Adaptive phase rotation:自适应相位旋转。随时间变化的相位旋转可最大程度地降低信号峰值电平。
相位偏移:波形上线不对称。从波形图上来看,就是音量线,没有处于正弦波的正中间位置,而是偏上或者偏下。上下两部分并不相等。它会对音量电平造成影响。
产生的条件:
- 使用麦克风录制语音的时候,若麦克风不是在嘴巴的正前方。
- 模拟在传送的过程中被滤波,或者被外界电磁干扰。
- 在音频编辑处理过程中,有些编辑软件,也会产生相位偏移。
产生的原因:
- 直流偏移(DC Offset):信号的直流分量指的是信号的平均值。理想的声音震动是一个过原点的正弦波,正负两个半周是对称的,它的平均值为 0,也就是说它不存在直流分量。
- 谐波之间的相位关系。
音色改变:
当相位偏移,既有向上偏移,也有向下偏移的时候,进行相位偏移矫正后,音色会改变,像得了感冒,贴耳的临场感也丢失。偏移程度越大,音色改变会越大。那么就需要针对每个小片段分别矫正,音色不会改变。而不能整个文件一次性全局矫正。
音色不变:
当三频均衡,又饱和度丰满的音频,相位矫正后,不会改变音色。
