iZotope 插件2

iZotope RX：音频修复插件。

RX

iZotope RX：是一款功能强大的音频处理软件，广泛应用于音频录制、混音、广播、声音设计和母带处理等领域。它结合了基于视觉的频谱编辑功能和专用工具，能够解决各种音频问题，如不需要的混响、点击声、削波、嗡嗡声和背景噪音等。

iZotope RX 去除咔哒声的插件：

Mouth De-click：去除嘴巴里产生的口水音、咔哒声、啪嗒声等。
De-click：消除各种短脉冲噪声，例如由数字错误、嘴巴噪声和手机干扰引起的咔嗒声等。复杂算法可分析音频中振幅的不规则性，并进行平滑处理。
De-crackle：去除爆裂声。比如老式的留声机、磁带、老式电影胶片中，那么短而急促并且连成片的噼啪声。音损明显，不适合全局使用，只适合针对个别地方使用。不适合全局使用，因为音损很严重。只适合，手工修音的时候，在局部使用。
Interpolate：是手工修复单个的click。找到click所在的那一部分，进行修复。它是模仿周围的环境音，而将问题去除。

De-click

iZotope RX De-click，处理口水音咔哒声。全局参数设置：

Sensitivity 灵敏度，默认值3，超过4，高频亮丽会丢失。当达到7的时候，会严重变音。
Frequency Skew 频率偏移。默认值0，低于-3，会严重变音。
Click widening 宽度，默认值0。超过2，开始破裂感。

Mouth De-click

Mouth De-click

Default：默认值。
Eliminate Clicks-Low Latency：消除点击，低延迟模式。
Eliminate clicks：消除点击。
Reduce Smacks：消弱 Smacks，包括掌击声、劈啪声、咂嘴声和响吻声等。
Transparent Removal：通明移除。

使用 iZotope RX Mouth De-click，处理口水音咔哒声。全局参数设置：

Sensitivity 灵敏度，最大值6。设置7，有些字会有明显音损，当达到8的时候，有些字会严重变音。
Frequency Skew 频率偏移。默认0，范围主要在 1K Hz以上。设置为负数，会损伤低频。若设置为-3，有些字低频会被伤，使语言听起来象感冒。若设置为-8，其范围是 200 Hz以上，若设置为-10，是全频段，有些字会音损严重，像重感冒。
Click widening 宽度，默认值0。超过2，开始有轻微破裂感。超过3，会变音。

De-crackle

iZotope RX De-crackle：去除爆裂声。

Amplitude skew：振幅偏斜，选择信号电平振幅大小的主要区域。该参数的电平可调范围为-10.0至10.0，默认值为 0.0。
- 正向调节（正值）：在高电平振幅信号区块范围内（高音量时间段），增强对微弱噼啪声的捕捉，适用于背景噪声较明显的场景。
- 负向调节（负值）：在低电平振幅信号区块范围内（低音量时间段），增强突发性爆裂声的捕捉，适合处理咝音中突发性爆裂声。
- 中性状态（0.0）：保持对所有电平信号的均衡处理（所有时间段），这是预设的通用模式。
- 简单选择：爆裂声在“大声”时出现就调正数，在“小声”时出现就调负数，如果分不清就先用 0 试试。
- 现场录音：噼啪声多出现在辅音部分（如“p”、“t”爆破音），选择预设"Voiceover Crackle Reduction"预设，将 Amplitude skew 设为负值（如-3.0至-6.0）。

De-ess

iZotope RX De-ess：去除咝音（Sibilants）。

algorithms：算法。
- Classic：经典模式（全频段压缩）。检测咝咝音，并用宽带增益包络衰减它们。
- Spectral：频谱模式（多段压缩器）。仅衰减咝音最活跃的高频，而不影响低频。从技术上讲，此模式是一个多段压缩器。它能够压缩咝音的电平，塑造它们的频谱，并避免环境噪声的影响。每个波段可以单独运行，也可以与相邻波段连接运行（通过光谱整形滑块调整），波段阈值可以根据所需的 Sibilant 形状进行调整（通过调整光谱倾斜滑块实现）。
Threshold：触发压缩的阈值。
- Relative：相对模式（默认），滑块上方显示 Threshold[dB]。确定语音级别，并设置与该级别相对的阈值。例如：“财（cái）”，系统会实时估算当前语音信号的平均电平，实时检测所选频段的高频能量。声母“c”产生瞬态高频能量（集中在 5 kHz 以上），“ai”能量主要集中在中下频，高频能量少。当“c”高频能量高于当前语音信号的平均电平时，触发全频段压缩。压缩量，根据检测到的强度，由内部算法自动计算出来。Threshold 滑块越向下拉，虽然，被检测到咝音越少。但是，压缩量却越大。
- Absolute：绝对模式（选中 Absolute 复选框，才启用此模式）。滑块上方显示 Threshold[dBFS]。将阈值设置为低于满量程（dBFS）的分贝水平。例如：“财（cái）”，当声母“c”达到设置的 dBFS 电平后，才会启动压缩。
CutOff Frequency：截至频率。指定语音（要保留）和咝音（要减少）之间的交叉点。截止频率值用作声音检测的下限。只对截至频率以上的部分，进行检测，进行处理。
Speed：设置压缩器的启动（Attack）和释放时间（release）。在这两种模式下，启动时间都取决于程序。
- Fast：快启动、快释放。如何出现抽吸现象（Pumping），尝试使用快速模式来缓解此问题。如果设置太慢，处理器将无法足够快地恢复，从而导致过高的频率衰减。
- Slow：慢启动、慢释放。如果过于平滑瞬态，也就是音头被过度压缩，丧失冲击力。请尝试使用慢速模式来缓解此问题。过快的设置会在初始瞬态阶段过多地降低高频信号，并可能引入平滑效果，从而降低有用的高频清晰度。
Spectral shaping：频谱塑形。
- 0%：在所有频带上，使用均匀的压缩（所有高频频带按相同压缩比，进行压缩），保留原始嘶声的频谱形状。
- 100%：将嘶声的频谱“压缩成”成一个目标噪声轮廓（由 Spectral Tilt 决定），彻底改变其音色。
Spectral Tilt：频谱倾斜。给咝音选择一种频谱斜率曲线的形状。
- 0：目标轮廓类似粉红噪声（Pink）。自然衰减，高频略弱于低频；
- 负值（-100）：趋向棕噪声（Brown）。高频更少，声音更“暗”、“厚”；
- 正值（+100）：趋向白噪声（White）。高频更平直，声音更“亮”、“清脆”。
- Pink：粉噪声。特点：从低频到高频，能量逐渐衰减。听起来响度均等。从频谱曲线上看，高频每八度衰减 3 dB（3dB/OCT）。
- Brown：棕噪声（布朗噪声）。特点：从低频到高频，能量逐渐衰减。能量主要集中在低频部分，2KHz高频能量非常少。听起来偏暗。从频谱曲线上看，高频每八度衰减 6 dB（6dB/OCT）。
- White：白噪声。特点：各个频段上的能量相等。听起来是沙沙的声音。中高频听起来更响。从频谱曲线上看，是一条平直的线（0dB/OCT）。

Phase

iZotope RX Phase：矫正相位。

Suggest：建议。检测最佳固定相移以降低信号峰值。
Adaptive phase rotation：自适应相位旋转。随时间变化的相位旋转可最大程度地降低信号峰值电平。

相位偏移：波形上线不对称。从波形图上来看，就是音量线，没有处于正弦波的正中间位置，而是偏上或者偏下。上下两部分并不相等。它会对音量电平造成影响。

产生的条件：

使用麦克风录制语音的时候，若麦克风不是在嘴巴的正前方。
模拟在传送的过程中被滤波，或者被外界电磁干扰。
在音频编辑处理过程中，有些编辑软件，也会产生相位偏移。

产生的原因：

直流偏移（DC Offset）：信号的直流分量指的是信号的平均值。理想的声音震动是一个过原点的正弦波，正负两个半周是对称的，它的平均值为 0，也就是说它不存在直流分量。
谐波之间的相位关系。

音色改变：
当相位偏移，既有向上偏移，也有向下偏移的时候，进行相位偏移矫正后，音色会改变，像得了感冒，贴耳的临场感也丢失。偏移程度越大，音色改变会越大。那么就需要针对每个小片段分别矫正，音色不会改变。而不能整个文件一次性全局矫正。

音色不变：
当三频均衡，又饱和度丰满的音频，相位矫正后，不会改变音色。