• 首页
  • vue
  • TypeScript
  • JavaScript
  • scss
  • css3
  • html5
  • php
  • MySQL
  • redis
  • jQuery
  • 人声 EQ 原则方法

    在声乐后期处理中,理解倍频程至关重要,因为人耳对频率的感知是对数的,而非线性的。这意味着我们在调节 EQ 时,不能只看线性的赫兹(Hz)数值,而要看倍频程(Octave)的分布。

    倍频程(Octave)的概念源于音乐理论中的“八度音阶”。频率每增加一倍,音高就升高一个八度。例如,低音C(约130.8 Hz)到高音C(约261.6 Hz)再到超高音C(约523.2 Hz),频率呈 2 倍递增。1 倍频程是指上限频率与下限频率之比为 2:1 的频带。

    人耳对频率变化的敏感度遵循对数规律。我们能轻易分辨 100 Hz 和 200 Hz(相差 100 Hz,且为 1 倍频程)的区别,但很难分辨 5000 Hz 和 5100 Hz(相差 100Hz,但仅约 0.02 倍频程)的区别。因此,音频工程使用倍频程来划分频段,以符合人耳的听觉特性。为了量化声音能量,国际标准(ISO)将人耳可听范围(20 Hz - 20k Hz)划分为若干个 1倍频程,每个频段以其中心频率为代表。这是我们在分析人声整体能量分布时的基础坐标:

    中心频率频段属性人声听感影响
    31.5 Hz - 125 Hz超低频/低频氛围感、极低频隆隆声(通常切除)
    250 Hz低中频温暖度、厚度,过多则浑浊
    500 Hz中频箱体声、鼻音,人声核心区域
    1 kHz中高频力度、硬度,人声突出的关键
    2 kHz - 4 kHz高频清晰度、穿透力,易产生听觉疲劳
    8 kHz - 16 kHz超高频空气感、齿音、细腻度

    在专业音频处理中,1个倍频程的划分过于粗糙,无法精确定位问题频率。因此,我们引入了 1/3 倍频程。

    • 定义:将 1个倍频程(频率翻倍的范围)在对数坐标上均匀切分为 3 份。
    • 数学关系:相邻频点的频率比为 2 1/3(约 1.26 倍)。
    • 应用场景:这就是常见的 31 段图示均衡器的原理。它允许我们更精细地调整人声,例如只切除 250Hz 的浑浊,而不影响 160Hz 的厚度或 315Hz 的暖度。常用1/3倍频程中心频率表(人声关键区):
      • 低频区:80, 100, 125, 160, 200, 250, 320 Hz
      • 中频区:400, 500, 630, 800 Hz, 1k, 1.25k, 1.6k Hz
      • 高频区:2k, 2.5k, 3.2k, 4k, 5k, 6.3k, 8k, 10k, 12.5k, 16k Hz
    • 1/5倍频程:精度极高,相邻频率比为 21/5(约 1.15 倍)。常用于极高精度的声学测量,如分析歌手共振峰的微小偏移。
    • 2倍频程:频率跨度为4倍(22)。例如从 100 Hz 到 400 Hz。这通常用于描述乐器的宽广频响范围或系统的整体动态。

    倍频程在人声后期中的意义,理解倍频程能帮助你建立“对数听觉思维”:

    • 定位更准:当你觉得人声“闷”时,你知道这通常发生在 250 Hz - 500 Hz(1/3倍频程的某一点),而不是盲目地在低频乱切。
    • 操作更自然:在调节参数均衡器时,理解 Q 值(带宽)与倍频程的关系,能让你做出的频段提升或衰减听起来更符合人耳的自然听感,避免出现“由于线性思维导致的听觉断层”。


    泛音和谐

    在音乐中,“和谐”通常指两个或多个不同音高的音符同时发声时,它们的泛音列相互重合,产生悦耳、稳定的听感。而在人声旁白中,“泛音和谐”更多是指单个声音内部的泛音结构是否丰富、均衡且悦耳。它决定了旁白声音的音色、质感、情感表现力和听觉舒适度。一个“和谐”的旁白声音,听起来是饱满、温暖、有磁性且富有感染力的;反之,则会显得单薄、干涩、刺耳或缺乏个性。

    人声的源头是声带的振动。声带振动时,产生的不是一个单一频率的纯音(基音),而是一个包含基音和一系列泛音的复合音。经过专业训练的配音员或歌手,能够通过精确控制呼吸和声带闭合,产生一个能量更强、泛音更丰富的原始声源。这就像是为后续的“调色”提供了更优质的“原料”。在频谱分析仪上,一个优质的声源会显示出清晰、连续且能量分布较广的谐波(泛音)列,而一个未经训练的声音则可能在某些频段出现能量“缺失”或“断层”。

    声带产生的原始声音,需要经过喉咙、口腔、鼻腔等构成的“声道”进行放大和修饰。声道就像一个智能的均衡器(EQ),会根据我们发声时的口腔形状、舌头位置等,放大某些特定的泛音(形成共振峰),同时衰减另一些泛音。

    • 塑造音色:正是这种对泛音的选择性放大和衰减,塑造了我们独一无二的音色和不同的元音(如“啊”和“咦”的区别)。
    • “和谐”的关键:一个“和谐”的旁白声音,意味着其声道这个“滤波器”工作得非常出色。它能让低、中、高频的泛音得到均衡的展现,避免出现某个频段过分突兀(如刺耳的鼻音)或严重缺失(如声音发闷)。

    在旁白录制和后期处理中,我们追求的“泛音和谐”主要体现在以下几个频段:

    • 低频泛音(约 100 - 300 Hz):温暖与厚度
      • 作用:赋予声音“胸腔共鸣”感,使其听起来宽厚、稳重、有磁性。这是营造“故事感”和“权威感”的基础。
      • 不和谐表现:如果低频泛音过弱,声音会显得单薄、苍白;如果过强或浑浊,则会显得“肥大”、不清晰。
    • 中频泛音(约 1k Hz - 4k Hz):清晰与穿透
      • 作用:这是人声清晰度和可懂度的核心区域。适度的中频泛音能让旁白在背景音乐或嘈杂环境中依然清晰可辨。
      • 不和谐表现:这个频段的泛音不足,声音会显得“遥远”、“朦胧”;如果过度提升,则会变得刺耳、有“电话音”或“喇叭音”的质感,导致听觉疲劳。
    • 高频泛音(约 8kHz以上):空气感与细节
      • 作用:为声音增添“空气感”、光泽感和细腻度,让声音听起来更通透、更专业、更具亲和力。
      • 不和谐表现:缺少高频泛音,声音会显得“暗淡”、“干瘪”;过多则会放大齿音(如“嘶”、“斯”),产生刺耳的刮擦感。


    三腔共鸣

    人声之所以能产生“美感”和“悦耳动听”的效果,本质上是因为人体这个精密的“生物乐器”通过三腔共鸣(胸腔、口咽腔、头腔/鼻腔)的协同工作,构建了一个频率分布均衡、泛音丰富且和谐的声学频谱。人声的美感不是单一频率的突出,而是低、中、高三个频段的完美衔接。每一个共鸣腔体负责不同的频率范围,共同支撑起声音的立体感。

    胸腔共鸣:声音的“地基”与“温暖感”(低频区)

    • 频率范围:主要集中在 100Hz - 400Hz(基音与低次泛音)。
    • 厚度与磁性:胸腔是一个体积较大的软组织腔体,主要对低频产生共振。它赋予了声音“宽度”和“厚度”。
    • 情感色彩:这种低频振动给人以沉稳、庄重、温暖的心理感受。如果缺乏胸腔共鸣,声音会显得单薄、苍白(即“白声”);如果过多,则会显得浑浊、发闷。
    • 听感体验:就像大提琴的低音弦,提供了声音的“包裹感”和“权威感”。

    口咽腔共鸣:声音的“骨架”与“力度”(中频区)

    • 频率范围:主要集中在 500Hz - 2kHz(核心泛音区)。
    • 清晰度与咬字:口腔和咽腔是可调节性最强的腔体(通过舌头、嘴唇、下颌的变化)。它决定了声音的“明亮度”和“可懂度”。
    • 自然度:这是人声最自然的说话区域。美感来源于“通畅”,即声音在这个频段没有阻塞感,既不发扁也不发空。
    • 听感体验:就像中提琴或小提琴的中音区,提供了声音的“实体感”和“叙述感”。

    头腔/鼻腔共鸣:声音的“光泽”与“穿透力”(高频区)

    • 频率范围:主要集中在 2.5kHz - 4kHz 甚至更高(高次泛音与歌手共振峰)。
    • 穿透力与金属感:头腔(包括鼻窦、额窦等)是硬骨组织构成的固定腔体,体积小、硬度高,极易引起高频共振。它赋予了声音“金属般的色彩”和“远距离传播能力”。
    • 空灵与华丽:这种高频泛音让声音听起来“通透”、“有光泽”。缺乏头腔共鸣的声音会显得暗淡、发闷;而过量的鼻音(错误的头腔共鸣)则会变成刺耳的“囔囔声”。
    • 听感体验:就像长笛或三角铁的高频泛音,提供了声音的“位置感”和“华丽感”。

    齿音调节:平衡声音的细腻度与清晰度

    • 核心频段:建议调节范围为 6kHz - 16kHz。
    • 声源特性:由口腔气流在齿缝间摩擦产生,与声带振动的乐音基本无关,频谱主要分布在 4k Hz以上。
    • 提升空气感:如需增加声音的“空气感”和细腻度,可使用宽频带均衡(如3个倍频程),中点频率设在 10kHz - 12kHz,进行适度提升。
    • 衰减刺耳齿音:如需降低“嘶”、“嘘”等刺耳的齿音,应使用窄频带均衡(如1/2倍频程),中点频率在 6800Hz 附近扫频,找到问题点后,以-10dB 以内的增益进行衰减。
    • 重要区分:提升时要用宽带,让声音整体通透;衰减时要用窄带,精准切除刺耳部分,避免损伤人声整体的亮度。

    人声的“悦耳动听”,本质上是“三腔共鸣”在频率上的完美平衡:胸腔提供了“根”(稳固、温暖);口咽腔提供了“干”(清晰、自然);头腔提供了“花”(光彩、穿透)。当这三者在时间上同步、强度上匹配、频率上互补时,就形成了我们在声学上追求的“最佳美声线”,在听感上就是那个让人如沐春风、直击心灵的“天籁之音”。从声学和审美心理学的角度来看,三腔共鸣的协调产生了以下几种“美感效应”:

    • 频谱的“连续性”:最佳美声线。悦耳的声音,其频谱曲线(从基音到高次泛音)是平滑过渡的。
      • 原理:当胸腔(低)、口咽(中)、头腔(高)的比例协调时,声音的能量在 100Hz 到 4000Hz 之间分布均匀,没有明显的断层或突兀的峰值。
      • 结果:这种“全频段共振”(即整体共鸣)使得声音既有低频的温暖,又有高频的明亮,听起来丰满而不浑浊,明亮而不刺耳。
    • 泛音的“丰富性”:音色的奢华感
      • 原理:单一腔体只能产生单调的泛音。三腔共鸣通过复杂的耦合,极大地丰富了泛音列。
      • 结果:丰富的泛音结构(尤其是高频泛音的加入)让声音听起来具有“空气感”和“细腻度”。这就像绘画中,单一颜色是单调的,而多种颜色的调和才能画出光影丰富的油画。
    • 动态的“对比美”:情感的载体。不同的共鸣比例可以产生不同的音色,从而表达不同的情感,这也是美感的重要来源:
      • 偏重胸腔(暖声):适合表达深沉、悲伤、叙述性的情感,给人温暖、亲近的感觉。
      • 偏重头腔(冷声):适合表达激昂、神圣、空灵的情感,给人高冷、清澈的感觉。
      • 美感来源:优秀的歌者或朗诵者,能够在三腔之间灵活切换(即“混合共鸣”),使声音色彩随情感变化,这种变化本身就是一种极高的艺术美感。


    最佳美声线

    根据意大利美声学的观点,如果我们将一个声音从基音到第16个泛音的强度值,在坐标图上连接成一条直线,这条直线就被称为“最佳美声线”。这条“直线”代表了一种理想状态:声音的低频、中频和高频泛音的能量分布最为均衡,没有某一部分过分突出或缺失。一个音色的频率特性曲线越接近这条直线,就意味着它的泛音结构越均衡,其音色的艺术表现力也越出色,听起来会感觉丰满、圆润、明亮且富有层次感。

    如何“看”这条线?

    • 音频插件 TDR Prism、Voxengo SPAN、FabFilter Pro-Q 4,使用其中的任何一款,都可以。
    • 播放稳定的元音:让人声唱一个长音(如“啊”),这样频谱才会稳定。
    • 观察包络线:盯着频谱图上那些跳动的波峰(泛音)。
    • 脑补连线:想象一条线连接了基音(最左边最高的波峰)到第 16 个泛音(右边的高频波峰)。
    • 判断方法:左高右低但平滑,这是正常的自然声学规律(高频能量通常会随频率升高而自然衰减)。
    • “最佳美声线”的视觉修正:所谓的“直线”,在视觉上通常表现为高频泛音没有过早衰减。如果高频泛音(10kHz以上)依然清晰可见,且整体曲线没有剧烈的凹陷,视觉上就会感觉能量分布很“均衡”,这就是我们要找的状态。


    八度音

    八度音:当一个音的频率是另一个音的两倍(2:1)时,这两个音就构成了纯八度关系。假设歌手唱了一个标准音 A4 的频率是 440 Hz,那么比它高一个八度的 A5 频率就是 880 Hz,而低一个八度的 A3 则是 220 Hz。

    八度层级计算方式对应频率(Hz)听感
    0(基音)440×20440 Hz人声的基音
    +1(第一泛音)440×21880 Hz刚好高一个八度的 A5 音
    +2(第二泛音)440×221,760 Hz高两个八度的 A6 音
    +3(第三泛音)440×233,520 Hz高三个八度的 A7 音

    当两个频率呈 2:1 关系的音同时响起时,它们的声波会在空气中规律地、完美地重叠在一起。高频音每振动两次,低频音恰好振动一次。这种高度的同步性让大脑处理起来毫不费力,从而产生一种稳定、融合的“和谐感”。正因为这种物理上的紧密联系,我们的大脑会将它们归类为“同一个音高类别”。虽然一个高一个低,但我们能清晰地感知到它们的“血缘关系”,听起来就像是一个音在不同音域的“复制品”或“轮回”。这也是为什么在音乐中,我们给它们起相同的名字(如 C 和它上方的 C)。

    八度音的和谐特性使其成为音乐创作中极其强大的工具。同时演奏相隔八度的两个音,可以极大地增强旋律或和声的厚度和力量感,而不会引入新的、可能冲突的音色。这就像给声音加粗或提亮。作曲家利用八度来创造音色和音域上的对比。例如,让大提琴演奏低音区的旋律,同时让小提琴在高八度上重复,可以营造出深沉与明亮并存的对话感,极大地丰富了音乐的织体。总而言之,八度音的和谐并非主观的审美偏好,而是客观的物理规律。它源于最简单的整数比,被我们的大脑解读为一种极致的秩序与统一,从而成为构建整个音乐世界的基石。

    从八度音的视角来处理人声,意味着我们不再将频率看作一个个孤立的点,而是看作一个以人声基音(Fundamental Pitch)为核心的、相互关联的谐波家族。这种方法的核心思想是:顺应声音的自然物理结构进行“雕刻”,而不是强行扭曲它。

    第一步:清理“混乱”的低八度。

    • 人声的基音(我们听到的音高)通常在 80 Hz 到 1.1k Hz 之间。基音下方的频率,虽然不属于音高本身,但对听感影响巨大。
    • 目标:去除无效的低频噪音,为人声的“根基”腾出干净的空间。
    • 操作:使用高通滤波器(High-Pass Filter, HPF)。
    • 八度视角:这相当于在基音的“下方”划一条干净的起跑线。切除 80 Hz - 120 Hz 以下的超低频(如电流声、低频轰鸣、喷麦声),这些声音不仅浑浊,还会与音乐中的贝斯、底鼓等乐器“打架”。
    • 听感提升:人声会立刻变得干净、清晰,不再有“蒙着一层雾”的感觉。

    第二步:精准打击“刺耳”的谐波八度。

    • 人声的音色和质感,主要由基音上方的一系列谐波(Harmonics)决定。这些谐波的频率通常是基音的2倍(高一个八度)、3倍、4倍(高两个八度)等。问题往往就出在这些谐波上。
    • 目标:消除随音高变化的刺耳共鸣、鼻音或“盒子味”。
    • 操作:使用动态均衡器(Dynamic EQ)结合音高追踪(Pitch Tracking)。这正是八度音理论大显身手的地方。
    • 锁定目标:假设歌手唱到某个音时,他声音中“基音+1个八度”的谐波位置(2倍频)特别刺耳。普通 EQ 如果固定削减这个频率,当歌手换一个音高时,刺耳点就跑了,而你可能误伤新的基音。
    • 动态追踪:使用 Antares Vocal EQ 的 Track 功能,将 EQ 频点锁定在歌手的实时基音上,然后通过 Harmonic 旋钮,将处理点精准定位到“+1个八度”的位置。
    • 智能处理:设置一个阈值,只有当这个刺耳的谐波超过一定音量时,EQ才进行衰减。
    • 听感提升:你可以精准地“手术”掉那些恼人的共振峰,而完全不影响人声的自然质感和音高变化,让声音变得顺滑、悦耳。

    第三步:提升“闪耀”的超高八度。

    • 在清理和修正之后,我们需要为声音增添光彩和现代感。这通常涉及到基音上方非常远的谐波,即所谓的“空气感”(Air)频段。
    • 目标:增加人声的亮度、细节和“昂贵”的质感。
    • 操作:使用高架均衡器(High-Shelf EQ)或专门的 Air Band。
    • 八度视角:这相当于在谐波家族的顶端(通常是基音上方 5-6 个八度,即 10k Hz 以上)进行整体提亮。这个频段的能量并不决定音高,但决定了声音的“光泽”和“空间感”。
    • 听感提升:人声会变得通透、鲜活,仿佛歌者就在你耳边呼吸,即使在复杂的编曲中也能清晰地“浮”在伴奏之上。

    进阶技巧:创造“虚拟”的低八度。

    • 这是一个创意性的技巧,常用于电影预告片或需要极强力量感的旁白中。
    • 目标:人为制造出超越人声生理极限的低沉感和权威感。
    • 操作:复制人声轨道,使用移调插件(如Little AlterBoy)将其向下移调一个八度(-12个半音),然后用低通滤波器切掉这个新轨道的高频,只保留其低频部分,再与原声混合。
    • 八度视角:你在原声的“下方”凭空创造了一个新的、更低沉的“八度根基”。
    • 听感提升:声音会变得异常厚重、深沉,充满震撼力,仿佛有两个声带在同时振动。

    总而言之,从八度音的角度处理人声,就是尊重并利用声音的自然谐波结构。通过清理基音下方、精准处理谐波八度、提亮超高八度,你可以系统性地让人声从浑浊变得干净,从刺耳变得顺滑,从平淡变得闪耀。


    旁白处理中的八度策略表
    处理目标涉及的八度区域常用工具/手段目的
    去浑浊基音上方+1 八度(约 250 - 500Hz)动态 EQ(带追踪)去除随语调变化的“盒子味”,不伤基音。
    增厚度基音区域(80 - 150Hz)低切/低架 EQ确保基音稳固,切除次声波噪音。
    增清晰基音上方+3~4 八度(2k - 5kHz)静态/动态 EQ提升人声的可懂度,让人声突出。
    增空气基音上方+5~6 八度(10kHz+)Air Band /激励器增加“贵气”和现代感,减少沉闷。
    创意加厚基音下方-1 八度移调+ EQ制造“电影预告片”般的深沉嗓音。