基音泛音音调音色

频率：声音以振动波的形式传播。频率是指物体在单位时间内振动的次数，单位为赫兹（Hz）。频率决定了声音的音调高低：频率越高，音调越高；频率越低，音调越低。
基频：在复杂的振动系统中，频率最低的那个分量被称为基频。它是复合波中的第一谐波（一次谐波），通常也是振幅（能量）最大的成分。基频决定了我们听觉上感知到的主要音高。

自然界中绝大多数声音（乐音）都不是单一频率的“纯音”，而是由基音和泛音叠加而成的复合音。

术语	定义与物理机制	听觉作用
基音	发音体（如琴弦、声带）整体振动产生的音。其频率等于基频。	决定音高。例如我们听到的“Do”或“Re”主要由它决定。
泛音	发音体在整体振动的同时，其分段（部分）振动（如1/2段、1/3段）产生的音。其频率通常是基频的整数倍。	决定音色。泛音的多少、强弱分布，让声音有了独特的“色彩”。
复合音	基音与一系列泛音混合叠加后形成的声音。	我们日常听到的乐器声、人声，本质上都是复合音。

音高由基音决定：尽管复合音中包含许多高频泛音，但人耳的听觉系统倾向于捕捉最低的那个频率（基频）。因此，无论泛音如何变化，只要基音不变，我们听到的音高就不变。
音色由泛音决定：泛音叠加在基音之上，改变了声波的波形形态。不同的乐器（如小提琴与吉他）演奏同一个音高时，基频相同，但泛音列的构成（数量、频率、相对强度）不同。这种独特的泛音组合形成了特定的频谱，使波形变得复杂且具有辨识度，从而产生了丰富的音色。
乐器演奏中的“泛音技巧”：在吉他、小提琴等弦乐器演奏中，“泛音”也指一种特殊的演奏技巧。这种技巧并不是“制造”出了新的频率，而是通过特定的触弦方式（如手指轻触琴弦的节点），抑制了基音和大部分泛音的振动，只分离（筛选）出某一段特定的泛音（如1/2处的高八度泛音）。这种被“提炼”出来的泛音，听起来比实音更加纯净、空灵、明亮，宛如钟声。

基音泛音

声音本质上是声能，产生于物体的振动（如琴弦的拨动、声带的冲击等，不仅仅是摩擦）。振动以纵波的形式在介质（如空气、水、固体）中传播。由于声波需要介质传递，因此它无法在真空中传播。在传播过程中，由于介质的黏滞性、热传导性以及分子弛豫效应，声能会不断被转化为热能或其他形式的能量而被吸收，导致声音逐渐衰减。

无论是人声、歌声还是乐器声，自然界中绝大多数声音都不是单一频率的“纯音”，而是由基音和一系列泛音组成的复合音。这些频率成分在物理学中称为分音，在电声学中称为谐波，在音乐声学中则称为泛音。在大多数乐音中，泛音的频率通常是基音频率的整数倍。

基音是复合音中频率最低、通常振幅（能量）最大的成分。它是我们听觉系统捕捉到的主要音高。基音决定音高。例如，当我们听到一个 A 音（440Hz）时，这个“440Hz”指的就是基音的频率。
泛音是频率高于基音的成分（通常为基音的 2倍、3倍、4倍……频率）。泛音决定了声音的音色（Timbre）。
- 虽然泛音叠加在基音之上，但人耳主要感知的整体音高依然是基音的频率。然而，泛音的数量、频率分布以及相对强度（振幅大小）的不同，使得声波的波形变得复杂多样。
- 同乐器或人声的泛音排列组合不同，形成了一条独特的“频率特性曲线”（即频谱）。正是这条曲线的差异，让我们能轻易分辨出小提琴与钢琴的区别，或者不同人的嗓音差异。

共振

声带振动产生的初始声音，经过声道（如口腔、咽腔、鼻腔等）时，特定频率的能量被腔体共振放大，其他频率被衰减，从而在频谱上形成的能量集中区。声道并不会创造新的谐波，只放大与自身固有频率匹配的泛音（形成共振峰），同时衰减其他不匹配的泛音。

共振峰相对固定：只要你的口型、舌位和声道形状保持不变，无论你唱高音还是低音，共振峰所在的频率位置都是固定的。比如发元音“啊”时的第一共振峰和第二共振峰频率是恒定的，不会因为基频的改变而改变。
共振峰的表现：在频谱图上表现为包裹在这些精细结构之外的“包络线”上的大鼓包（山峰）。它反映的是整体能量的分布趋势，而不是某个单一频率点。
共振峰决定元音音质与辨识度：共振峰的分布位置决定了我们听到的是“a、o、e”中的哪一个元音，也是区分不同人声特征的核心参数。专业歌手常通过调整喉部肌肉，在 2.8kHz 附近制造强烈的“歌手共振峰”。

音调

音调（Pitch），又称音高，是人耳对声音高低的主观感受。音调主要由声源振动的频率决定。频率越高（振动越快），音调越高；频率越低（振动越慢），音调越低。频率的单位是赫兹（Hz）。

人耳对频率变化的感知并非线性的（即不是简单的加减关系），而是对数关系（倍数关系）。

倍频程（八度）：无论基础频率是多少，只要频率翻倍（变为原来的2倍），人耳感受到的音调跨度就是一样的，这个跨度在音乐上称为一个“八度”（Octave）。
例如：从 100Hz 到 200Hz 的听感跨度，与从 1000Hz 到 2000Hz 的跨度是完全相同的。
应用：正因为这种对数特性，我们在绘制音频频谱图或使用图形均衡器时，频率轴通常采用对数刻度，均衡器的频段也常按“倍频程”或“1/3倍频程”来划分，以符合人耳的听觉习惯。

音调主要取决于频率，且遵循对数规律（倍频程）。虽然响度也会干扰音调感知，但这种干扰是双向的：低频大音量听起来更低，高频大音量听起来更高。虽然频率是决定音调的主要因素，但振幅（响度）确实会干扰人耳对音调的判断。这种影响比较复杂，具体表现如下：

低频声音（<500Hz）：当响度显著增加时，人耳往往会感觉音调变低。
高频声音（> 2000Hz）：当响度显著增加时，人耳反而会感觉音调变高。
中频声音（1000Hz - 2000Hz）：响度的变化对音调感知的影响最小，几乎保持不变。

音色

音色（Timbre），又称音品，是声音的三大属性之一（另外两个是响度和音调）。它是我们听觉系统用来区分具有相同音高（音调）和响度的不同声音的特性。例如：当小提琴和钢琴演奏同一个“中央C”音符时，尽管它们的基频（音高）和振幅（响度）完全相同，我们依然能瞬间分辨出哪个是琴弦拉奏的，哪个是琴槌敲击的。这种独特的听觉“指纹”就是音色。简而言之，单纯的基音（正弦波）听起来是单调乏味、没有个性的。正是由于泛音列的复杂组合以及声音的时间动态，才赋予了乐器和人声特有的感染力和辨识度。

音色主要由声音的频谱结构决定。自然界中几乎不存在单纯的简谐振动（单一频率的正弦波），绝大多数乐器和人声发出的都是复杂的复合波。

基频与基波：物体振动时，频率最低、振幅通常最大的成分称为基频，它决定了我们听到的音高。
泛音与谐波：在基频之上，物体还会同时产生一系列频率为基频整数倍的高频振动。在物理学中，这些被称为谐波；在音乐声学中，被称为泛音。
音色的来源：不同乐器由于材料、结构及发声方式不同，其产生的泛音数量、频率分布以及相对强度（振幅）截然不同。正是这些泛音以不同比例叠加在基音上，形成了独特的波形，赋予了声音丰富的色彩。

除了频谱结构，音色还受声音随时间变化的特性影响，这被称为时间包络（ADSR）。

它描述了声音从产生到消失的过程：起音（Attack）、衰减（Decay）、延音（Sustain）和释音（Release）。
例如：钢琴的声音是“敲击”出来的，起音极快且随后衰减；而小提琴的声音是“拉奏”出来的，起音较平滑且可以持续维持。这种时间上的动态差异也是我们分辨音色的重要依据。

音域

人发出的声音是一种复合音，由基音和泛音共同组成。基音：是指声带整体振动产生的、频率最低的振动。它决定了我们听到的声音的音高（Pitch）。例如，女性声音的基音频率通常在 200 - 300 Hz之间，男性则在 80 - 150 Hz之间。泛音：是指声带除了整体振动外，其分段振动产生的一系列频率更高的振动。泛音不决定音高，但决定了声音的音色（Timbre），也就是我们常说的“共鸣”。这些共鸣由咽喉、口腔、胸腔、鼻腔等腔体共同作用形成。

人的音域是指一个人能够发出的从最低音到最高音的范围。通过专业训练，这个范围可以得到拓宽。人声的总音域（从最低男低音到最高花腔女高音）大约跨越五个到五个半八度，频率范围大致在 64 Hz 至 2048 Hz 之间。在音乐中，人声通常被划分为以下主要声部，其自然音域的频率范围大致如下：

男低音：82 ～ 392 Hz；男中音：123 ～ 493 Hz；男高音：164 ～ 698 Hz。
女低音：123 ～ 493 Hz；女中音：220 ～ 698 Hz；女高音：220 ～ 1100 Hz。

人耳能够感知的声音频率范围大约是 20 Hz ～ 20,000 Hz（20K Hz）。人耳对不同频率的敏感度是不同的。通常认为，人耳对 2000 Hz ～ 5000 Hz 的频率范围最为敏感。这个范围恰好包含了人类语言中大部分用于辨识语义的辅音信息，因此对语言清晰度至关重要。

人声的能量主要集中在中低频区域，大约在 100 Hz ～ 3000 Hz（3K Hz）之间。这个频段决定了声音的厚度和主体轮廓。而人声低音主要在低频 100 Hz 以下。
人声的清晰度、可懂度和明亮感主要由中高频决定，关键频段大约在 2000 Hz（2K Hz）～ 6000 Hz（6K Hz）。
- 2K Hz - 5K Hz：这个范围极大地影响语音的清晰度和可懂度。如果不足，声音会显得含糊；如果过强，则会感觉刺耳。
- 5K Hz 以上：这个频段主要影响声音的“空气感”和细节，如齿音（s, sh等）。它并非由“星状细胞”接收，而是由内耳的毛细胞负责。随着年龄增长或长期暴露在噪音中，毛细胞会受损，导致对高频声音（尤其是4K Hz以上）的感知能力下降，从而影响对语音细节的分辨。

在音频处理中，为了提升人声的清晰度和听感，通常会特别关注中高频段。例如，适度提升 2K Hz - 6K Hz 的频率可以让人声更突出、更清晰。同时，也会使用压缩器控制动态，使用均衡器切除不必要的低频噪音（如 80Hz 或 100Hz 以下），或衰减导致声音浑浊的中低频（如 300 - 500 Hz），以获得更干净、专业的声音效果。