• 首页
  • vue
  • TypeScript
  • JavaScript
  • scss
  • css3
  • html5
  • php
  • MySQL
  • redis
  • jQuery
  • 基音泛音音调音色

    频率:声音以振动波的形式传播。频率是指物体在单位时间内振动的次数,单位为赫兹(Hz)。频率决定了声音的音调高低:频率越高,音调越高;频率越低,音调越低。
    基频:在复杂的振动系统中,频率最低的那个分量被称为基频。它是复合波中的第一谐波(一次谐波),通常也是振幅(能量)最大的成分。基频决定了我们听觉上感知到的主要音高。

    自然界中绝大多数声音(乐音)都不是单一频率的“纯音”,而是由基音和泛音叠加而成的复合音。

    术语定义与物理机制听觉作用
    基音发音体(如琴弦、声带)整体振动产生的音。其频率等于基频。决定音高。例如我们听到的“Do”或“Re”主要由它决定。
    泛音发音体在整体振动的同时,其分段(部分)振动(如1/2段、1/3段)产生的音。其频率通常是基频的整数倍。决定音色。泛音的多少、强弱分布,让声音有了独特的“色彩”。
    复合音基音与一系列泛音混合叠加后形成的声音。我们日常听到的乐器声、人声,本质上都是复合音。
    • 音高由基音决定:尽管复合音中包含许多高频泛音,但人耳的听觉系统倾向于捕捉最低的那个频率(基频)。因此,无论泛音如何变化,只要基音不变,我们听到的音高就不变。
    • 音色由泛音决定:泛音叠加在基音之上,改变了声波的波形形态。不同的乐器(如小提琴与吉他)演奏同一个音高时,基频相同,但泛音列的构成(数量、频率、相对强度)不同。这种独特的泛音组合形成了特定的频谱,使波形变得复杂且具有辨识度,从而产生了丰富的音色。
    • 乐器演奏中的“泛音技巧”:在吉他、小提琴等弦乐器演奏中,“泛音”也指一种特殊的演奏技巧。这种技巧并不是“制造”出了新的频率,而是通过特定的触弦方式(如手指轻触琴弦的节点),抑制了基音和大部分泛音的振动,只分离(筛选)出某一段特定的泛音(如1/2处的高八度泛音)。这种被“提炼”出来的泛音,听起来比实音更加纯净、空灵、明亮,宛如钟声。


    基音泛音

    声音本质上是声能,产生于物体的振动(如琴弦的拨动、声带的冲击等,不仅仅是摩擦)。振动以纵波的形式在介质(如空气、水、固体)中传播。由于声波需要介质传递,因此它无法在真空中传播。在传播过程中,由于介质的黏滞性、热传导性以及分子弛豫效应,声能会不断被转化为热能或其他形式的能量而被吸收,导致声音逐渐衰减。

    无论是人声、歌声还是乐器声,自然界中绝大多数声音都不是单一频率的“纯音”,而是由基音和一系列泛音组成的复合音。这些频率成分在物理学中称为分音,在电声学中称为谐波,在音乐声学中则称为泛音。在大多数乐音中,泛音的频率通常是基音频率的整数倍。

    • 基音是复合音中频率最低、通常振幅(能量)最大的成分。它是我们听觉系统捕捉到的主要音高。基音决定音高。例如,当我们听到一个 A 音(440Hz)时,这个“440Hz”指的就是基音的频率。
    • 泛音是频率高于基音的成分(通常为基音的 2倍、3倍、4倍……频率)。泛音决定了声音的音色(Timbre)。
      • 虽然泛音叠加在基音之上,但人耳主要感知的整体音高依然是基音的频率。然而,泛音的数量、频率分布以及相对强度(振幅大小)的不同,使得声波的波形变得复杂多样。
      • 同乐器或人声的泛音排列组合不同,形成了一条独特的“频率特性曲线”(即频谱)。正是这条曲线的差异,让我们能轻易分辨出小提琴与钢琴的区别,或者不同人的嗓音差异。



    音调

    音调(Pitch),又称音高,是人耳对声音高低的主观感受。音调主要由声源振动的频率决定。频率越高(振动越快),音调越高;频率越低(振动越慢),音调越低。频率的单位是赫兹(Hz)。

    人耳对频率变化的感知并非线性的(即不是简单的加减关系),而是对数关系(倍数关系)。

    • 倍频程(八度):无论基础频率是多少,只要频率翻倍(变为原来的2倍),人耳感受到的音调跨度就是一样的,这个跨度在音乐上称为一个“八度”(Octave)。
      例如:从 100Hz 到 200Hz 的听感跨度,与从 1000Hz 到 2000Hz 的跨度是完全相同的。
    • 应用:正因为这种对数特性,我们在绘制音频频谱图或使用图形均衡器时,频率轴通常采用对数刻度,均衡器的频段也常按“倍频程”或“1/3倍频程”来划分,以符合人耳的听觉习惯。

    音调主要取决于频率,且遵循对数规律(倍频程)。虽然响度也会干扰音调感知,但这种干扰是双向的:低频大音量听起来更低,高频大音量听起来更高。虽然频率是决定音调的主要因素,但振幅(响度)确实会干扰人耳对音调的判断。这种影响比较复杂,具体表现如下:

    • 低频声音(<500Hz):当响度显著增加时,人耳往往会感觉音调变低。
    • 高频声音(> 2000Hz):当响度显著增加时,人耳反而会感觉音调变高。
    • 中频声音(1000Hz - 2000Hz):响度的变化对音调感知的影响最小,几乎保持不变。



    音色

    音色(Timbre),又称音品,是声音的三大属性之一(另外两个是响度和音调)。它是我们听觉系统用来区分具有相同音高(音调)和响度的不同声音的特性。例如:当小提琴和钢琴演奏同一个“中央C”音符时,尽管它们的基频(音高)和振幅(响度)完全相同,我们依然能瞬间分辨出哪个是琴弦拉奏的,哪个是琴槌敲击的。这种独特的听觉“指纹”就是音色。简而言之,单纯的基音(正弦波)听起来是单调乏味、没有个性的。正是由于泛音列的复杂组合以及声音的时间动态,才赋予了乐器和人声特有的感染力和辨识度。

    音色主要由声音的频谱结构决定。自然界中几乎不存在单纯的简谐振动(单一频率的正弦波),绝大多数乐器和人声发出的都是复杂的复合波。

    • 基频与基波:物体振动时,频率最低、振幅通常最大的成分称为基频,它决定了我们听到的音高。
    • 泛音与谐波:在基频之上,物体还会同时产生一系列频率为基频整数倍的高频振动。在物理学中,这些被称为谐波;在音乐声学中,被称为泛音。
    • 音色的来源:不同乐器由于材料、结构及发声方式不同,其产生的泛音数量、频率分布以及相对强度(振幅)截然不同。正是这些泛音以不同比例叠加在基音上,形成了独特的波形,赋予了声音丰富的色彩。

    除了频谱结构,音色还受声音随时间变化的特性影响,这被称为时间包络(ADSR)。

    • 它描述了声音从产生到消失的过程:起音(Attack)、衰减(Decay)、延音(Sustain)和释音(Release)。
    • 例如:钢琴的声音是“敲击”出来的,起音极快且随后衰减;而小提琴的声音是“拉奏”出来的,起音较平滑且可以持续维持。这种时间上的动态差异也是我们分辨音色的重要依据。



    音域

    人发出的声音是一种复合音,由基音和泛音共同组成。基音:是指声带整体振动产生的、频率最低的振动。它决定了我们听到的声音的音高(Pitch)。例如,女性声音的基音频率通常在 200 - 300 Hz之间,男性则在 80 - 150 Hz之间。泛音:是指声带除了整体振动外,其分段振动产生的一系列频率更高的振动。泛音不决定音高,但决定了声音的音色(Timbre),也就是我们常说的“共鸣”。这些共鸣由咽喉、口腔、胸腔、鼻腔等腔体共同作用形成。

    人的音域是指一个人能够发出的从最低音到最高音的范围。通过专业训练,这个范围可以得到拓宽。人声的总音域(从最低男低音到最高花腔女高音)大约跨越五个到五个半八度,频率范围大致在 64 Hz 至 2048 Hz 之间。在音乐中,人声通常被划分为以下主要声部,其自然音域的频率范围大致如下:

    男低音:82 ~ 392 Hz;男中音:123 ~ 493 Hz;男高音:164 ~ 698 Hz。
    女低音:123 ~ 493 Hz;女中音:220 ~ 698 Hz;女高音:220 ~ 1100 Hz。

    人耳能够感知的声音频率范围大约是 20 Hz ~ 20,000 Hz(20K Hz)。人耳对不同频率的敏感度是不同的。通常认为,人耳对 2000 Hz ~ 5000 Hz 的频率范围最为敏感。这个范围恰好包含了人类语言中大部分用于辨识语义的辅音信息,因此对语言清晰度至关重要。

    • 人声的能量主要集中在中低频区域,大约在 100 Hz ~ 3000 Hz(3K Hz)之间。这个频段决定了声音的厚度和主体轮廓。而人声低音主要在低频 100 Hz 以下。
    • 人声的清晰度、可懂度和明亮感主要由中高频决定,关键频段大约在 2000 Hz(2K Hz)~ 6000 Hz(6K Hz)。
      • 2K Hz - 5K Hz:这个范围极大地影响语音的清晰度和可懂度。如果不足,声音会显得含糊;如果过强,则会感觉刺耳。
      • 5K Hz 以上:这个频段主要影响声音的“空气感”和细节,如齿音(s, sh等)。它并非由“星状细胞”接收,而是由内耳的毛细胞负责。随着年龄增长或长期暴露在噪音中,毛细胞会受损,导致对高频声音(尤其是4K Hz以上)的感知能力下降,从而影响对语音细节的分辨。

    在音频处理中,为了提升人声的清晰度和听感,通常会特别关注中高频段。例如,适度提升 2K Hz - 6K Hz 的频率可以让人声更突出、更清晰。同时,也会使用压缩器控制动态,使用均衡器切除不必要的低频噪音(如 80Hz 或 100Hz 以下),或衰减导致声音浑浊的中低频(如 300 - 500 Hz),以获得更干净、专业的声音效果。