这张图大家耳熟能详吧,差不多随便一个播放器都有类似这种图。比如曾经的千千静听
itunes
类似这种图曾经是音乐播放器的标配(现在很多播放器都取消了,或者换小图),这究竟是什么?
这就是频谱图。
那这种图究竟是做什么用的呢?我目测大部分群众理解中,这种图作用就是为了“眩酷”,这也是这种图逐渐从音乐播放器中消失的原因。
频谱图当然不是为了眩酷的,本系列文章旨在揭开此图背后传达的信息。。。
这张图大家耳熟能详吧,差不多随便一个播放器都有类似这种图。比如曾经的千千静听
itunes
类似这种图曾经是音乐播放器的标配(现在很多播放器都取消了,或者换小图),这究竟是什么?
这就是频谱图。
那这种图究竟是做什么用的呢?我目测大部分群众理解中,这种图作用就是为了“眩酷”,这也是这种图逐渐从音乐播放器中消失的原因。
频谱图当然不是为了眩酷的,本系列文章旨在揭开此图背后传达的信息。。。
基础知识从头讲起:
引子:从一张大家耳熟能详的图说开去。。 https://bideyuanli.com/p/3731
第一章:音高 https://bideyuanli.com/p/3673
第二章:声音的本质:泛音 https://bideyuanli.com/p/3238
第三章:人声演示基频泛音的分离 https://bideyuanli.com/p/3418
第四章:共鸣及其原理 https://bideyuanli.com/p/426
第五章:音色与声谱图 https://bideyuanli.com/p/3671
第六章:胸腔共鸣 https://bideyuanli.com/p/3390
第七章:头腔共鸣 https://bideyuanli.com/p/780
第八章:真声,假声,头声 https://bideyuanli.com/p/3234
第九章:美声/民族/流行的区别 https://bideyuanli.com/p/500
第十章:男女声音的区别:亮度,糙度,力度 https://bideyuanli.com/p/863
第十一章:发声种类:物体振动,空气振动 https://bideyuanli.com/p/3764
第十二章:颤音 https://bideyuanli.com/p/3819
第十三章:声带闭合 https://bideyuanli.com/p/3853
第十四章:乐器的音色 https://bideyuanli.com/p/3890
第十五章:男女差八度的科学解释https://bideyuanli.com/p/4211
音的高度。音的高低是由振动频率决定的,两者成正比关系:振动频率高则音”高”,反之则”低”。
基频决定音高
一个有各种泛音的声音,即使泛音比基频大得多,也依然以基频来定音高。这一点很重要。这就是为什么同唱一个音高,不同人的音色截然不同的根本原因:他们只是基频相同,泛音是截然不同的。
插入一个视频,关于音高与基频的关系
http://v.youku.com/v_show/id_XNzY5Njc4MTYw.html
钢琴上每七个白键一个循环,分别叫做CDEFGAB(为何不是从A开始,而是从C开始?这是个历史问题。。。),也就是我们熟知的”Do Re Mi Fa So La Si”,过了一个循环就下标加一,又叫升八度,即,C1, C2, C3, C4…
八度有什么意义
高八度的声音,频率高一倍,也就是说,C2比C1的频率高一倍,C3比C2的频率高一倍。按照我们之前了解的,第一泛音比基频高一倍的事实。如果一个人唱C2,另一个人唱C3,那第一个人的第一泛音就会和第二个人的基频完美叠和在一起。以此类推,两人的高阶泛音也都会产生重叠。
这就是女声比男声高八度的由来:两声部差八度,则泛音可以很好的重合,这是一种很好的和声状态。
钢琴中央C是C4,中央区的A键为440Hz(即标准音高。—–那为何标准音高又是用A来制定的呢?目测是制定者想纠正前面的错误)。
红色为中央C和标准音高A
C0 | Db0 | D0 | Eb0 | E0 | F0 | Gb0 | G0 | Ab0 | A0 | Bb0 | B0 |
C1 | Db1 | D1 | Eb1 | E1 | F1 | Gb1 | G1 | Ab1 | A1 | Bb1 | B1 |
C2 | Db2 | D2 | Eb2 | E2 | F2 | Gb2 | G2 | Ab2 | A2 | Bb2 | B2 |
C3 | Db3 | D3 | Eb3 | E3 | F3 | Gb3 | G3 | Ab3 | A3 | Bb3 | B3 |
C4 | Db4 | D4 | Eb4 | E4 | F4 | Gb4 | G4 | Ab4 | A4 | Bb4 | B4 |
C5 | Db5 | D5 | Eb5 | E5 | F5 | Gb5 | G5 | Ab5 | A5 | Bb5 | B5 |
C6 | Db6 | D6 | Eb6 | E6 | F6 | Gb6 | G6 | Ab6 | A6 | Bb6 | B6 |
C7 | Db7 | D7 | Eb7 | E7 | F7 | Gb7 | G7 | Ab7 | A7 | Bb7 | B7 |
C8 | Db8 | D8 | Eb8 |
在唱谱中通常书写”Do Re Mi Fa So La Si”,升一个八度就在上面加一点。为了克服国际谱中数字标过大的问题(C5写成DO上5个点?坑爹啊),女唱谱中普通c即c1=国际谱C4,写作”Do”。如果升一个八度,则在字母上面标一个点,俗称“一点Do”,就是c2 = 国际谱C5。
再升八度,就是女谱里的high c,又名两点Do,c3 = 国际谱C6。
如果在普通c上降八度呢?那就在Do下面加一点。
钢琴谱在中国学院派里是通用的。
C2 | #C2 | D2 | #D2 | E2 | F2 | #F2 | G2 | #G2 | A2 | #A2 | B2 |
C1 | #C1 | D1 | #D1 | E1 | F1 | #F1 | G1 | #G1 | A1 | #A1 | B1 |
C | #C | D | #D | E | F | #F | G | #G | A | #A | B |
c | #c | d | #d | e | f | #f | g | #g | a | #a | b |
c1 | #c1 | d1 | #d1 | e1 | f1 | #f1 | g1 | #g1 | a1 | #a1 | b1 |
c2 | #c2 | d2 | #d2 | e2 | f2 | #f2 | g2 | #g2 | a2 | #a2 | b2 |
c3 | #c3 | d3 | #d3 | e3 | f3 | #f3 | g3 | #g3 | a3 | #a3 | b3 |
c4 | #c4 | d4 | #d4 | e4 | f4 | #f4 | g4 | #g4 | a4 | #a4 | b4 |
c5 | #c5 | d5 | #d5 |
男唱谱比女唱谱低八度(也有说男唱谱高八度记谱的,不重要,领会精神就好),所以男唱谱里c1 = 国际谱C3,c2 = 国际谱C4。
C1 | #C1 | D1 | #D1 | E1 | F1 | #F1 | G1 | #G1 | A1 | #A1 | B1 |
C | #C | D | #D | E | F | #F | G | #G | A | #A | B |
c | #c | d | #d | e | f | #f | g | #g | a | #a | b |
c1 | #c1 | d1 | #d1 | e1 | f1 | #f1 | g1 | #g1 | a1 | #a1 | b1 |
c2 | #c2 | d2 | #d2 | e2 | f2 | #f2 | g2 | #g2 | a2 | #a2 | b2 |
c3 | #c3 | d3 | #d3 | e3 | f3 | #f3 | g3 | #g3 | a3 | #a3 | b3 |
c4 | #c4 | d4 | #d4 | e4 | f4 | #f4 | g4 | #g4 | a4 | #a4 | b4 |
c5 | #c5 | d5 | #d5 | e5 | f5 | #f5 | g5 | #g5 | a5 | #a5 | b5 |
c6 | #c6 | d6 | #d6 |
通常说的男声high c,就是c3 = 国际谱C5。
女声天生比男声高一个八度?这个说法显然是不对的,这只是源于唱谱高一个八度而已,女声一般比男声高4度的样子吧。
看到这各位也明白了,这也太混乱了,不说清楚根本不知道你用的男谱还是女谱。所以我一般都是直接用国际谱,消除歧义。
无论是莫名其妙的”Do Re Mi fa So La Si”,还是诡异的从C开始CDEFGAB,都是极为不科学和反人类的。所以唱谱中另有一套简谱“1234567”(终于弄出点人性化的东西啊)。同样的,升一个八度上面加一点,降一个八度下面加一点。
列表中带有#或b的就是半音,#为升,b为降。源自钢琴上的黑色键。见下图:
注意,7个全音只有5个半音。e和f之间,b和c之间是没有半音的。
那是不是钢琴做疵了某些半音弹不出来呢?
当然不是!
其实半音是一个很有误导性的词。因为音高多少是由频率决定的(严格的说是频率的对数—-好吧,还是不够严谨,领会精神就好),而半音和全音之间的频率差和两个全音(如果中间没有半音)之间是完全一样的。 也就是说d和#d之间的频率差距,和e和f之间的频率差距是一样的。
所以更严谨的说法是,一个八度之间有12个半音。其中七个(CDEFGAB)叫自然音,另外五个叫变化音。自然音之间一般是隔着两个半音(相隔两个半音可以叫距离为一个全音)。也有部分自然音之间(EF,BC)只隔一个半音。
群众们喜闻乐见的升key指的是升半音。所以升12key可以提高一个八度。
终于说到这个令人蛋疼的概念。众所周知”Do Re Mi fa So La Si”是七个音,那为何有八度之说呢?
原因很简单,在这个系统里,没有一度!
比如C D之间,这叫二度,C E之间叫三度,以此类推。非要说有一度那也是有的,C C就是了!
可是前面我们知道自然音的间距是不等的,那怎么办?所以就有了大小之分:C D之间差2key,所以叫大二度,E F之间差1key,所以叫小二度。以此类推。所以
所有有人说“今天唱xx升了小二度”,意思是升了1key。
(减五度是什么玩艺?一头是半音,比如C – Gb)
国际谱 | 男唱谱 | 女唱谱 | 频率 |
---|---|---|---|
C0 | C1 | C2 | 16.35 |
C#0/Db0 | #C1 | #C2 | 17.32 |
D0 | D1 | D2 | 18.35 |
D#0/Eb0 | #D1 | #D2 | 19.45 |
E0 | E1 | E2 | 20.6 |
F0 | F1 | F2 | 21.83 |
F#0/Gb0 | #F1 | #F2 | 23.12 |
G0 | G1 | G2 | 24.5 |
G#0/Ab0 | #G1 | #G2 | 25.96 |
A0 | A1 | A2 | 27.5 |
A#0/Bb0 | #A1 | #A2 | 29.14 |
B0 | B1 | B2 | 30.87 |
C1 | C | C1 | 32.7 |
C#1/Db1 | #C | #C1 | 34.65 |
D1 | D | D1 | 36.71 |
D#1/Eb1 | #D | #D1 | 38.89 |
E1 | E | E1 | 41.2 |
F1 | F | F1 | 43.65 |
F#1/Gb1 | #F | #F1 | 46.25 |
G1 | G | G1 | 49 |
G#1/Ab1 | #G | #G1 | 51.91 |
A1 | A | A1 | 55 |
A#1/Bb1 | #A | #A1 | 58.27 |
B1 | B | B1 | 61.74 |
C2 | c | C | 65.41 |
C#2/Db2 | #c | #C | 69.3 |
D2 | d | D | 73.42 |
D#2/Eb2 | #d | #D | 77.78 |
E2 | e | E | 82.41 |
F2 | f | #F | 87.31 |
F#2/Gb2 | #f | F | 92.5 |
G2 | g | G | 98 |
G#2/Ab2 | #g | #G | 103.83 |
A2 | a | A | 110 |
A#2/Bb2 | #a | #A | 116.54 |
B2 | b | B | 123.47 |
C3 | c1 | c | 130.81 |
C#3/Db3 | #c1 | #c | 138.59 |
D3 | d1 | d | 146.83 |
D#3/Eb3 | #d1 | #d | 155.56 |
E3 | e1 | e | 164.81 |
F3 | f1 | f | 174.61 |
F#3/Gb3 | #f1 | #f | 185 |
G3 | g1 | g | 196 |
G#3/Ab3 | #g1 | #g | 207.65 |
A3 | a1 | a | 220 |
A#3/Bb3 | #a1 | #a | 233.08 |
B3 | b1 | b | 246.94 |
C4 | c2 | c1 | 261.63 |
C#4/Db4 | #c2 | #c1 | 277.18 |
D4 | d2 | d1 | 293.66 |
D#4/Eb4 | #d2 | #d1 | 311.13 |
E4 | e2 | e1 | 329.63 |
F4 | f2 | f1 | 349.23 |
F#4/Gb4 | #f2 | #f1 | 369.99 |
G4 | g2 | g1 | 392 |
G#4/Ab4 | #g2 | #g1 | 415.3 |
A4 | a2 | a1 | 440 |
A#4/Bb4 | #a2 | #a1 | 466.16 |
B4 | b2 | b1 | 493.88 |
C5 | c3 | c2 | 523.25 |
C#5/Db5 | #c3 | #c2 | 554.37 |
D5 | d3 | d2 | 587.33 |
D#5/Eb5 | #d3 | #d2 | 622.25 |
E5 | e3 | e2 | 659.26 |
F5 | f3 | f2 | 698.46 |
F#5/Gb5 | #f3 | #f2 | 739.99 |
G5 | g3 | g2 | 783.99 |
G#5/Ab5 | #g3 | #g2 | 830.61 |
A5 | a3 | a2 | 880 |
A#5/Bb5 | #a3 | #a2 | 932.33 |
B5 | b3 | b2 | 987.77 |
C6 | c4 | c3 | 1046.5 |
C#6/Db6 | #c4 | #c3 | 1108.73 |
D6 | d4 | d3 | 1174.66 |
D#6/Eb6 | #d4 | #d3 | 1244.51 |
E6 | e4 | e3 | 1318.51 |
F6 | f4 | f3 | 1396.91 |
F#6/Gb6 | #f4 | #f3 | 1479.98 |
G6 | g4 | g3 | 1567.98 |
G#6/Ab6 | #g4 | #g3 | 1661.22 |
A6 | a4 | a3 | 1760 |
A#6/Bb6 | #a4 | #a3 | 1864.66 |
B6 | b4 | b3 | 1975.53 |
C7 | c5 | c4 | 2093 |
C#7/Db7 | #c5 | #c4 | 2217.46 |
D7 | d5 | d4 | 2349.32 |
D#7/Eb7 | #d5 | #d4 | 2489.02 |
E7 | e5 | e4 | 2637.02 |
F7 | f5 | f4 | 2793.83 |
F#7/Gb7 | #f5 | #f4 | 2959.96 |
G7 | g5 | g4 | 3135.96 |
G#7/Ab7 | #g5 | #g4 | 3322.44 |
A7 | a5 | a4 | 3520 |
A#7/Bb7 | #a5 | #a4 | 3729.31 |
B7 | b5 | b4 | 3951.07 |
C8 | c6 | c5 | 4186.01 |
C#8/Db8 | #c6 | #c5 | 4434.92 |
D8 | d6 | d5 | 4698.64 |
D#8/Eb8 | #d6 | #d5 | 4978.03 |
泛音的种类和多少决定了音色
为什么有的人声音听起来暗,有的人听起来亮?事实上即使是唱同一个音高,大家的音色也天差地别,差别就在泛音上了。
一般来说
1. 泛音越充分的声音越饱满。
2. 低频泛音越充分的声音听起来越“厚实”,越“有力”。
3. 高频泛音越充分的声音穿透力越强,声音听起来越“亮”,越“尖”。
4. 高低频都有并且合理分布的声音,就是比较完美的声音。
声乐理论里,一般把低频泛音叫低位置共鸣,高频泛音叫高位置共鸣。
频谱图/声谱图
频谱图/声谱图是观察泛音的最好办法。
相信看了第一章的频谱图演示,应该已经很清楚频谱图的含义了
频谱图就是描述在某一时间点上,各个频率的声音分布情况。这张图自己就解释的很清楚了吧~
然而,频谱图只能描述某一时间点,不能表达一段时间的情况,所以把频谱连续的画到一张图里,就有了声谱图(这个翻译有点蛋疼)。
此图由两部分组成,上半部分为声谱图(Spectrogram),下半部分为频谱图(Spectrum)。
先看上图:
横坐标是时间,纵坐标是频率值,同一时间的纵线上存在着数个波,重合而成最终的波。颜色越亮则表示波的振幅越大。混乱的背景都是伴奏,我们只观察人声线。
再看下图:
下图反映了上图的某个时间点(上图中的黄线)的频率分布。横坐标为频率,纵坐标为振幅。这个图更有利于直观的观察泛音的成分和强弱。
此段很学术,没兴趣的可以略过。
我们都知道原始的声音是波形图,不过原始的波形图并没有太大研究价值,而且事实上也看不出“波形”。因为震动频率太高,比如帕瓦罗蒂的high c吧,500多的震动频率,表示一秒钟要震动500多次,那肯定是看上去一大坨,类似这样:
放大几十倍之后,大约能看出波形,类似这样
无论哪种都不适合研究。
所以音频解析的过程是:取连续采样点,一般是4096个点,考虑到音频文件的采样率一般是44.1k,所以就是取了1/10秒之内的数据。然后对这4096个点作做快速傅里叶变换,就得到了频谱图。频谱图的信息是4096个点,每一个点对应的是这个频率上的振幅。
频谱图反应的是在这个时间点上的频率分布情况。
严格的说应该是这1/10秒内的平均情况。
来一张典型频谱图,看看跟我的图下部是不是一回事:
将当前时间点的频谱画到声谱图里就得到了瀑布图(第二章视频中的图)。画法是:振幅越大的点,用越亮的颜色。
纵坐标是频率,从下到上大约是0到6000。
所以一个人唱了个C5,那他的基频就大概是500,第一泛音是1000,第二泛音是1500,画到声谱图上的结果就是从下到上每隔500画一个点,根据振幅有颜色的区别。
随着时间的推移,声谱图会不断向右延伸,这样我们就得到了一段时间内频率分布图。比如一个C5的线在声谱图上水平延续了5秒,那表示该歌手唱了C5五秒。
声谱图上类似“波”的东西是颤音,也就是歌手演唱中不断改变音高,所以自然会不断改变纵坐标。
来一张wiki的声谱图:
最后,频谱图/声谱图的wiki链接
水平线表示一个歌手在某个音高上持续了一段时间。越亮的线表示振幅越大,听感上当然就音量大了。
直线就是一个长直音。考察长直音主要看稳定度,整个线越直则这个长音越稳,如果大抖就是破音,如果小抖就是不稳。如果歪了,那就是音准没把握好。
波浪线就是颤音。波浪越大则颤音越大。看颤音也是看稳定度,如果颤的不稳就是气息出现问题,控制不好。
如何看共鸣?
看泛音主要看三点:丰富与否;分布情况;泛音的音量。
一般来说,所谓的泛音强弱都是和自己的基频来比的(或者是跟伴奏比)。因为音频文件的音量是可以调的,单纯看泛音大小没多大意义,以基频为参照才比较有实际意义。(低频的共鸣情况取决于元音的类型,每一个元音都有其特定的共鸣特性。一般来说,基频被共鸣强化的情况比较少。)
可以看到,此例中第一泛音巨大(看多了就知道,一般都是第一泛音最大),在3000左右的三个泛音也很强。
另一种观察方法就是和伴奏比,人声线越明显则人声越强,越能穿透伴奏。
如上图,左边张雨生的人声线显然更明显。右边那英的线就不明显多了,混在伴奏里。
再来看另一个例子
后知后觉对比版
http://v.youku.com/v_show/id_XNjI1NTAxMzQ4.html
张雨生后知后觉清唱“你不辞冰雪”,竟然有如此大的高频泛音!
要知道,这可是清唱,中音区!唱高音的时候鼓足了气,有很大的共鸣很正常,但唱低缓的主歌,竟然也能爆出这么大的泛音!只能说宝哥太逆天!
下面,请出阿妹躺枪:
(图中竖线为背景音,就是那个类似指响的声音)
泛音少太多了。。。。
听感上也是很显然的,阿妹的音色暗的多,而宝哥的非常的清亮。
当然,必须要说明:宝哥占了cd版的优势。不过我们关注的是最终听感,声音经过怎么处理并不是我们关注的重点。这个例子很好的对比了泛音对音色的影响。
如何看音准?
我的软件特别加了标准音高线,以及标准的泛音线,所以可以很清楚的看清音准:
蓝色标准线比较暗,大家仔细看。。(太亮的话会干扰声音线)
下面有请躺枪天后阿妹展示一下音准不好是什么样的:
很明显,比E5高,越到高频差得越远。(高频会放大差值)
提高1key看看,又低了。这次差得更远。
所以可以判定,阿妹唱到了E5 . 5。
再看几个例子
帕瓦罗蒂大师,堪称全频段制霸了。大家都知道帕瓦罗蒂的C5是无敌的。
磊叔传说中的五百年。也差不多全频段制霸了。
多说两句:
上面的例子看的很明显吧,人声基本都本着标准的
基频/第一泛音(基频的二倍)/第二泛音(基频的三倍)/….
来的。自然界物体振动发声,绝大多数都是这样的。
如何自己看图?
对不起,我的软件不能外传,因为一旦落入别有用心的人手里,后果堪忧,比如这个http://tieba.baidu.com/p/2795531384
想自己看图最方便的是foobar:
通过点击 View(视图) > Visualizations(可视化) > Spectrogram(声谱)
可以调出声谱view,再播放音乐的时候,声谱就会即时出现了。
类似的,Spectrum就是频谱图。
或者Spectrogram这个软件也不错。
对我有质疑的话,可以用如上的办法自己看图,看看跟我的图是不是一样。