月度归档:2014年09月

引子:从一张大家耳熟能详的图说开去。。

这张图大家耳熟能详吧,差不多随便一个播放器都有类似这种图。比如曾经的千千静听

itunes

 

类似这种图曾经是音乐播放器的标配(现在很多播放器都取消了,或者换小图),这究竟是什么?

这就是频谱图。

那这种图究竟是做什么用的呢?我目测大部分群众理解中,这种图作用就是为了“眩酷”,这也是这种图逐渐从音乐播放器中消失的原因。

频谱图当然不是为了眩酷的,本系列文章旨在揭开此图背后传达的信息。。。

继续阅读

科学的欣赏流行乐

基础知识从头讲起:

引子:从一张大家耳熟能详的图说开去。。  https://bideyuanli.com/p/3731

第一章:音高 https://bideyuanli.com/p/3673

第二章:声音的本质:泛音 https://bideyuanli.com/p/3238

第三章:人声演示基频泛音的分离 https://bideyuanli.com/p/3418

第四章:共鸣及其原理 https://bideyuanli.com/p/426

第五章:音色与声谱图 https://bideyuanli.com/p/3671

第六章:胸腔共鸣 https://bideyuanli.com/p/3390

第七章:头腔共鸣 https://bideyuanli.com/p/780

第八章:真声,假声,头声 https://bideyuanli.com/p/3234

第九章:美声/民族/流行的区别 https://bideyuanli.com/p/500

第十章:男女声音的区别:亮度,糙度,力度 https://bideyuanli.com/p/863

第十一章:发声种类:物体振动,空气振动 https://bideyuanli.com/p/3764

第十二章:颤音 https://bideyuanli.com/p/3819

第十三章:声带闭合 https://bideyuanli.com/p/3853

第十四章:乐器的音色 https://bideyuanli.com/p/3890

第十五章:男女差八度的科学解释https://bideyuanli.com/p/4211

音高

音的高度。音的高低是由振动频率决定的,两者成正比关系:振动频率高则音”高”,反之则”低”。

基频决定音高

一个有各种泛音的声音,即使泛音比基频大得多,也依然以基频来定音高。这一点很重要。这就是为什么同唱一个音高,不同人的音色截然不同的根本原因:他们只是基频相同,泛音是截然不同的。

插入一个视频,关于音高与基频的关系

http://v.youku.com/v_show/id_XNzY5Njc4MTYw.html

音高的计量:国际谱

钢琴上每七个白键一个循环,分别叫做CDEFGAB(为何不是从A开始,而是从C开始?这是个历史问题。。。),也就是我们熟知的”Do Re Mi Fa So La Si”,过了一个循环就下标加一,又叫升八度,即,C1, C2, C3, C4…

八度有什么意义

高八度的声音,频率高一倍,也就是说,C2比C1的频率高一倍,C3比C2的频率高一倍。按照我们之前了解的,第一泛音比基频高一倍的事实。如果一个人唱C2,另一个人唱C3,那第一个人的第一泛音就会和第二个人的基频完美叠和在一起。以此类推,两人的高阶泛音也都会产生重叠。

这就是女声比男声高八度的由来:两声部差八度,则泛音可以很好的重合,这是一种很好的和声状态。

钢琴中央C是C4,中央区的A键为440Hz(即标准音高。—–那为何标准音高又是用A来制定的呢?目测是制定者想纠正前面的错误)。

红色为中央C和标准音高A

C0 Db0 D0 Eb0 E0 F0 Gb0 G0 Ab0 A0 Bb0 B0
C1 Db1 D1 Eb1 E1 F1 Gb1 G1 Ab1 A1 Bb1 B1
C2 Db2 D2 Eb2 E2 F2 Gb2 G2 Ab2 A2 Bb2 B2
C3 Db3 D3 Eb3 E3 F3 Gb3 G3 Ab3 A3 Bb3 B3
C4 Db4 D4 Eb4 E4 F4 Gb4 G4 Ab4 A4 Bb4 B4
C5 Db5 D5 Eb5 E5 F5 Gb5 G5 Ab5 A5 Bb5 B5
C6 Db6 D6 Eb6 E6 F6 Gb6 G6 Ab6 A6 Bb6 B6
C7 Db7 D7 Eb7 E7 F7 Gb7 G7 Ab7 A7 Bb7 B7
C8 Db8 D8 Eb8

在线钢琴

音高的计量:钢琴谱(女唱谱)

在唱谱中通常书写”Do Re Mi Fa So La Si”,升一个八度就在上面加一点。为了克服国际谱中数字标过大的问题(C5写成DO上5个点?坑爹啊),女唱谱中普通c即c1=国际谱C4,写作”Do”。如果升一个八度,则在字母上面标一个点,俗称“一点Do”,就是c2 = 国际谱C5。

再升八度,就是女谱里的high c,又名两点Do,c3 = 国际谱C6。

如果在普通c上降八度呢?那就在Do下面加一点。

钢琴谱在中国学院派里是通用的。

C2 #C2 D2 #D2 E2 F2 #F2 G2 #G2 A2 #A2 B2
C1 #C1 D1 #D1 E1 F1 #F1 G1 #G1 A1 #A1 B1
C #C D #D E F #F G #G A #A B
c #c d #d e f #f g #g a #a b
c1 #c1 d1 #d1 e1 f1 #f1 g1 #g1 a1 #a1 b1
c2 #c2 d2 #d2 e2 f2 #f2 g2 #g2 a2 #a2 b2
c3 #c3 d3 #d3 e3 f3 #f3 g3 #g3 a3 #a3 b3
c4 #c4 d4 #d4 e4 f4 #f4 g4 #g4 a4 #a4 b4
c5 #c5 d5 #d5

音高的计量:男唱谱

男唱谱比女唱谱低八度(也有说男唱谱高八度记谱的,不重要,领会精神就好),所以男唱谱里c1 = 国际谱C3,c2 = 国际谱C4。

C1 #C1 D1 #D1 E1 F1 #F1 G1 #G1 A1 #A1 B1
C #C D #D E F #F G #G A #A B
c #c d #d e f #f g #g a #a b
c1 #c1 d1 #d1 e1 f1 #f1 g1 #g1 a1 #a1 b1
c2 #c2 d2 #d2 e2 f2 #f2 g2 #g2 a2 #a2 b2
c3 #c3 d3 #d3 e3 f3 #f3 g3 #g3 a3 #a3 b3
c4 #c4 d4 #d4 e4 f4 #f4 g4 #g4 a4 #a4 b4
c5 #c5 d5 #d5 e5 f5 #f5 g5 #g5 a5 #a5 b5
c6 #c6 d6 #d6

通常说的男声high c,就是c3 = 国际谱C5。

女声天生比男声高一个八度?这个说法显然是不对的,这只是源于唱谱高一个八度而已,女声一般比男声高4度的样子吧。

看到这各位也明白了,这也太混乱了,不说清楚根本不知道你用的男谱还是女谱。所以我一般都是直接用国际谱,消除歧义。

音高的计量:简谱

无论是莫名其妙的”Do Re Mi fa So La Si”,还是诡异的从C开始CDEFGAB,都是极为不科学和反人类的。所以唱谱中另有一套简谱“1234567”(终于弄出点人性化的东西啊)。同样的,升一个八度上面加一点,降一个八度下面加一点。

半音

列表中带有#或b的就是半音,#为升,b为降。源自钢琴上的黑色键。见下图:

注意,7个全音只有5个半音。e和f之间,b和c之间是没有半音的。
那是不是钢琴做疵了某些半音弹不出来呢?
当然不是!

其实半音是一个很有误导性的词。因为音高多少是由频率决定的(严格的说是频率的对数—-好吧,还是不够严谨,领会精神就好),而半音和全音之间的频率差和两个全音(如果中间没有半音)之间是完全一样的。 也就是说d和#d之间的频率差距,和e和f之间的频率差距是一样的。

所以更严谨的说法是,一个八度之间有12个半音。其中七个(CDEFGAB)叫自然音,另外五个叫变化音。自然音之间一般是隔着两个半音(相隔两个半音可以叫距离为一个全音)。也有部分自然音之间(EF,BC)只隔一个半音。

升key

群众们喜闻乐见的升key指的是升半音。所以升12key可以提高一个八度。

八度

终于说到这个令人蛋疼的概念。众所周知”Do Re Mi fa So La Si”是七个音,那为何有八度之说呢?

原因很简单,在这个系统里,没有一度!

比如C D之间,这叫二度,C E之间叫三度,以此类推。非要说有一度那也是有的,C C就是了!

可是前面我们知道自然音的间距是不等的,那怎么办?所以就有了大小之分:C D之间差2key,所以叫大二度,E F之间差1key,所以叫小二度。以此类推。所以

  1. 小二度 = 1 key
  2. 大二度 = 2 key
  3. 小三度 = 3 key
  4. 大三度 = 4 key
  5. 纯四度 = 5 key
  6. 减五度 = 6 key
  7. 纯五度 = 7 key
  8. 小六度 = 8 key
  9. 大六度 = 9 key
  10. 小七度 = 10 key
  11. 大七度 = 11 key
  12. 纯八度 = 12 key

所有有人说“今天唱xx升了小二度”,意思是升了1key。

(减五度是什么玩艺?一头是半音,比如C – Gb)

三谱对比表及频率

国际谱 男唱谱 女唱谱 频率
C0 C1 C2 16.35
C#0/Db0 #C1 #C2 17.32
D0 D1 D2 18.35
D#0/Eb0 #D1 #D2 19.45
E0 E1 E2 20.6
F0 F1 F2 21.83
F#0/Gb0 #F1 #F2 23.12
G0 G1 G2 24.5
G#0/Ab0 #G1 #G2 25.96
A0 A1 A2 27.5
A#0/Bb0 #A1 #A2 29.14
B0 B1 B2 30.87
C1 C C1 32.7
C#1/Db1 #C #C1 34.65
D1 D D1 36.71
D#1/Eb1 #D #D1 38.89
E1 E E1 41.2
F1 F F1 43.65
F#1/Gb1 #F #F1 46.25
G1 G G1 49
G#1/Ab1 #G #G1 51.91
A1 A A1 55
A#1/Bb1 #A #A1 58.27
B1 B B1 61.74
C2 c C 65.41
C#2/Db2 #c #C 69.3
D2 d D 73.42
D#2/Eb2 #d #D 77.78
E2 e E 82.41
F2 f #F 87.31
F#2/Gb2 #f F 92.5
G2 g G 98
G#2/Ab2 #g #G 103.83
A2 a A 110
A#2/Bb2 #a #A 116.54
B2 b B 123.47
C3 c1 c 130.81
C#3/Db3 #c1 #c 138.59
D3 d1 d 146.83
D#3/Eb3 #d1 #d 155.56
E3 e1 e 164.81
F3 f1 f 174.61
F#3/Gb3 #f1 #f 185
G3 g1 g 196
G#3/Ab3 #g1 #g 207.65
A3 a1 a 220
A#3/Bb3 #a1 #a 233.08
B3 b1 b 246.94
C4 c2 c1 261.63
C#4/Db4 #c2 #c1 277.18
D4 d2 d1 293.66
D#4/Eb4 #d2 #d1 311.13
E4 e2 e1 329.63
F4 f2 f1 349.23
F#4/Gb4 #f2 #f1 369.99
G4 g2 g1 392
G#4/Ab4 #g2 #g1 415.3
A4 a2 a1 440
A#4/Bb4 #a2 #a1 466.16
B4 b2 b1 493.88
C5 c3 c2 523.25
C#5/Db5 #c3 #c2 554.37
D5 d3 d2 587.33
D#5/Eb5 #d3 #d2 622.25
E5 e3 e2 659.26
F5 f3 f2 698.46
F#5/Gb5 #f3 #f2 739.99
G5 g3 g2 783.99
G#5/Ab5 #g3 #g2 830.61
A5 a3 a2 880
A#5/Bb5 #a3 #a2 932.33
B5 b3 b2 987.77
C6 c4 c3 1046.5
C#6/Db6 #c4 #c3 1108.73
D6 d4 d3 1174.66
D#6/Eb6 #d4 #d3 1244.51
E6 e4 e3 1318.51
F6 f4 f3 1396.91
F#6/Gb6 #f4 #f3 1479.98
G6 g4 g3 1567.98
G#6/Ab6 #g4 #g3 1661.22
A6 a4 a3 1760
A#6/Bb6 #a4 #a3 1864.66
B6 b4 b3 1975.53
C7 c5 c4 2093
C#7/Db7 #c5 #c4 2217.46
D7 d5 d4 2349.32
D#7/Eb7 #d5 #d4 2489.02
E7 e5 e4 2637.02
F7 f5 f4 2793.83
F#7/Gb7 #f5 #f4 2959.96
G7 g5 g4 3135.96
G#7/Ab7 #g5 #g4 3322.44
A7 a5 a4 3520
A#7/Bb7 #a5 #a4 3729.31
B7 b5 b4 3951.07
C8 c6 c5 4186.01
C#8/Db8 #c6 #c5 4434.92
D8 d6 d5 4698.64
D#8/Eb8 #d6 #d5 4978.03

音色与声谱图

泛音的种类和多少决定了音色

为什么有的人声音听起来暗,有的人听起来亮?事实上即使是唱同一个音高,大家的音色也天差地别,差别就在泛音上了。

一般来说

1. 泛音越充分的声音越饱满。

2. 低频泛音越充分的声音听起来越“厚实”,越“有力”。

3. 高频泛音越充分的声音穿透力越强,声音听起来越“亮”,越“尖”。

4. 高低频都有并且合理分布的声音,就是比较完美的声音。

声乐理论里,一般把低频泛音叫低位置共鸣,高频泛音叫高位置共鸣。

频谱图/声谱图

频谱图/声谱图是观察泛音的最好办法。

相信看了第一章的频谱图演示,应该已经很清楚频谱图的含义了

频谱图就是描述在某一时间点上,各个频率的声音分布情况。这张图自己就解释的很清楚了吧~

然而,频谱图只能描述某一时间点,不能表达一段时间的情况,所以把频谱连续的画到一张图里,就有了声谱图(这个翻译有点蛋疼)。

此图由两部分组成,上半部分为声谱图(Spectrogram),下半部分为频谱图(Spectrum)。

先看上图:

横坐标是时间,纵坐标是频率值,同一时间的纵线上存在着数个波,重合而成最终的波。颜色越亮则表示波的振幅越大。混乱的背景都是伴奏,我们只观察人声线。

再看下图:

下图反映了上图的某个时间点(上图中的黄线)的频率分布。横坐标为频率,纵坐标为振幅。这个图更有利于直观的观察泛音的成分和强弱。

频谱/声谱图是如何制作的

此段很学术,没兴趣的可以略过。

我们都知道原始的声音是波形图,不过原始的波形图并没有太大研究价值,而且事实上也看不出“波形”。因为震动频率太高,比如帕瓦罗蒂的high c吧,500多的震动频率,表示一秒钟要震动500多次,那肯定是看上去一大坨,类似这样:

放大几十倍之后,大约能看出波形,类似这样

无论哪种都不适合研究。

所以音频解析的过程是:取连续采样点,一般是4096个点,考虑到音频文件的采样率一般是44.1k,所以就是取了1/10秒之内的数据。然后对这4096个点作做快速傅里叶变换,就得到了频谱图。频谱图的信息是4096个点,每一个点对应的是这个频率上的振幅。

频谱图反应的是在这个时间点上的频率分布情况。

严格的说应该是这1/10秒内的平均情况。

来一张典型频谱图,看看跟我的图下部是不是一回事:

将当前时间点的频谱画到声谱图里就得到了瀑布图(第二章视频中的图)。画法是:振幅越大的点,用越亮的颜色。

纵坐标是频率,从下到上大约是0到6000。

所以一个人唱了个C5,那他的基频就大概是500,第一泛音是1000,第二泛音是1500,画到声谱图上的结果就是从下到上每隔500画一个点,根据振幅有颜色的区别。

随着时间的推移,声谱图会不断向右延伸,这样我们就得到了一段时间内频率分布图。比如一个C5的线在声谱图上水平延续了5秒,那表示该歌手唱了C5五秒。

声谱图上类似“波”的东西是颤音,也就是歌手演唱中不断改变音高,所以自然会不断改变纵坐标。

来一张wiki的声谱图:

最后,频谱图/声谱图的wiki链接

链接出处

声谱图上出现的水平线有什么意义?

水平线表示一个歌手在某个音高上持续了一段时间。越亮的线表示振幅越大,听感上当然就音量大了。

直线就是一个长直音。考察长直音主要看稳定度,整个线越直则这个长音越稳,如果大抖就是破音,如果小抖就是不稳。如果歪了,那就是音准没把握好。

波浪线就是颤音。波浪越大则颤音越大。看颤音也是看稳定度,如果颤的不稳就是气息出现问题,控制不好。

如何看共鸣?

看泛音主要看三点:丰富与否;分布情况;泛音的音量。

点看全图

一般来说,所谓的泛音强弱都是和自己的基频来比的(或者是跟伴奏比)。因为音频文件的音量是可以调的,单纯看泛音大小没多大意义,以基频为参照才比较有实际意义。(低频的共鸣情况取决于元音的类型,每一个元音都有其特定的共鸣特性。一般来说,基频被共鸣强化的情况比较少。)

可以看到,此例中第一泛音巨大(看多了就知道,一般都是第一泛音最大),在3000左右的三个泛音也很强。

另一种观察方法就是和伴奏比,人声线越明显则人声越强,越能穿透伴奏。

如上图,左边张雨生的人声线显然更明显。右边那英的线就不明显多了,混在伴奏里。

再来看另一个例子

后知后觉对比版

http://v.youku.com/v_show/id_XNjI1NTAxMzQ4.html

点看全图

张雨生后知后觉清唱“你不辞冰雪”,竟然有如此大的高频泛音!

要知道,这可是清唱,中音区!唱高音的时候鼓足了气,有很大的共鸣很正常,但唱低缓的主歌,竟然也能爆出这么大的泛音!只能说宝哥太逆天!

下面,请出阿妹躺枪:

点看全图

(图中竖线为背景音,就是那个类似指响的声音)

泛音少太多了。。。。

听感上也是很显然的,阿妹的音色暗的多,而宝哥的非常的清亮。

当然,必须要说明:宝哥占了cd版的优势。不过我们关注的是最终听感,声音经过怎么处理并不是我们关注的重点。这个例子很好的对比了泛音对音色的影响。

如何看音准?

我的软件特别加了标准音高线,以及标准的泛音线,所以可以很清楚的看清音准:

点看全图

蓝色标准线比较暗,大家仔细看。。(太亮的话会干扰声音线)

下面有请躺枪天后阿妹展示一下音准不好是什么样的:

点看全图

很明显,比E5高,越到高频差得越远。(高频会放大差值)

点看全图

提高1key看看,又低了。这次差得更远。

所以可以判定,阿妹唱到了E5 . 5。

再看几个例子

点看全图

帕瓦罗蒂大师,堪称全频段制霸了。大家都知道帕瓦罗蒂的C5是无敌的。

点看全图

磊叔传说中的五百年。也差不多全频段制霸了。

多说两句:

上面的例子看的很明显吧,人声基本都本着标准的

基频/第一泛音(基频的二倍)/第二泛音(基频的三倍)/….

来的。自然界物体振动发声,绝大多数都是这样的。

如何自己看图?

对不起,我的软件不能外传,因为一旦落入别有用心的人手里,后果堪忧,比如这个http://tieba.baidu.com/p/2795531384

想自己看图最方便的是foobar:

通过点击 View(视图) > Visualizations(可视化) > Spectrogram(声谱)

可以调出声谱view,再播放音乐的时候,声谱就会即时出现了。

类似的,Spectrum就是频谱图。

或者Spectrogram这个软件也不错。

对我有质疑的话,可以用如上的办法自己看图,看看跟我的图是不是一样。