关于音频文件的音量平衡

http://v.youku.com/v_show/id_XNjU4NDIyMzA4.html

这真是个冗长的话题,从哪里开始呢?

 

分贝

我们都知道分贝是用来衡量音量大小的单位。但有多少人知道分贝只是一个相对单位呢?分贝其实是一个广泛应用的单位,声光电都行。在声音领域,分贝的基准是:

人类的最少听觉响应值(大约是3米以外飞行的蚊子声音)为0分贝。

从维基百科抄到如下的公式:

很简单,每提高10分贝,声能提高10倍。每提高20分贝,声压(振幅)提高10倍。

所以看似60分贝和70分贝没多大区别,其实声能差一个数量级。。。

  • -80分贝:核潜艇的麦克风在水下听到的100米外一只虾咀嚼食物的声音
  • -30分贝:20英里外一个人的说话声
  • 0分贝:10英尺(约3米)外一只蚊子在飞
  • 10分贝:非常安静的房间
  • 13分贝:灯泡的嗡嗡声
  • 15分贝:1米外一根别针从1厘米的高度掉落下来的声音
  • 20分贝:乡村的夜晚
  • 30分贝:沙漠的夜晚
  • 40-60分贝:正常谈话的声音
  • 50-53分贝:洗衣机的工作声
  • 60-80分贝:10米外经过的汽车
  • 70分贝:10英尺(约3米)外的真空吸尘器;美国环保署认定的人类能忍受(不产生听力损失、睡眠障碍、焦虑、学习障碍等)的最大噪音
  • 85分贝:长期作用下会引起听力损伤
  • 90分贝:10英尺(约3米)外经过的公共汽车或卡车;食物搅拌机
  • 100分贝:一般家用音响设备的最大音量
  • 104-107分贝:开始引起疼痛的声音(在2750Hz的频率下)
  • 110-140分贝:100米外的喷气式飞机引擎
  • 116分贝:人体开始感觉到振动的声音(在低频率下)
  • 120-130分贝:摇滚演唱会的最前排
  • 127分贝:开始引起耳鸣的声音
  • 128分贝:在8.2英尺(约2.5米)外测量到的人类最大的尖叫声
  • 140分贝:即使声音时间很短,也会引起听力损伤
  • 141分贝:开始引起恶心感觉的声音
  • 168分贝:M1加兰德步枪在1米外开火
  • 175.8分贝:250英尺(约75米)外1吨TNT炸药爆炸
  • 192.8-194.7分贝:地球大气压理论上能传播的最大强度声音

人声演唱的范畴?不知道,目测50-90是比较靠谱的数据,也就是说,人声演唱跨越几个数量级还是很轻松的。这简直是废话,轻声细语的浅吟低唱,能和美声放开了彪的音量相同么?(还是老话,美声歌手如果面对面给你秀一个,肯定震你一个跟头)

人声为何可以跨这么大的音量?

因为共鸣可以极大的放大音量。为什么声乐界这么强调共鸣?就是因为好的歌声,都是共鸣占主体的。有人说过(是付林?):好的声音就是1%的声带摩擦 + 99%的共鸣。非常正确,真正的歌声都是共鸣声,声带本来的声音不可能有这么大的音量的,而共鸣扩大两个数量级的音量实在太正常了。(题外话,个人不同意“声带摩擦”的说法)

音频文件的实质

可是,听音频文件的时候,你有感觉到人声有这么大的音量差距么?显然没有。。这就不得不谈音频文件了。

以我们最熟悉的cd来说吧,立体声32位数据。也就是说每个声道16位,每个采样点的数据是0 – 65535。

好吧,结果很明显,音频文件绝无任何可能完全还原真实世界的声音,数据位数太少了!

事实上,我们听到的音频文件都是经过音量平衡过的,保证你一直听到一个音量差不多的声音。这个道理一点也不难懂,如果音量变化太大,结果只能是低音部分你听不清,高音部分吓一跳的局面。

相信大家都有这样的经历:在电影院看电影,人声对话感觉自然逼真,突然来个枪声,立刻被震出翔;相反的,如果在家看电影,很少出现这种局面。原因很简单,我们在家看到的下载电影,都是经过音量平衡过的,人声和枪声差距没那么大,顶多有一个数量级的差距差不多了。这是制作电影的人贴心,防止把你震出翔而已。如果你用家庭影院听过dts电影的就知道,一样可以把你震出翔。(dts的位数比cd高)

但事实上,真的很难完全还原真实世界的声音,即使是影院也不行。查上面的表我们知道:M1加兰德步枪在1米外开火168分贝;人声对话就算60分贝吧,差100分贝,也就是声能差10个数量级,振幅差5个数量级。这怎么可能完全还原。。(事实上,声音超过140分贝就已经可以造成永久听力损伤了)

提高采样率,码率什么的能解决这个问题么?

不能。。采样率跟每个采样点的位数没关系。无论多少采样率,我们见到的音频文件都是16位的(99%)。

码率就更不能了。。。码率只是代表了mp3文件的压缩程度,最好的mp3也不过就是达到cd音质而已。

视频分析

视频中很明显:姚贝娜凶残的声线亮出来的时候,伴奏音量就小了。是真实世界中伴奏音量小了么?怎么可能。。实情是:伴奏音量一直没变,只不过姚的音量比伴奏大至少一个数量级了,伴奏就小下去了。

这个视频告诉我们:录音设备是会做音量平衡的。

为什么?如上所言,音频文件只有6万多这么多的空间来记录,不可能记录跨越数量级太多的声音,只能是记录最大音量的那个,然后按照比例把次一级的声音记录下来,以此类推。如果某个音跟最大音差距太远就会损失细节:图上很明显,其他声音的颜色都变淡了,本来就淡的声音会消失,所以细节缺失了。那个尖叫就很明显,细节损失严重。

(当然还受限于手机残弱的录音设备)

另一个原因就是,音频文件的世界里,均衡音量是必须的,录音也要录成统一音量。事实上,小匹的录音中,整体音量一直是保持在一个固定水平的(可以看最上面的音量显示线)。如果真实世界音量太大,就整体缩小了再录进来。

大家可以自己做实验:用不同音量录音,其实最终录音音量都差不多的,远没有真实世界中差别那么大。

小匹被震傻的科学解释?

其实答案已经呼之欲出了:姚的音量比伴奏大太多了。真实的情况就是,在一个已经很大音量的伴奏上,突然爆出来一个更大的声音,完全掩盖了其他所有声音。会让人有强烈的瞬间制聋感(听音频也有这个感觉,但是远不如现场的感觉)。震得脑袋嗡嗡响不是虚言。

cd版为何伴奏无变化?

cd版是分别录制伴奏和人声的,当然不会有这个问题。。而且cd版会做更复杂的音量平衡,保证让你听低音的主歌和澎湃的副歌感觉都差不多。

live为何会出现这么不和谐的局面?

相信有些人要问:难道live不能把麦的音量调小一点么?这个问题就难了,你要知道,人声音量本来就跨数量级的,你把麦音量调小,主歌就听不见了;麦调大,副歌就爆伴奏。。

事实上,人们已经想了很多办法来解决这个问题,比如麦上调音量;拉麦;混音师调节等等。不过依然还是没法很好的解决这个问题。

这也是为什么这些年特别讲究“声压”的原因:没声压的歌手,真的会出现观众听不见你唱什么的局面。尤其是现在流行领域里废渣满地走,一大半根本不懂气息为何物,唱出来的主歌部分观众听不见就实属正常了。

声压低的歌手大概是这样的:

http://v.youku.com/v_show/id_XNTc3MTM5NzY0.html

http://v.youku.com/v_show/id_XNjIxMDU4OTMy.html

可以看到,到副歌部分猛喊才能让人勉强听清在唱啥,主歌想听清根本没戏。

说回姚贝娜

学院派共鸣本来就强,姚在学院派里都是变态的,声压大到惊人,还不拉麦,所以把观众震出翔实在是太正常的事。如果全力施展,也会经常压住合唱歌手(见https://bideyuanli.com/p/246)。

姚为何不自己调整一下别压住伴奏/合唱

先不说有没有这个必要(就是要震出翔的感觉!),就算真想这么干,也是比较难的。其实歌手在舞台上,很难判断下面的真实效果的,我们知道声速是300多米/秒。稍微大一点的舞台,声音都要1秒之后才能传到歌手耳朵里,歌手哪能实时的知道是什么效果?所以歌手都要带耳返,不过耳返也是播放音频。。。这又涉及音量平衡了,所以通过耳返也就只能判断个伴奏音高,伴奏节奏而已。(你看,虽然麦大大的加强了歌手的演唱,但是也产生了很多的麻烦。还是无麦时代的美声好,谁声大谁制霸,无废话)

其实姚live演唱也会有所取舍,放弃一些低声压技术,这才能保证观众听清主歌。所以一些太抒情的歌曲,其实不适合大型live演唱,比如红颜劫(小型音乐厅就好多了)。另一个角度来说,其实姚的声音条件是适合干大型摇滚的,反正摇滚就是要拼声压,只要喊出来把人震傻,任务就完成一大半了。

关于拉麦

拉麦其实并不是为了装b,本来是有其平衡音量的作用的。不过近年来已经演变成装b的专用伎俩。

比如海泉吧,一唱到高音拉的那叫一个凶残,再配上一脸卖力的表情,简直装b到极致。其实熟悉羽泉的都知道,高音部分基本是羽凡一个人独唱,海泉就一个摆设。所以他开发出了独有的拉麦法,既不影响羽凡演唱,也不显得自己是在划水,还卖了造型,一举三得。(不是黑海泉。。其实他俩的嗓子都有问题,如果单干就是双残的局面,合起来互相掩盖缺点,起到了1+1>2的作用。)

再比如曾(拉麦)一米,那是真装b,纯粹的。

听最好质量的cd能取代听现场?

不要幼稚了,不可能的。上10万块的设备也不行,先天就不行。现场的音场,其信息量绝对比cd大几个数量级不止。

那为什么我朝人没有这个“必须听现场”的概念呢?因为我朝流行歌手普遍都太残疾了,现场能不能听到声音都难说,还能谈音质?

所以,真正唱将的粉丝们,别犹豫了,赶快听听偶像的现场吧!

关于音频文件的音量平衡》有7个想法

  1. 院长大大~求问黑胶碟效果呢?最近正好要接触一些黑胶客····有个很厉害的发烧友老师是手组胆机达人····请问黑胶碟的效果真的可以堪比现场么?

    1. 模拟音频也是有存储的信息上限的,不可能无限的存储信息,比如胶片,最小也就是一个银盐分子相当于一个像素,135胶片相当于有几千万像素。磁带的话,转动速度也是固定的,磁粉数量不是无限,磁头读取能力也可以换算成大约多少K/M每秒。

      就算是模拟存储,最终也是基于原子的,总是XX个原子记录一个信息,数码存储一个信息就是一个0或1,模拟就是一个或大或小的值,总之不是无限,现在数码存储设备的容量越来越大,模拟存储肯定是不如数码的,而且数码可以无限次复制信息完全不变,模拟就更不行了。

发表评论