页面截图:
1. 基本使用说明
点击麦克图标可选麦克输入,右侧可选本地mp3文件。系统监测到的音高,会同步的出现在钢琴上(红色高亮)。
点击黑色图谱区域可以暂停,再点继续。鼠标在图表区移动会出现对应音高线。
点击钢琴可以播放对应的钢琴键。(播放不出说明音频缓冲失败,网速问题)
2. 我的浏览器不支持啊?手机能用么?
推荐使用Chrome / Firefox。
原则上讲支持手机,不过也看浏览器,还是推荐Chrome。
据群众反应iPhone上无论什么浏览器都无法使用麦克,没办法,这是苹果的锅。Android Chrome是可以的。
3. 本地文件除了mp3,还支持什么格式?为什么我的mp3不行?
支持什么文件是浏览器说了算,理论上讲未来浏览器会支持所有音频格式。
mp3不行说明你的浏览器太老了!
4. 测出的D5, C4什么的我不懂啊?
请看科普文章“音高”:https://bideyuanli.com/p/3673
如果你不习惯使用国际谱,可以切换至以下版本:
钢琴谱(女唱谱,学院派通用):https://bideyuanli.com/p?pitch_name=woman
男唱谱(高音吧通用):https://bideyuanli.com/p?pitch_name=man
5. “男高音”,“女高音”之类的音域,是按什么标准?
这是传统歌剧的划分标准。歌剧中的音域为“有效音域”,即:能发出相当的音量,能咬字,能转音颤音等等。歌剧中的音域并不明确要求真声还是假声。比如男低音基本都是真声,女高音基本都是假声。
实践上来说,这是个相当不好把握的标准。。。对于一个只嚎ktv的普通人来说,一般的情况是这样的:
男声真声极限一般在F4。如果不用混声,纯真声到G4以上,一般是天生男高音。会用一点方法的一般可以嚎到B4不变假声。
女声真声极限一般在B4吧。女声混假声的多,我也不知道准确高度。
假声/头声一般比真声高八度。所以dps全开的瞎jb嚎,男声一般可以到F5 ~ G5。女声尖叫的话因人而异,差别很大。
一个比较有效的量化标准:
男:大海Bb4,没离开过B4,She’s Gone头声G5
女:煎熬Gb5,青藏高原B5
6. 测出的音高不准啊!
讲真,我没有发现完全准的算法。这个算法是我自己写的,主要针对清唱(对着麦嚎)。带伴奏测几乎是一定不准的。
如果你是需要准确测量的高端客户,请观看“如何手动测音高”一节,那个完全准确。
7. 测出的“真声”,“假声”准确么?
不准。游戏之作,请勿认真。
8. 都不准你还搞这么多干屁!
我蛋疼。
9. 如何手动测音高?
举例:我期待的say goodbye长音。播放至长音处暂停,得到如下图:
移动鼠标到合理的位置,原则是泛音线尽可能的覆盖更多的人声线:
结论是:音高 Db5
如何判断哪条是人声线?伴奏线集中在低频(1000以下),其他一般是人声线。
如果无法判断自己标得线对不对,可以来“比的原理吧”寻求帮助,@比的原理
http://tieba.baidu.com/f?kw=%B1%C8%B5%C4%D4%AD%C0%ED
10. 我还是不懂,请楼主帮忙测一下xx歌!
请自备mp3下载链接,列出要测的是x分x秒。
11. “泛音”是什么?
科普文章:https://bideyuanli.com/p/3238
12. 频谱图什么的,有什么用?
任何音频处理,都离不开频谱图/声谱图。从mp3压缩,到语音识别,修音,只要你想处理音频,就必须用到频谱图。
13. 我看不懂图啊!
需要学习一系列科普文章:https://bideyuanli.com/p/3668
原则上讲,任何人耳能听出的内容都能从图上看出来。当然现实的讲,很难。除了音高容易看出外,还有一些比较简单的:
- 2000Hz以上可以叫头腔共鸣区域,这个区的人声线越多越亮,则头腔共鸣越强。2000Hz以下的算胸腔共鸣。详情见 https://bideyuanli.com/p/3390
- 一团团不成线的雾状物,一般是边缘音,就是喘气,气声,齿音,卡痰等等。
- 主人声线周围出现分裂的小线,一般是嘶吼。
- 线越直则音越稳。如果是颤音,则是波浪线。清晰规则的波浪线表明这是一个漂亮的颤音。
14. 你的颜色我不爽,有办法改么?
本页面支持多种参数,有兴趣的可以自行发掘,比如:
黄色声谱图:https://bideyuanli.com/p?fill_color=FFEB3B
想看更高频率的(8000Hz):https://bideyuanli.com/p?fft_scale=1&fft_size=1024
想看更低频率的:https://bideyuanli.com/p?fft_scale=4
极速版(损失精度):https://bideyuanli.com/p?fft_size=512&fps=20&fft_scale=4&show_spec=false
降噪版:https://bideyuanli.com/p?min_eng=80
以下参数应该是比较常用的:(值都是默认值)
pitch_name=inter
range_name=man_high
color_alpha=220
spec_background_color=000000
fill_color=4FC3F7
stroke_color=0277BD
spec_text_color=212121
vspec_pitch_color=F44336
pitch_color=F44336
overtone_color=F57F17
mouse_pitch_color=F9A825
mouse_pitch_piano_color=F9A825
line_color=795548
博主,能否分享一下您的音高检测代码?万分感谢~~~
js,本来就是随便看的
楼主想了解一下通过音频得知按的哪个琴键的算法
是用短时傅里叶变换吗?我之前用matlab识别自己的录音根本识别不出来,博主能交流一下吗
请问你的转化为频谱之后,又用了什么算法呢
我随便做了下,但是发现泛音的幅度实在是太小了,对比网页上的,发现你的泛音幅度被放大了【或者说基音被缩小了?】,不知道是什么算法呢?
取对数,用db这个单位
我自己清唱了两首歌曲一首歌曲带高音,最后显示的是Gb4真声,不过还有更高但我觉得就不太准确了.一般就维持在Gb4了。是不是说我唱歌高音适合唱高音???还有一首是“滚滚长江东逝水”低音是F2真声,是不是说低音只能唱到F2了???
Gb4不算太高吧,正常男人的范畴。低音F2也算正常范畴。
博主…我来问一下你的频谱图从 wp-content\uploads\2014\03 加载的那些单音的MP3是从哪里获得的呢? 你还有没有其他乐器(弦乐、管乐等)类似的MP3? 我想研究一下不同乐器的频谱特征…
midi截取,没多大参考价值,非常的不真实。
请问一下频谱图下面的每一帧的频率分布图(?)是怎么做出来的啊?我想分析每个音高,想得到下面的图,再通过标准音高频率对应起来,进行音高分析,我试过几个方法,出来的频率分布跟标准音高差太多了,完全对应不上。
fft,频谱图,声图谱,你学一下这些概念,大概就懂了。
请问博主使用的窗口大小,和hop_length是多少呢 我总是画不出您这么好的效果
好像就挺普通的窗口吧
我发现新版的Chrome浏览器,如果直接打开链接是不能正常工作的,提示
The AudioContext was not allowed to start. It must be resumed (or created) after a user gesture on the page. https://goo.gl/7K7WLu
需要手动调用 getAudioContext().resume()
min_eng: 60,
max_eng: 140,
eng_delta: 20,
请问这几个值是如何推导出来的? 我的fft结果数据都是0-1之间的浮点数 怎么去定义对应的 min_eng,max_eng,eng_delta
我的数据经过一些放大
我来自ccf、交大,希望能与您深入交流,期望留个邮箱或者其他联系方式
早已退出这个领域