常见的音频频域特征有以下几种:
1. 频谱:频谱表示声音信号在不同频率下的能量分布情况,可以通过傅里叶变换将声音信号从时域转换为频域。频谱可以展示出声音信号中各个频率成分的强度信息。
2. 谱图:谱图是频谱在时间上的演化过程,可以通过对声音信号进行短时傅里叶变换得到。谱图能够展示声音信号在不同时间段以及不同频率下的时变特征,可以用于分析声音的频率、持续时间和强度等信息。
3. 频带能量:将频谱分成若干等宽的频带,计算每个频带内的能量,用于定量描述声音信号在不同频带的能量分布情况。频带能量常用于语音信号的特征提取和语音识别中。
4. 声谱包络:声谱包络是频谱的平滑曲线,表示声音信号中主要的共振频率和幅度信息。声谱包络能够反映声音的音色特征,用于音频信号处理、合成和转换等应用中。
频域特征:
频域应用中一般有EQ 均衡器,调制,激励等。
1. 均衡器
声音信号 的频谱覆 盖从 2 0 H Z 一 20 K H Z 。 对人耳监听而言 , 150 一 250H Z 之间是 人声的低频敏感部分。 4KHZ 一 6KHZ部分是人耳最敏感 的部分 (即中高频部分 ) , 10KHZ 左右是人声的高频敏感部分 。
2. 调制
通过数字信号处理技术,将低频数字信号(如音频、视频、数据等)调制到高频数字信号。
调制可以使声音的音调产生变化,对声音信号进行诸如变调处理和其它特殊音效处理,比如变色处理等。
3. 激励
对声音信号产生高次谐波 , 以增加它的层次感和穿透力。
音高为 C 的元音 “ 啊” 就是一个单音, 它的主体是以245HZ为基次谐波的音频信号 , 除此之外就是 它在频谱轴上 的二次谐波 , 三 次谐波依次类推逐渐递 减 。
4. 开源库
sox是最为著名的声音处理开源库,已经被广泛移植到Windows、 Linux、Mac OS X等多个平台。sox项目是由Lance Norskog创立的,后被众多开发者逐步完善,现在已经能够支持很多种声音文件格式和处理声音效果。它默认支持的输入/输出是WAV文件。