音响声强究极进化!
书接上回,这篇声音可视化(下)在(上)发表完两个多月,终于和大家见面了。写文章不仅需要时间,还要有对的心情和状态。今天感觉对了,而且最近发了一篇和声音可视化相关的paper,所以赶紧动笔。
一、20世纪后期的发展史
1. WWI和WWII
进入到20世纪后,随着工业和科技的进步,声音可视化本应该进入快速发展期,尤其是美国的AT&T和西部电气的的Arnold和Crandall二位较为突出。然而,二战夺去了所有科技的优先权,声学也主要被用到了军用通信方面。

2. 早期基于扫描 (Scan)的声音可视化
战后直到60年代声音可视化才重新被重视并且再次重新发展起来。Winston Kock通过麦克风的电信号引起灯泡亮度的变化被相机记录下来,从而对声音成像。

3. Cymatics
Cymatics来自于希腊语,是波的意思(是Wave的波,你以为呢?_?)。这一词由Hans Jenny在60年代提出。他是Ernst Chladni的迷弟,疯狂地复现Chladni的实验并有所拓展。虽然他被一些人质疑他的做法的科学性,但是不影响他对声音可视化做出的贡献。

Cymatics声音可视化
* 视频来源:http://nigelstanford.com/Cymatics/?s=youtube&p=Chladni
4. 全息干涉(Holographic interferometry)
早在40年代的时候,Dennis Gabor就提出了一种能够记录波阵面振幅和相位的方法。直到60年代才被真正应用。通过在全息面上不同位置测量,可以还原声场。

二、当代声音可视化
六十年代以后,随着传感器技术、算法和计算机性能的大幅提升,声音可视化进入了全盛时期。很多方法涌现出来。这些方法大概可以分为两类:直接方法和间接方法。接下来带您一起走近科学。
1. 声光成像 (Acousto-optic mapping)
其原理为:光在高压力场,速度变快,反之变慢。激光干涉仪可以测量激光的相位变化,从而记录声场,以及为声音可视化提供可能。

2. 声全息 (Acoustic holography)
和声学的很多其他技术一样,声全息也是舶来品,在80年代从光学被引入到声学。简单说,就是通过声场测量来还原声源信息。

近年来近场声全息(NAH, near-field acoustic holography)允许在进场测量,更真实地还原声场。由于紧靠声源,NAH可以获得获得随距离呈指数衰减的倏逝波(evanescent wave)。倏逝波不受波长限制,因此NAH具有高空间分辨率的特点。然而由于需要到近场,理论上的传播模型往往不能模拟实际实验环境,进而限制NAH的效果。
3. 波束成形 (Beamforming)
声学望远镜(或者叫声学天线)首先被Billingsley在1974年被提出,是beamforming的雏形。随着数采系统、算法和硬件的发展,beamforming大行其道,被广泛应用。最简单也是最早发展的是delay-and-sum beamforming,通过调整麦克风相位延迟来扫描重建面,定位声源。


波束成型被大众熟知还要归功于“声学照相机”这一名词的提出。由于名字吸引人,再加上可以实时成像,口口相传的效果很好。

除了最基本的beamforming,后来又出现了很多改进算法,比如MUSIC,MVDR,deconvolution,以及近十年很火的压缩感知——没错,又一个被引入声学的技术。空间分辨率在一步步被提高,然而同样具有局限性。由于在远场测量,并且受实验条件影响,beamforming可以定位声源,却无法还原声源。
4. 直接成像法 (Direct mapping method)
最理想的方法,就是把传感器直接放到声源旁边直接测量计算。除了不需要传播模型、计算准确之外,还可以靠近各种奇奇怪怪的声源表面,聆听它们最真实的声音。

我们之前提到的几种方法都是间接方法,用M. Kac的话说就是
Attempt to obtain what is not available based on what is available.
那么当我们什么都是available的时候不是皆大欢喜吗?
我会在以后的文章专门介绍质点振速传感器Microflown的优点,可以近场测量,并且有效抑制背景噪声,还能计算声强,直接拿到声源的第一手资料。所以,拿着这个探头,去探索你想了解的各种奇形怪状的声源吧!
Scan&Paint(扫描成像)技术基于Microflown声强探头应运而生。简单说,就是拿着传感器扫描然后成像。Microflown探头里面结合质点振速传感器和MEMS麦克风,在目标声源附近扫描一圈,直接测得振速和声压,从而计算声强,画出声场分布图。
Microflown的Scan&Paint 3D扫描成像系统
通过用Microflown探头扫描音响表面,得到的声源定位图。由于Scan&Paint 2D里面只有一维的振速传感器,所以定位图是二维的。而Scan&Paint 3D里面有三个正交的振速传感器,除了计算出来的声强值,还能知道声强的方向。

在汽车NVH方面,可以用Scan&Paint 3D来定位车内声源。比如下图,汽车在怠速状态下,用3D探头扫描车内。可以看到发动机噪声泄露主要发生在挡风玻璃和dashboard之间,以及右侧车门和dashboard之间。注意这个图的频率是在50-63Hz,在这个频率范围如果要用beamforming的话,阵列要做到很大。所以这种直接成像法优势很明显。


除了定位声源,还可以通过扫描车内空间,通过可视化来研究声场分布和车内共振模态,辅助汽车音响系统设计。

三、结语
终于又啃完了一个专题的发展史。
声音可视化是了解声源和声场,以及解决声音,尤其是噪声问题的有效工具。虽然声学是一门和耳朵相关的科学,但是人们往往更信赖于所见。耳听为虚,眼见为实。耳目结合,岂不爽哉?以后我会介绍和听相关的声学知识,声音可听化(Auralization)。只不过这里面耳听为虚的虚,是虚拟现实和虚拟声学的虚。
参考
[1] Fernandez Comesana, Daniel.Scan-based sound visualisation methods using sound pressure and particle velocity. Diss. University of Southampton, 2014.
[2] Heilmann, D. W. I. G., Doebler, D., & Boeck, M. (2014, October). Exploring the limitations and expectations of sound source localization and visualization techniques. InINTER-NOISE and NOISE-CON congress and conference proceedings(pp. 4003-4011).
[3] C. M. Hutchins, K. A. Stetson, and P. A. Taylor, “Classification of free plate tap tones by holographic interferometry. the acoustics of violin plates,” Catgut Acoustical Society Newsletter, vol. 16, pp. 15-23, 1971.
封面来源于Microflown Technologies
https://www.microflown.com
本文首发于我的知乎专栏《可以听的黑科技——声学》: