三维定位(Localization):水平、垂直和纵深

3.三维定位(Localization):水平、垂直和纵深

由于人耳位于头部的左右两侧而并非位于顶部和底部,因此,人类在水平面上的定位能力最好。通俗点讲,这是一个三角的定位测量工作。这个进化的原因是很明显的,在我们的原始环境中,大部分威胁来自于水平面,因此需要又快又准地定位。用双耳进行三角测量的定位方法其实是比较笨拙的,因为实际情况往往更复杂。常规的三角形定位依靠两个空间点畅通无阻地“观察”整个声场,然而,这里存在一个大的障碍物——头部。假设头部是一个简单的硬球体,在双耳孔处各有一个拾音点。

在这个简单的模型中,声波从一个方向,比方说从水平右前方指向头部,会先到达右耳,然后声音通过衍射到达左耳。这样在时间上会稍延迟一点,所花的时间是从右面“环绕头部”所花费的额外时间,再加上“直达”(as the crow flies [3])的时间。

人类的感知能力是非常好的。在精密的实验中,刚刚听得出来JNDs(just noticeable differences)的两耳时间差大概是10微秒左右。在24格/秒的情况下,一格的时间是这个时间段的4000倍。这就是说,在良好的实验条件下,在水平面上移动声源使声音到达一只耳朵的时间要比到达另一只早1/100000秒。与反方向移动相比,其中的差别是很明显的。这是令人惊讶的高速,比大脑传输过程还快得多,但是请注意这不是测得的绝对时间,而是到达两耳的两条路经,肯定有一条会给大脑留下更明显的印象。

对于右前方的声场,我们说左耳处于头部的声学阴影区。掩蔽效应随频率而变化,并且左耳听到的声音比右耳低。低频声音因为很容易透过“衍射”绕过头部,因此,两耳听到的声音差不多,但对于高频声音,头部是一个很大的障碍物,因为,高频的波长短,所以左耳听到的声音明显降低。

因此,在这样的声场中,既存在着一个由几何实体带来的时间差,又存在着一个由掩蔽效应带来的声级差。1kHz以下的声音主要运用时间差来定位,4kHz以上的声音主要运用声级差来定位。在这两种定位方式上存在着一定的空隙。也就是说,这个范围内的定位效果较差。这是通过实验验证的。

对于刚才所引用的模型,我们用了带有耳孔的和头部平均大小一样的球体为例来说明,用它可以很好地说明振幅和时间差。实际上,在耳朵位置装了传声器的这种球体在业内是用作立体声传声器的,一般认为这种传声器能够重现听觉的声级差和时间差。我们的模型中没有耳廓,但耳廓在定位中也起了作用。前面讲过,耳廓的回旋会对不同入射角的声音产生不同的效应。虽然耳廓能产生许多效应,但最主要的是直达(或衍射)声通过作为通向耳道的主通道的外耳(concha)往外反射的差异性。直达声和反射声的结合会导致耳道入口处的相长和相消干涉现象的产生。

当然,对于各个平面的声音来说,耳廓反射都是存在的,包括水平方向,但由于水平面定位主要依靠两耳间的时间差和声级差,因此,耳廓效应对垂直定位的意义比水平定位更大。由于耳廓在声学上是相当小的,因此,耳廓效应主要在波长较短的6kHz以上的高频区发生,表现在感知上的结果是,垂直方向上的声音分辨能力比水平方向差了很多。大部分影院声音系统在设计时主要考虑水平面上的定位效果,因为,对定位来说这是最有效的平面。

定位的第三维度是空间感。在这个维度上,感知是最粗糙的,因为,这个维度上辨别声音距离的信息比其它维度的要少得多。但仍有几个听觉作用机理可帮助我们获得纵深的信息,它们包括:

·声源的振幅和亮度。经验告诉我们:近的声音听起来比远的声音响亮。

·户外地面反射声的能听度及其随时间变化的规律。

·运动物体的多普勒效应。

·在室内,早期反射声的模式告诉我们空间大小的信息,并且有利于对反射面位置的确定(这方面盲人的感知特别好,而视力正常的人则更依靠视觉来定位)。

·室内混响。混响时间越长通常意味着空间越大。

即使深度感在感知上并不是很明显,但它还是有用的,并且电影工作者可以巧妙地利用好它。深度感上的差别甚至能够在最简单的单声道(单声轨或单声道)影片中把声音“放置”在空间里,至少可以还原一个维度的信息。这种方式在声音进入电影后立即被采用。

深度感应用的例子有很多。下面是一些例子:

·使解说叙述的混响声比屏幕动作更小些,这样可以使解说者从画面中独立出来。这种方式被广泛用在纪录片和故事片中,例如《现代启示录》中的画外音。还有,通过在一个小的消声室中给马丁·西恩(Martin Sheen)录音,叙述性的语音闭塞感被解决了,这个消声室不会加入自身的声学效果,并且使用了录音效果非常明亮的传声器近距离拾音,这些技术都是为了获得亲密感,以便形成一种“正对着你”的录音风格,听起来和画面上的内容不同。从画面上的布景来看解说应当是有混响的,但实际使用的是混响量不太大的传声器技术。

·使旁白混响比实际画面上的混响更大是一种暗示人物内心思想的方法。这要回溯到广播剧流行的年代,而这种方法今天看起来很怪。然而,当我们看到一个某人沉思的镜头,听到他回荡着的声音,但嘴唇却不动,这时候我们就知道他在想什么——这是人物内心发出的声音。

·在录音时,我们会有意地使用某种方法增加一个场景的室内声学特点。假设我们想要一个1960年左右的高中毕业舞会的场景。我们在该场景录音完成后,把它混录到影片中,但声音太干净了,除了原始录音之外,声音缺乏任何别的类型的室内音响,在这种情况下应该怎么办呢?答案是使声音真实化。可以通过混响量不太专业的录音系统进行重录工作,使新的录音带上具有翻版声音的所有缺点。另一个方法是在录制时不断地移动扬声器和传声器,通过不断地改变声音路径的方法使声音“变糟”。声音设计师瓦尔特·穆驰(Walter Murch)和电影制作者乔治·卢卡斯(George Lucas)经常采用这种方法来录制体育馆场景的美国音乐。他们改良了扬声器和传声器,并且在录制新唱片时不断地移动扬声器和传声器。

·在有好几个布景的复杂场景里,不同的布景很可能要使用不同的录制和转录方法,以便改变声音的混响量。首先是屏幕“前面”干巴巴的解说,接着通常是带现场混响的前景同期声,以及在那种环境下可能会有的有源音乐,如场景内收音机播放的音乐;再接着是画外音响声。空间感里最深层的是无源音乐(scored music),尤其是管弦乐。

深度感可以让我们在简单的单声道制作也有很大的“空间感”的表现能力。在更精细的电影制作中,一般都采用立体声(stereophony)。立体声从制作到发行到最终的影院放映,都采用了两声道或多声道的方式,并通过互相间隔的多个扬声器还音。立体声提供了两个至关重要的听觉特性,使得它对影视声音具有重大的意义,即在不同方向上给予声音定位的能力,创建封闭的没有特定方向的空间声音的能力,而且它能比任何单声道系统都更好地还原所录的混响声。

这两个因素,一个是定位,另一个是封闭空间,是连续统一体的两个限度。声音被精确定位,还是大致定位或更粗略地定位,完全取决于你的立足点或需求,也有可能声音根本是没有方向的。比如说,所追求的高质量混响中的散射声场。立体声系统会在声道数允许的限度内再现这两个因素。

立体声电影声音系统一般使用四个或更多个声道,而家用立体声系统在家庭影院推出之前只有两个声道。声道数的增加,使得定位和封闭空间这两方面的功效很少打折扣。