用以分辨听觉对象的信息

1.用以分辨听觉对象的信息

1)音色

我们已经讲述了频率和频率的相关要素,音调、振幅以及振幅的相关要素,响度也已经展开讲过了。在响度、音调差别、时间(混响时间)之后,接下来的是音色(timbre)。音色是多方面的,不像响度和音调,可以用一条线上的一个点来表示,音色更复杂,它依赖于:

·声音频谱,即基频(fundamental frequency)的相关振幅,还有谐频。例如,增大立体声中的高音使得声音更明亮,是通过增高声音中高频成分的声音电平来实现的。这是音色上的变化。

·有力的瞬时现象。倒放的钢琴曲听起来不像钢琴声,而像某种风琴,因为,按键时有冲击力的瞬间是在音符的结尾而不是在音符的开头。

声音频谱随时间变化的方式对音色来说是很重要的。一个声音的起始瞬间可能频率范围很宽,但过一会儿这个频率范围可能就会变窄,并且变得更音调化。在声音事件的过程中声音频谱发生了变化,我们要及时地把这些变化和特殊的声音联系起来,尤其是乐器的声音。

在实际制作过程中,可能会有比重现音色更重要的目标,如语言的可懂度,但完好地重现音色是高保真还音系统的首要目标。许多电影中的对白有鼻音,这是由于音乐和音响的影响。为了提高可懂度,中频范围被过分地增强了。[4]听这类电影有时感觉像同时在听两部电影,因为语言的频率范围好像很窄,在这个很窄的频率范围内有个中频提升,然而音乐和音响的频率范围听起来很宽、很和谐。在这类情况下,最佳效果是通过观察在这种方法下语言的理解有没有受到干扰而获得的,实际上,虽然影片听起来没有达到最佳效果,但中频的提升确实改善了语言的可懂度。

要达到准确的音色还原,从声源到听众的这条链上的所有设备,必须完全覆盖可听频率范围,并且没有某频段强于另一频段的现象出现。钢琴上的所有音符要以演奏时的力度再现。这样,还原的声音才能准确地表现出这种乐器的特点。

2)基频

声音的基频用来区别声音,然而我们并不是单独地只听基频或某个谐频的声音(但我们可以训练出这种本事)。对于我们听到的声音,更好的表述方式是基频加音色(音乐上是音符的音调和演奏所用的乐器)。

如果我们想增加一个声音的丰满感,把两个声音叠加在一起是方法之一。为了使声音融合在一块儿,有个诀窍,就是使其中一个声轨上的基频与另外一个相匹配。这可以通过一个简单的方法来完成:以不同的速度播放磁带,直到音调一致。

3)振幅或频率的相关变化

如果以上列举的例子中的各个成分一起发生变化,如所有的谐波以同样的速率淡出,这将增强由正在变化的成分所组成的单一听觉对象的声音能量。

4)声像定位

听觉定位器官对分离听觉对象大有帮助。声音空间的分离与视觉空间的分离类似,如果我们听到同一个方向上的一组声音,我们很可能把它们当作一个听觉对象。例如,《侏罗纪公园》(Jurassic Park)里,各种声音经过“声像移位”处理,把所有的音响元素置换到同个位置上,组合在一起形成了恐龙的声音。通过调整各种元素的表现深度,即使在单声道上,也可以利用定位形成听觉对象。这是通过给每个元素增加或减少混响实现的,以使它们在深度上互相匹配。

5)与以前的声音相对比

举一个这个原理的反面例子,在一个场景内,当背景声音与画面剪接不匹配时,我们将感知到预期之外的空间变化。这种不匹配的剪辑在原先没有对比的地方增加了对比,并形成了一个独立的听觉对象(新的背景声音),把观众的注意力从内容上吸引开去。

另一个反面例子来自于纪录片。在这类影片的拍摄中,电影制作者通常不能像叙事性影片一样进行演练和控制,这时有些不可避免的烦人声音便会被录下来。对这些背景声音进行过滤也会影响到前景声,即需要的声音。我们可能要通过剪辑或混录,只对噪声的部分进行滤波处理,但因此而产生对前景声的影响也是应该被考虑到的。对整个场景进行过滤处理要比只对需要处理的地方进行处理要效果好得多,这是因为在前景声中可能产生瞬时对比,这在一定程度上可以避免。我们希望能获得好的连贯性,即没有对比。

6)随时间变化的模式

声轨上,声音元素变化的速度能给我们一个声音对象大小的感知,因为大物体一般移动得比小物体慢。《侏罗纪公园》中恐龙遥远沉重的脚步声相互之间分得很开,节奏比较慢,就说明了这个原则。当然,这个沉重的脚步声遵循着低音代表威胁的美学原则。

不但在音乐中,在音响中节奏也会导致听觉对象的形成。由于节奏形成了一种时间上的张力,在此之前一刻的拍子是怎样的,之后一刻拍子也将怎样,就像音乐鼓点一样;另一个节奏上的因素是,音乐节奏有拍子优先的、更高的排序模式,即强拍概念。在img节拍和华尔兹(waltz)的节奏中,我们不只期待着拍子,还期待着强拍。