一次搞懂单声道、双声道、立体声 — 声音处理技术

声音技术的发展史

1877年爱迪生除了发明电灯,也发明了第一个可以回放声音的装置,从此之后声音可以被回放。

可以称之为第一代的留声机,在这之前声音无法被回放,只能靠文字想象。我们利用一个声道或音轨来重现声音,我们叫做 Mono 或是单声道。

litisheng2018072701

双声道、立体声 — Stereo

1931年 EMI 的工程师 AlanBlumlein 认为人类是用两只耳朵听声音,为何我们只有一个喇叭呢?所以他发明了 Stereo,Stereo 需要左右两个喇叭发出不同的声音,所以如果你有两个喇叭播放的是一样的声音,我们还是叫做 Mono。Stereo 因为价格与技术上的问题,一直到 1960 年代才慢慢普及,那时候 Beatles、猫王都开始尝试用 Stereo 来创造,甚至会标示在唱片封面上。

Stereo 虽然叫做立体声,但他离立体还有点距离,因为人类大脑对于判断实体声音超级厉害,以准确度来说大脑的误差在左右正负3度(3度是如果我们画一个时钟是1分钟这么窄)。

shengdao2018072701

quadraphonic 四声道

为了要让人的体验更「声」历其境,很自然地会想到增加喇叭的数量,所以后来有了前面两个声道,后面有两个声道的 quadraphonic 四声道。四声道在 1970 年红了一阵子,但很快因为成本的问题消失。

5.1声道 — 环场声、环绕声

shengdao2018072702

5.1 声道

我们现在较长听到的环绕音响或是 surround sound 是 5.1声道,前面有三个声道,后面有两个。像 Dolby Digital,SDDS,DTS 及 Pro Logic II 都是常见的 5.1 声道音效系统。第一次使用是在 1980年代的电影院一直到现在。

但像刚刚提到的,大脑对于判断实体声源超级厉害,所以即使你有5.1环绕音响,你仔细听,还是听得出喇叭的位置,为了解决这个问题,大家开始增加喇叭数目,每个方向都增加喇叭,然后那个喇叭就只播放那个方向的声音就好,所以就有了 6.1 或是 7.1 声道的环绕,利用增加喇叭数目增加声音播放的精确性。

shengdao2018072703

7.1 声道

这种透过增加喇叭数量来增加声音播放的精确性的解决方案,其实不止发生在水平面,也发生在垂直面。所以后来有了 9.1 环绕,这种放在天花板上的高置声道( high channel)。11.1声道把天花板的喇叭数量变成 4 个,增加喇叭无非是为了增加体验和故事的真实性,让每个人能更融入故事。

声音档案制作 — Channel-Based Sound

了解了声道的概念后,那制作声音档案时,我们都希望用户能更沉浸在声音里,那声道又该如何处理呢?举例来说,我今天想让你听到后面有一只恐龙在叫,前面有个人在尖叫,现在传统的做法是以喇叭的数量为出发,我们称作 channel-based 的作法:

shengdao2018072704

决定声道数为 7.1 声道

首先要决定要用几个喇叭,假设在这个例子里我们用 7 个喇叭的 7.1 声道

shengdao2018072705

分配声音

接着我要把恐龙的声音跟尖叫的声音平均分配到他附近的喇叭里面,接着再把七个喇叭的声音全部包成一个档案,拿到了这个档案后就要去找出 7.1 声道的喇叭配置,然后播放档案。

播放档案之后理论上你就能听到恐龙在后面与前面有人在尖叫,这其实是 1 个萝卜一个坑的道理。所以如果你想要听到 5.1 声道的声音,你就同时要有 5.1 声道的档案和 5.1 声道配置的喇叭。

聆听场景与播放设备不断增加,该如何解决?

现在的时代,除了喇叭配置的选择更多外,播放声音的设备跟播放声音的情境、地点越来越多,然而设备也有不同的大小与性能。我们会希望有一种声音格式可以很有弹性,能适应不同的喇叭配置与情况,让消费者可以简单切换。声音产业为了解决这个问题,目前有两个方向:

一、Object-based 面向对象式

以刚刚的例子(前面有人尖叫,后面有恐龙叫)来说,身为创作者在 object-based 的方式下要决定「这个恐龙什么时候用多大的音量在哪里大叫」,接着根据不同的喇叭配置(双声道、 5.1、7.1、 22.2声道) ,分别做好设定,最后再把信息都打包成档案,这样播放时就可以依照现有的喇叭配置播放声音。

除此之外 Object-based 还可以把每个声源当作是一个对象,举个例子来说,当你在看一场直播的球赛,如果球赛里的球评、主播、场内的对象都是分别独立的对象,如果你觉得球评很吵,你就可以把球评关掉,只留下场内的声音,你甚至还能选择主队或是客队的欢呼声,以此创造影音内容的互动,也让观看的体验更有趣。

二、Scene-based 场景导向式

场景导向式其实是一个相当大的类别,我们比较常听到的是 ambisonic 的技术,ambisonic 的概念在 1970 年就被提出,他的概念有点像 360度影片,假设我们可以在场地中央放一个麦克风,一口气把整个场地的音场录下来,音场搭配上三维的坐标(X.Y.Z),播放时让喇叭配置依照坐标试着重建音场。 360 度影片就是 ambisonic 的应用之一,也是因为 360度影片,2016年初 Youtube 开始支持 ambisonic。

声音技术的革命正在发生

但是有些问题虽然可以在 Object-based 跟 Scene-based 的技术下解决一部份,但如果声音可以突破声道的限制,那就不会有家里明明有环绕音响,但是看电视的时候听的都是双声道的哀伤。即使有 Object-based 跟 Scene-based 的技术,但是你的设备都是 mono 跟 stereo 的设备 (e.g. 计算机、电视、手机) 那你听到的东西就还是 mono 或 stereo。

未经允许不得转载:数智网 » 一次搞懂单声道、双声道、立体声 — 声音处理技术

分享到: