2009年12月13日 星期日

關於音量的一些心得整理~懶人包篇

這是一些自己這一陣子的心得,自己覺得很重要的一些關鍵,所以以下不會去解釋一些太基本的東西,也不會說到太理論的東西,純粹是實用上的心得,跟大家分享。

在看下去之前,如果有剛開始玩的朋友,幾個前提要請剛入門的朋友先緊緊抓住,絕對不要去背我後面會提到的數據,後面的測驗都很簡單,都可以自己動手驗證。
1.真正的音樂跟測試訊號絕對是兩回事。
2.測試訊號得到的數據跟音樂性的表現幾乎沒有絕對的關係。
3.每種測試或分析方法都有其限制跟盲點。

錄音應該錄多大聲?混音的時候音量應該多大聲?

首先需要知道的
1.音量是怎麼回事?
2.音量表的種類,如何看?
3.如何決定音量?

音量是怎麼回事?簡單講,音量就是試圖用數字來表現人耳所感受到的空氣振動強弱程度,或是試圖用數字來表達電路裡面的能量強弱差距。
為何說是"試圖表達",因為數學都有解析度(精確度)的限制,很多環節都在四捨五入,也就是說很多地方都存在著誤差。特別是面對著人耳這麼一個精細的感官,大多數時候,數字能說的真的太少。
舉一個簡單的例子,黑眼豆的 Boom Boom Pow 秒數 2:18 在 AKG 240 DF 聽起來 Vocal 比大鼓大聲,在 Beyerdynamic DT-770 Pro 聽起來大鼓比Vocal大聲,這就是音量這個數字沒有辦法告訴你的事。
但是,音量對機器卻有一些絕對的意義,就像我們的耳朵如果在超過100dB SPL的地方待一會兒會耳鳴,超過130dB SPL的聲音可以把我們炸成智障,是一樣的道理,
機器是零件做的,每個零件都有他適當的工作電壓或是電流或是What ever..., 而在我們使用的聲音處理機器上,音量就常常就代表者這些電壓/電流或是能量或是..., 機器上的音量表最重要的意義就是告訴我們,機器是不是在它適當的範圍內工作,因為機器不像我們太大聲會摀耳朵。
好,因為是懶人包,所以不多說太艱深的理論,馬上進入懶人的總結,對音樂性的決定,例如混音哪個樂器應該大一點,絕對要多聽多比較,不可單看音量表;對於機器,絕對要要好好了解它的數據(音量)讀法,了解它的適當工作範圍,不然會挫屎,以下有實例,請慢慢看下去。

音量表的種類跟如何讀?
這其實是一個超大超可怕的問題,again,因為是懶人包,所以只說重點:
類比的機器上,有超過一半的機會看到的是VU表,記重點就好,VU或是其他類比的音量表通常反應比較遲鈍,所以通常無法顯示出瞬間很大的音量變化,例如說每次大鼓踩下去的瞬間,音量表可能看起來剛好打到最大,實際上出來的會是已經嚴重失真的聲音。
那麼數位的音量或是電腦裡的音量表呢?他們跟類比的音量表最大的不一樣(實用上的不一樣),第一它的最大就是零,絕對不可超過,超過就失真,有時可能好像聽不出來,也確實有很多母帶製作級的機器很厲害,可以挑戰這個理論上的極限,不過請不要跟自己過不去。因為絕大多數時候,沒聽出來只是設備或是耳力的問題。
第二就是數位的音量很多時候不能用能量的方式來理解,例如說一個大鼓,我們把它的低頻砍掉,一般的想法來說會覺得它的能量變小了,所以在音量表上應該也變小聲了,但是在數位的世界不一定是這樣,挑一段音樂,把它Normalize到 -0.2dB,掛一個 EQ plugin, 120 Hz Low cut 24dB/Octave, 80%的機會它反而peak了,這個時候聽可能還不太聽得出來,但是再經過後面的plugin,失真就會越來越明顯。

那麼如何決定音量呢?
因為是懶人包,所以跳過所有歷史因緣,直接講結果,錄音的時候,類比音量表盡量不超過0,數位音量表不超過-6,混音的時候看情況。怎說?
原因跟實例請見下回分解。
我太累了,睡醒再把這篇寫完。

回來了。
在決定音量的時候,有一些必須很清楚了解的觀念,例如:類比的機器上,我們常常可以看到的規格,0VU=+4dBu, 最大輸出+24dBu(或是+26或+28),也就是說,這台機器的音量表顯示0VU的時候,它的輸出是+4dBu, 也就是說,它還有20dBu的 Headroom,這是什麼意思呢?
如前所述,VU音量表的反應(也就是它把能量的變化轉換成讀數的方式),其實不是那麼的快速跟精準,所以如果機器的工作的最大極限就設計在0VU,那麼任何一個在音量表上看起來打到0的聲音,實際上都已經超過這機器的極限而讓它嚴重失真了。
我們再看數位音量表,數位音量表最重要的一個任務就是幫助我們避免訊號過大而在AD或是DA的階段失真,我想大家都知道數位的失真結果不會是聲音有點變,而是聲音整個毀了。
假設大家都知道一個既定的規則,就是音量在數位世界的最大極限就是0dBFs,超過就絕對是失真。那麼對照上述最常見的類比機器規格,以常見的類比機器在0VU以上有20dB的Headroom來說,把類比機器的0VU對齊數位的-20dB,那正好類比機器工作範圍的最大極限也是數位機器的最大極限,這樣是不是很方便?
以上,就是為什麼我們在每一個錄音軟體裡面都會看到一個 Calibration 的欄位,而它的預設值常常是0VU=-20dBFs或是-18dBFs。


實例來說,有機器的大家可以隨手試試,對著麥克風發出一些短促的聲音,調整麥克風前級的Gain,讓麥克風前級的VU表最大聲的時候可以打到0VU, 這個時候看錄音軟體裡面錄到的最大音量,可能會是-14~-10,甚至是-6~-8dBFs都有可能。

前面的例子,可能跟很多朋友現在的習慣不一樣,很多朋友可能都覺得錄得越大越好,只要它不亮紅燈不破就好,覺得這樣比較接近唱片的音量。這樣做可能的問題在哪裡?

我拿我的 TL Audio Mixer 來做實例,開一個信號產生器,送500Hz的sine wave到192I/O的兩組輸出,一組從Mixer的channel line in 經由 main out 送回192I/O,另一組由TL Audio 的 2-track in 經由 Monitor Out 送回192I/O,以下圖片上的三個頻譜分別監看輸出的信號(右下),由 Main Out 送回(左上),由Monitor Out 送回(右上)
寄件者 前級網誌照片

第一張圖裡面,信號產生器送出-20dBFs的信號,在 TL audio Line in Gain 0, Fader 0, Master Fader 的狀況下,VU 表的讀數約略是0VU, 大家可以看到圖片中兩路送回的訊號左右聲道都有一點點不一樣大,大概是我全年無休的使用下,真空管跟音量可變電阻都有點老化了。
稍微比較一下三個頻譜,可以看出Monitor out 送回的信號跟原始送出的信號非常接近,我們可以說,對這種恆定的測試訊號來說,TL Audio的Monitor Section在頻率響應這個項目表現得不錯,那麼看經過Channel及Main out送回的訊號,我們可以看到比較大的偶次諧波出現在1000Hz, 一點點的奇次諧波出現在1500Hz,由此我們可以窺見TL Audio 這台Mixer 在它設計的工作範圍可能的特色(對於頻響來說)。

寄件者 前級網誌照片


第二張圖,一切不變,只有信號產生器這次送出的是-10dBFs的訊號,我們可以看見,Monitor Out送回的訊號跟訊號仍然沒什麼變化,而Channel到Main Out的這一路,出現了一些更高倍數的諧波。(VU表打底了)

寄件者 前級網誌照片


第三張圖,一切不變,信號產生器直接送出0dBFs的信號,Monitor Out 依舊很冷靜,而這次的Main Out這路就整個很激烈了。(VU表仍然可憐的黏在那邊)

請問這個測試告訴我們什麼呢?
是不是聲音經過TL Audio的Monitor out都不會變,它是一個很好的Monitor Section?
不見得,因為這個測試只告訴我們在頻率響應方面,在這個頻譜的演算法跟解析度下,看起來還不錯,這個測試不能告訴我們它對大小聲的動態變化會如何反應,它在全頻段的音樂下面表現會如何?
那這個測驗是不是告訴我們,用 TL Audio 這台 Mixer 錄音或是過帶,絕對不能超過怎樣的音量,不然它會失真很多?
也不見得,因為我們真正在處理的音樂訊號,無論是頻率的內容或是音量,都是不斷的在變化,可能你的材料很乾淨,加上了這些泛音內容會變得太毛躁,也可能這些東西剛好幫你的材料錦上添花。這些音樂性的因素,能幫你做決定的只有感官(耳力、品味...)跟監聽環境(喇叭、耳機、房間...),這些測試儀器跟數據幾乎無用武之地。

但是!這個測試確實告訴我們一件事,給它的訊號大小,會影響它加入素材的諧波成份跟比例。

接下來,我叫了一個 BFD 2 的原廠鼓組,跟內建的MIDI loop,這裡附上BFD 2 的Mixer設定。
寄件者 前級網誌照片


圖中可以看到我把好幾個Channel的音量都拉小了,特別是BFD的Main Out大概拉到了-9,為何?因為這樣它的輸出才不會破(超過0dBFs),另外,可以看到,我有一些Channel把反相打開了,其他的部份就都是原廠設定。
這裡我想特別提一下,其實鼓組要不要整個對好相位跟時間差,有時候是音樂性的決定,大多數人會理所當然的以為這些商業軟體的鼓音源(我一開始也是耶),一定是都幫你處理好這些小細節了,其實沒有,把它們分軌過帶出來,就可以發現,很多音源就是錄下來的樣子,如果你喜歡現在一些超清楚超乾淨的鼓音色,可以手動再好好處理這些音源分軌過出來之後的時間差跟相位關係。

我用這一小段Loop,用剛剛測試同樣設定的方法錄了兩個檔案,fader 都放在0dB,也就是說,這兩個檔案可以讓大家聽到第三個圖中的狀況,一個檔案是經過Channel/Main Out錄的,一個檔案是經過Monitor Section,請特別注意大鼓的擊點跟延音,還有hihat的擊點,應該就可以聽出端倪,我有確認過這個至少在AKG K240耳機是聽得出差別的。
請到這裡下載

上例之後,大概可以猜到接下來要說的是什麼了,沒錯,就是Plugin跟Plugin之間的音量設定,為什麼Plugin很多時候聲音差,為什麼電腦混音好像就是沒有硬體聲音好?深度就是比較差?沒錯,硬體有太多地方比電腦混音好,但是事實上聲音差有一半的責任在使用者上。
我們現在使用的Plugin有非常大的比例是在模擬類比的機器,而其他不是模擬類比機器的,裡面還是有某個部分在模擬類比,模擬類比最主要的精神就是模仿類比機器因應音量變化的不同反應,剛剛做過的測試,我把主角換成 Duy DaD Valve 跟 Crangsong Phonix,請見以下三圖。
寄件者 前級網誌照片

上圖是-20dBF測試訊號

寄件者 前級網誌照片

-10dBFs測試訊號

寄件者 前級網誌照片

0dBFs測試訊號

以上應該可以很清楚的看到,Plugin跟硬體對音量的反應相似之處。
問題來了,前面不是說過,要不要有這些諧波成分是音樂性的選擇嘛?
沒錯,但這個說法也已有潛在的危險之處,如果我們錄得很大聲,或是軟體音源的Output就很大,可以想見每過一個Plugin或是硬體,它就會再加上更多的高頻內容,所以如果每一軌我們都Solo來調來聽,單聽都調得很大很好聽,可是一首歌裡面幾十軌加上幾十個甚至幾百個plugin,可以想見高頻的內容也跟著一直堆疊,猜猜結果會是如何?

來一點點基本的物理,我們辨認聲音的遠近,除了大小聲,還有一個很重要的因素,頻率的內容,自然界裡面,高頻振動在空氣中的傳遞,能量衰退的速度比低頻快,所以在聽覺上,同樣一個聲音高頻少一點點,聽起來會遠一點點,這個也是盤帶錄音常常聽起來比數位錄音深度好一點的原因之一,盤帶經過dubbing跟混音,在很多次不斷的播放後,高頻的訊號其實會漸漸的有一點衰退。
另外一個要注意的,就是現代錄音流行的Close Miking技巧,聽現場演奏,我們少說也離表演者5米以上,但麥克風呢?麥克風都在他嘴邊或是樂器旁邊沒錯吧?所以錄起來的素材,其實常常就比我們在自然狀況下聽到的多非常多高頻的內容,如果,又用很大的音量經過硬體或plugin,猜猜結果會如何? 將此文章分享給你的朋友!