專業音頻

出自 Arch Linux 中文维基

本文或本節需要翻譯。要貢獻翻譯,請訪問簡體中文翻譯團隊

附註: 未完成(在 Talk:專業音頻# 中討論)

該文章描述了如何將你的系統針對錄音,混音,回放或是合成音頻應用進行配置。 這類活動通常使用術語 「專業音頻」 進行描述,並相對需要較低的延遲

相對於視頻剪輯或遊戲,該類應用通常不需要高端硬件。生產於2012 年後的大多數硬件都可以針對專業音頻工作進行優化。更多信息請參考 Ardour 用户手冊 The Right Computer System for Digital Audio 一節

注意: 如果你在找的是 GNU/Linux 作曲指南,可以參考 Sonoj wiki 或是前往 LinuxMusicians 論壇。

開始[編輯 | 編輯原始碼]

在閱讀完 Sound system 一文後,你可能已大致了解到 ALSA 屬於 Linux 內核的一部分,並在 Arch Linux 的 驅動及接口 中作為默認聲音系統。ALSA 在完成默認的 Arch 安裝流程後應當可以開箱即用。如果出現意外,你需要在進行下一步前先排清問題。

然而,如果出現 「沒有聲音」 的情況,則很可能是需要在 ALSA 混音器配置中解除聲道的靜音。如果你在使用多個音頻設備(例如 USB 音頻接口及內置聲卡),你可能需要設置默認聲卡.

我已正確配置好聲音系統了嗎?

$ speaker-test
進一步排障可參考 ALSA

在多數情況下,默認的 Arch Linux 內核已能滿足低延遲應用。進一步的系統配置只需在你遇到了音頻丟失,或是你確實需要/想要極低延遲的情況下進行。

為了完成優化工作,你可能需要配置一個實時內核

儘管有些專業音頻軟件可以直接使用 ALSA,但該文章提到的大多數軟件都屬於 JACK Audio Connection Kit(又稱 JACK)客户端。因此,你需要根據下方描述安裝並配置一個可用的音頻伺服器

提示:如果你剛開始使用 Arch Linux,完成了安裝指南且想要立刻開始作曲,可以安裝 pro-audio包組 軟件包組及 realtime-generic-setupAUR 並重啟。參考 #PipeWire-only 一節進行快速配置並查找適合你的音樂製作#軟件

系統配置[編輯 | 編輯原始碼]

注意: 最佳實踐及系統配置中的信息質量差異較大(甚至有可能過時或是自相矛盾)。儘管某些系統和配置需要更高程度的優化,對大多數用户而言這樣操作都是沒有需要的。建議先使用默認的 Arch Linux 內核及配置,只有當你確實需要低延遲及更高的穩定性時,再考慮優化的問題!

你可以參考下列常見的系統優化方式:

# echo 2048 > /sys/class/rtc/rtc0/max_user_freq
# echo 2048 > /proc/sys/dev/hpet/max-user-freq 
  • Reducing swappiness (aka swap frequency, set to 60 by default) to e.g. 10 will make the system wait much longer before trying to swap to disk (see wikipedia:Paging#Swappiness). This can be done on the fly with sysctl vm.swappiness=10 (see sysctl(8)) or setup permanently, using a configuration file (see sysctl.d(5)) such as:
/etc/sysctl.d/90-swappiness.conf
vm.swappiness = 10
  • Increasing the maximum watches on files (defaults to 524288) to e.g. 600000, that inotify keeps track of for your user, can help with applications, that require many file handles (such as DAWs). This again can be done on the fly with sysctl fs.inotify.max_user_watches=600000 or in a dedicated configuration file:
/etc/sysctl.d/90-max_user_watches.conf
fs.inotify.max_user_watches = 600000

You may also want to maximize the PCI latency timer of the PCI sound card and raise the latency timer of all other PCI peripherals (default is 64).

$ setpci -v -d *:* latency_timer=b0
# setpci -v -s $SOUND_CARD_PCI_ID latency_timer=ff

E.g. SOUND_CARD_PCI_ID=03:00.0.

The SOUND_CARD_PCI_ID can be obtained like so:

$ lspci | grep -i audio
03:00.0 Multimedia audio controller: Creative Labs SB Audigy (rev 03)
03:01.0 Multimedia audio controller: VIA Technologies Inc. VT1720/24 [Envy24PT/HT] PCI Multi-Channel Audio Controller (rev 01)

選擇音頻伺服器[編輯 | 編輯原始碼]

音頻硬件無法同時播放來自多個應用的聲音。雖然理論上 ALSA 可以被配置為混合來自多個應用的聲音,但這方面的工作通常會交由音頻伺服器來處理。單獨使用 ALSA 時難以實現低延遲,無法協調多個音頻應用的實時播放、同時播放以及維持同一速率等,並且無法簡單通過連接客户端的方式在多個應用間傳輸音頻流,因此在這一場景下,你需要一個專業音頻級的音頻伺服器。

有三個音頻伺服器可以選擇,其中兩個專為專業音頻應用而設計:

  • PulseAudio 在音頻回放和多媒體領域是事實標準,例如視頻、瀏覽器、音樂及遊戲。它並沒有針對專業音頻進行構思,並缺乏低延遲及應用間同步的能力。
  • JACK 專門針對專業音頻的需要進行開發,並已在全球範圍內獲得長期應用,因此其非常成熟和穩定。多數專業音頻應用針對 JACK API 進行開發。
  • PipeWire 正處於活躍開發中,在音頻方面目標為取代 JACK 及 PulseAudio。除本文內容外,它同時可以處理視頻路由。目前為 beta 開發階段。

音頻伺服器的配置很大程度上由使用場景、工作流及應用交互限制所決定。JACK Audio Connection Kit 設計為在不同應用間傳輸音頻,並在維持低延遲下通過客户端的同步執行來同時訪問同一音頻硬件。

以下為將要介紹的兩種音頻伺服器配置的模型:

  #仅使用 PipeWire       #仅使用 JACK

 ┌──────────────┐   ┌──────────────┐
 │ Applications │   │ Applications │
 ├──────────────┤   ├──────────────┤
 │   PipeWire   │   │     JACK     │
 ├──────────────┤   ├──────────────┤
 │     ALSA     │   │     ALSA     │
 └──────────────┘   └──────────────┘

僅使用 PipeWire[編輯 | 編輯原始碼]

新的 PipeWire 框架目標通過更優秀的簡潔性取代 JACK 及其它音頻伺服器。因此,建議先嘗試在默認 Arch Linux 內核下使用僅 PipeWire 配置,並通過安裝 pipewire-jackJACK 客户端 提供支持。

僅使用 JACK[編輯 | 編輯原始碼]

通用性的原則下,你可以將 JACK 與實時內核搭配進一步的系統配置以達到進階應用所需的低延遲。使用 JACK 作為唯一的音頻伺服器時,需要所有音頻交互應用都作為 JACK 客户端運行。

不幸的是,一些流行的桌面應用(例如火狐)以及大多數遊戲都取消了或是根本不支持 JACK。因此,該配置僅適合作為專業音頻系統的獨立設備,此時不支持 JACK 的軟件影響可以忽略不計。如果你仍需使用到不支持 JACK 的軟件,可以在完成下列設置後參考 Professional audio/Examples#Advanced sound server setups。在安裝和運行 JACK 前,請確保它可以訪問到你的音頻設備。

PulseAudio 或者其它軟件在佔用我的設備嗎?

$ lsof +c 0 /dev/snd/pcm* /dev/dsp*

或者

$ fuser -fv /dev/snd/pcm* /dev/dsp*}}

如果你的音頻設備沒有顯示出來,它可能是在被 PulseAudio 佔用(可能是由其它軟件作為需求包安裝)。如果你不打算使用 Professional audio/Examples#PulseAudio+JACK,可以將 PulseAudio 連帶其它軟件一起移除,以使其釋放音頻設備。

JACK 版本 1 已處於 「逐漸淘汰」[2] 階段中,其不支持 對稱多處理(SMP),缺乏 D-BusSystemd 整合,因此建議使用官方軟件源中的版本 2 jack2。If you're going to use a JACK control GUI or a Systemd user service for Starting the audio graph, also install jack2-dbus.

More details in JACK Audio Connection Kit#Comparison of JACK implementations

The article on JACK describes a GUI-based and a shell-based example setup as a point of reference for your own scenario. Parameter values of JACK are discussed in detail in the #JACK parameters section and may depend on other system factors covered by the #System configuration section above.

JACK 參數[編輯 | 編輯原始碼]

注意: The following guidelines should support finding best possible parameter values for running JACK without audio drop-outs (xruns) when using the #JACK-only or #PulseAudio+JACK[損壞的連結:無效的章節] sound server setup type. Due to differences depending on the hardware, whether a #Realtime kernel is used or not, and if further #System configuration is applied, there is no general preset.

The aim here is to find the best possible combination of buffer size and periods, given the hardware you have. Frames/Period = 256 is a sane starter. For onboard and USB devices, try Periods/Buffer = 3 before lowering both values. Commonly used values are: 256/3, 256/2, 128/3, 128/2.

另外,採樣率也需要與硬件設備匹配,你可以通過以下命令查看設備支持的採樣率選項:

$ cat /proc/asound/card0/codec#0

card0codec#0 替換為你的設備對應的值;在輸出結果中,查找 Extended ID 中尋找 ratesVRA 的值。目前常見的採樣率值為 48000 Hz,另外比較常見的值有 44100 Hz,96000 Hz 和 192000 Hz。

Almost always, when recording or sequencing with external gear is concerned, realtime is a must. Also, you may like to set maximum priority (at least 10 lower than system limits defined in /etc/security/limits.d/99-realtime-privileges.conf; the highest is for the device itself).

使用你找到的參數啟動 jack,如下所示:

$ /usr/bin/jackd -R -P89 -dalsa -dhw:0 -r48000 -p128 -n2

可以使用 qjackctlcadencepatchagestudio-controls-gitAUR 通過圖形界面來監控 JACK 的狀態和修改配置。

注意: 配置好 JACK 後,建議使用多個不同的音頻軟件來驗證你的配置。例如,對於 JACK 在 LMMS 上的 xrun 問題,不要當問題出在後者時花費過多時間排障。
建議閱讀 Linux Magazine article (2006) 來理解 JACK 參數調優

驗證延遲[編輯 | 編輯原始碼]

JACK 參數在很大程度上影響着 往返延遲(RTD)。在本文中,這表示音頻信號從錄製,處理到回放這一過程的總耗時。下一部分將介紹影響 RTD 的各個來源相關背景,如果你已了解這一概念,可直接跳到 #測量延遲 一節,或是完全跳過該部分。

延遲來源[編輯 | 編輯原始碼]

假設有一標準的歌手錄音場景。歌手的聲音以聲速通過空氣傳播到麥克風並被捕獲。接下來,通過模數轉換使得捕獲的電信號可以被計算機進行數碼訊號處理。最後,通過數模轉換將信號傳到歌手的耳機進行回放監聽,與舞台監聽系統的使用場景類似。

在這一場景中,有五個對 RTD 影響最大的延遲源,並按如下順序出現:

  1. 聲音從歌手的嘴通過空氣進行傳播
  2. 模數轉換
  3. 數碼訊號處理
  4. 數模轉換
  5. 聲音通過空氣傳播到歌手的耳朵

由於在技術上,必須在錄音及回放過程中保持特定距離才能獲得理想的聲音,因此很難對第一個及最後一個延遲源進行改善。另外,在近距離進行錄製並使用耳機進行回放時,由聲音傳播造成的延遲通常在個位數毫秒範圍內,對人類而言難以察覺。所以,需要通過優化其它延遲源來降低 RTD。

轉換延遲[編輯 | 編輯原始碼]

理論上,JACK 通過在採樣過程中使用固定值(包括幀,周期及採樣率)並對模數轉換過程中的音頻數據進行緩存來保持低延遲,反之亦然。採樣過程中的延遲可以用以下公式描述:

Lc = n / f

Lc:毫秒(ms)為單位的採樣延遲,n:幀或緩衝大小(從 16 開始的 2 的倍數),f:赫茲(Hz)為單位的採樣率。

回放延遲同時用到了周期值:

Lp = n * p / f

Lp:毫秒(ms)為單位的回放延遲,n:幀或緩衝大小(從 16 開始的 2 的倍數),p: 周期值,f:赫茲(Hz)為單位的採樣率。

如之前所説,音頻接口的性能決定了可用的參數搭配,具體的配置需要你進行試錯。雖然需要在防止 xrun 及低延遲間進行取捨,但現在的音頻接口基本都可以通過高採樣率(通常到 192 KHz)來滿足該需求。The audio flux of JACK clients in the digital domain is about zero and thus, negligible for latency measurements [3].

更多信息可參考 ALSA 維基的FramesPeriods 一節。

測量延遲[編輯 | 編輯原始碼]

在完成#JACK 參數配置後,你可能會想驗證下當前 RTD。例如,在幀或緩存大小 n = 128,周期值 p = 2,採樣率 f = 48000 時,採樣延遲大約為 Lc = 2,666... ms,回放延遲大約為 Lp = 5,333... ms,加起來總往返延遲 RTD = 8 ms

注意: 根據聲速可計算出該延遲值與舞台上使用距表演者耳朵距離在 2 m 到 3 m 之間的揚聲器的典型監聽情況相當。有過舞台經歷的表演家通常已習慣該延遲。

由 Fons Adriaensen 編寫的 jack_delay 工具可以在單個回放通道播放一個測試音,並在單個錄製通道上進行捕獲來,通過測量信號的相位差來估計整個鏈的往返延遲。建議使用合適的線纜將音頻接口的輸入和輸出通道連一起,或是參照 JACK 延遲測試將音響和麥克風靠近放一起。

例如,在一台僅配置 JACK 的設備上,將 playback_1capture_1 (名稱根據設備不同可能會改變)用線纜連接起來運行 jack_delay,並根據上文描述的參數得到以下輸出:

$ jack_delay -O system:playback_1 -I system:capture_1
capture latency  = 128
playback_latency = 256
Signal below threshold...
Signal below threshold...
Signal below threshold...
  422.507 frames      8.802 ms total roundtrip latency
       extra loopback latency: 38 frames
       use 19 for the backend arguments -I and -O
  422.507 frames      8.802 ms total roundtrip latency
       extra loopback latency: 38 frames
       use 19 for the backend arguments -I and -O
  422.506 frames      8.802 ms total roundtrip latency
       extra loopback latency: 38 frames
       use 19 for the backend arguments -I and -O
  422.507 frames      8.802 ms total roundtrip latency
       extra loopback latency: 38 frames
       use 19 for the backend arguments -I and -O
<output omitted>

根據輸出的提示,可以使用 -I 19-O 19 參數對 JACK 進行進一步優化,以補償鏈中額外的迴環延遲:

$ /usr/bin/jackd -R -P89 -dalsa -dhw:0 -r48000 -p128 -n2 -I19 -O19   
更多信息可參考 Ardour 文檔中的 延遲與延遲補償一節。

實時內核[編輯 | 編輯原始碼]

"實時" 這一概念在作業系統中的 定義 為:操作的結果可以在固定時間內得出,只有在更廣的意義上才是「與現實時間同步」,例如:用户在輸入後可以立即產生相應的聲音。這個案例稱為「低延遲」,而達成它的操作這篇文章的主要目標之一。

從一段時間前開始,默認的 Linux 內核(Arch Linux 的初始內核默認CONFIG_PREEMPT=y 選項)已被證明適用於低延遲操作。作業系統中對延遲的定義為:從硬件中斷的開始,到對應的中斷線程開始運行的時間。不幸的是,某些硬件的驅動會導致更高的延遲。因此,根據你的硬件、驅動和需求,你可能需要一個滿足 實時計算標準 的內核。

優勢與劣勢[編輯 | 編輯原始碼]

Ingo Molnar 和 Thomas Gleixner 創造的 RT_PREEMPT 補丁集是對於軟/硬實時應用而言非常有意思的選項,涵蓋了從專業音頻到工業控制等範圍。大多數專注於音頻的 Linux 發行版都啟用了該補丁集。一個可實時搶佔的內核也將使調整 IRQ 處理線程的優先級成為可能,並有助於確保幾乎不受負載影響的流暢音頻。

注意: 目前,在實時內核上使用某些應用會有些已知限制,通常與 虛擬化(例如 XenKVM)相關。如果你同時需要使用這類功能,可以考慮在默認 Arch Linux 內核外同時安裝實時內核,並在 引導加載程序 創建另一個入口以按需啟動到對應的內核。

安裝[編輯 | 編輯原始碼]

安裝 linux-rt 或是 linux-rt-lts 包。

編譯[編輯 | 編輯原始碼]

如果你要使用 實時內核補丁集編譯你自己的內核,請記住,移除模塊或選項並不等同於精簡內核。雖然內核映像的體積會減小,但現代的計算機系統以不再像 1995 年那時對大小敏感了。

更多信息可參考 如何正確配置帶 PREEMPT_RT 的 Linux

不論如何,你必須要確保:

  • Timer Frequency 設為 1000Hz(CONFIG_HZ_1000=y;不使用 MIDI 可以無視該項)
  • 禁用 APMCONFIG_APM=n;在某些硬件上會產生問題 - 在 x86_64 中為默認配置)

If you truly want a slim system, we suggest you go your own way and deploy one with static /devs. You should, however, set your CPU architecture. Selecting "Core 2 Duo" for appropriate hardware will allow for a good deal of optimisation, but not so much as you go down the scale.

(實時)內核的常見問題:

  • 超線程(如果懷疑是它導致的問題,可以在 UEFI 設置中將其禁用)

Tips and tricks[編輯 | 編輯原始碼]

  • Disable WiFi and close any programs that do not need to be open when recording such as browsers. Many have reported disabling WiFi has led to more reliable JACK performance.
  • Some USB audio hardware is known not to work properly when plugged into USB 3 ports so try USB 2/1 ports instead.
  • IRQ issues can occur and cause problems. An example is video hardware reserving the bus, causing needless interrupts in the system I/O path. See discussion at FFADO IRQ Priorities How-To. If you have a realtime or a recent kernel, you can use rtirq to adjust priorities of IRQ handling threads.
  • Do not use the irqbalance daemon, or do so carefully [4].
  • If you need to use multiple audio devices with JACK2, the alsa_in and alsa_out utilities can be used to have extra devices wrapped and show up as outputs in the JACK patchbay.
  • Some daemons/processes can unexpectedly cause xruns. If you do not need it - kill it. No questions asked.
$ ls /var/run/daemons
$ top # or htop, ps aux, whatever you are comfortable with
$ killall -9 $processname
# systemctl stop $daemonname
  • If you are facing a lot of xruns especially with nvidia, disable your GPU throttling. This can be done via the card's control applet and for NVIDIA it is "prefer maximum performance" (thanks to a post in LAU by Frank Kober[5]).

軟件[編輯 | 編輯原始碼]

Arch Linux provides the package group pro-audio包組 holding all relevant (semi-) professional applications. All applications in the pro-audio package group are JACK clients. Also lv2-plugins包組, ladspa-plugins包組, dssi-plugins包組 and vst-plugins包組 are subgroups of the pro-audio group.

提示: See Pacman/Tips and tricks#Listing packages for listing members of and Pacman#Installing package groups for installing package groups.

An overview and brief information on some applications is found in List of applications/Multimedia#Audio. Especially the categories Digital audio workstations, Audio effects and Music trackers, as well as Audio synthesis environments and Sound generators, provide examples of pro audio software for e.g. recording, mixing, mastering, and sound design. Other categories include Scorewriters, Audio editors, Audio converters, and DJ software.

Packages not (yet) in the official repositories can be found in proaudio. Browse the list of packages to find the application you need or request packaging of your desired applications via GitHub.

硬件[編輯 | 編輯原始碼]

多數聲卡和音頻硬件都不需要安裝特殊軟件包或進行額外設置,只需將 JACK 配置到目標硬件即可。

並不是所有硬件都這樣,針對特殊硬件請查閱 Category:Sound 以及 Envy24control#Supported cards 來獲取更多信息。

獲取幫助[編輯 | 編輯原始碼]

郵件列表[編輯 | 編輯原始碼]

  • Arch Linux Pro-audio 關於實時多媒體相關的討論,其中包括(准)專業音頻及視頻。
  • Linux Audio User 與 Linux 專業音頻相關的郵件列表,有更高的活躍度及大規模的用户和開發者羣體關注。

IRC[編輯 | 編輯原始碼]

  • #archlinux-proaudio - Arch Linux 專業音頻頻道
  • #lau - Linux 音頻相關用户頻道
  • #jack - JACK 音頻系統相關的開發及支持
  • #lv2 - LV2 插件格式相關的開發及支持
  • #ardour - Ardour DAW 相關的討論及支持
  • #opensourcemusicians - 開源軟件音樂家的大型討論頻道

See also[編輯 | 編輯原始碼]