专业音频

来自 Arch Linux 中文维基

本文或本节需要翻译。要贡献翻译,请访问简体中文翻译团队

附注: 未完成(在 Talk:专业音频# 中讨论)

该文章描述了如何将你的系统针对录音,混音,回放或是合成音频应用进行配置。 这类活动通常使用术语 “专业音频” 进行描述,并相对需要较低的延迟

相对于视频剪辑或游戏,该类应用通常不需要高端硬件。生产于2012 年后的大多数硬件都可以针对专业音频工作进行优化。更多信息请参考 Ardour 用户手册 The Right Computer System for Digital Audio 一节

注意: 如果你在找的是 GNU/Linux 作曲指南,可以参考 Sonoj wiki 或是前往 LinuxMusicians 论坛。

开始[编辑 | 编辑源代码]

在阅读完 Sound system 一文后,你可能已大致了解到 ALSA 属于 Linux 内核的一部分,并在 Arch Linux 的 驱动及接口 中作为默认声音系统。ALSA 在完成默认的 Arch 安装流程后应当可以开箱即用。如果出现意外,你需要在进行下一步前先排清问题。

然而,如果出现 “没有声音” 的情况,则很可能是需要在 ALSA 混音器配置中解除声道的静音。如果你在使用多个音频设备(例如 USB 音频接口及内置声卡),你可能需要设置默认声卡.

我已正确配置好声音系统了吗?

$ speaker-test
进一步排障可参考 ALSA

在多数情况下,默认的 Arch Linux 内核已能满足低延迟应用。进一步的系统配置只需在你遇到了音频丢失,或是你确实需要/想要极低延迟的情况下进行。

为了完成优化工作,你可能需要配置一个实时内核

尽管有些专业音频软件可以直接使用 ALSA,但该文章提到的大多数软件都属于 JACK Audio Connection Kit(又称 JACK)客户端。因此,你需要根据下方描述安装并配置一个可用的音频服务器

提示:如果你刚开始使用 Arch Linux,完成了安装指南且想要立刻开始作曲,可以安装 pro-audio包组 软件包组及 realtime-generic-setupAUR 并重启。参考 #PipeWire-only 一节进行快速配置并查找适合你的音乐制作#软件

系统配置[编辑 | 编辑源代码]

注意: 最佳实践及系统配置中的信息质量差异较大(甚至有可能过时或是自相矛盾)。尽管某些系统和配置需要更高程度的优化,对大多数用户而言这样操作都是没有需要的。建议先使用默认的 Arch Linux 内核及配置,只有当你确实需要低延迟及更高的稳定性时,再考虑优化的问题!

你可以参考下列常见的系统优化方式:

# echo 2048 > /sys/class/rtc/rtc0/max_user_freq
# echo 2048 > /proc/sys/dev/hpet/max-user-freq 
  • Reducing swappiness (aka swap frequency, set to 60 by default) to e.g. 10 will make the system wait much longer before trying to swap to disk (see wikipedia:Paging#Swappiness). This can be done on the fly with sysctl vm.swappiness=10 (see sysctl(8)) or setup permanently, using a configuration file (see sysctl.d(5)) such as:
/etc/sysctl.d/90-swappiness.conf
vm.swappiness = 10
  • Increasing the maximum watches on files (defaults to 524288) to e.g. 600000, that inotify keeps track of for your user, can help with applications, that require many file handles (such as DAWs). This again can be done on the fly with sysctl fs.inotify.max_user_watches=600000 or in a dedicated configuration file:
/etc/sysctl.d/90-max_user_watches.conf
fs.inotify.max_user_watches = 600000

You may also want to maximize the PCI latency timer of the PCI sound card and raise the latency timer of all other PCI peripherals (default is 64).

$ setpci -v -d *:* latency_timer=b0
# setpci -v -s $SOUND_CARD_PCI_ID latency_timer=ff

E.g. SOUND_CARD_PCI_ID=03:00.0.

The SOUND_CARD_PCI_ID can be obtained like so:

$ lspci | grep -i audio
03:00.0 Multimedia audio controller: Creative Labs SB Audigy (rev 03)
03:01.0 Multimedia audio controller: VIA Technologies Inc. VT1720/24 [Envy24PT/HT] PCI Multi-Channel Audio Controller (rev 01)

选择音频服务器[编辑 | 编辑源代码]

音频硬件无法同时播放来自多个应用的声音。虽然理论上 ALSA 可以被配置为混合来自多个应用的声音,但这方面的工作通常会交由音频服务器来处理。单独使用 ALSA 时难以实现低延迟,无法协调多个音频应用的实时播放、同时播放以及维持同一速率等,并且无法简单通过连接客户端的方式在多个应用间传输音频流,因此在这一场景下,你需要一个专业音频级的音频服务器。

有三个音频服务器可以选择,其中两个专为专业音频应用而设计:

  • PulseAudio 在音频回放和多媒体领域是事实标准,例如视频、浏览器、音乐及游戏。它并没有针对专业音频进行构思,并缺乏低延迟及应用间同步的能力。
  • JACK 专门针对专业音频的需要进行开发,并已在全球范围内获得长期应用,因此其非常成熟和稳定。多数专业音频应用针对 JACK API 进行开发。
  • PipeWire 正处于活跃开发中,在音频方面目标为取代 JACK 及 PulseAudio。除本文内容外,它同时可以处理视频路由。目前为 beta 开发阶段。

音频服务器的配置很大程度上由使用场景、工作流及应用交互限制所决定。JACK Audio Connection Kit 设计为在不同应用间传输音频,并在维持低延迟下通过客户端的同步执行来同时访问同一音频硬件。

以下为将要介绍的两种音频服务器配置的模型:

  #仅使用 PipeWire       #仅使用 JACK

 ┌──────────────┐   ┌──────────────┐
 │ Applications │   │ Applications │
 ├──────────────┤   ├──────────────┤
 │   PipeWire   │   │     JACK     │
 ├──────────────┤   ├──────────────┤
 │     ALSA     │   │     ALSA     │
 └──────────────┘   └──────────────┘

仅使用 PipeWire[编辑 | 编辑源代码]

新的 PipeWire 框架目标通过更优秀的简洁性取代 JACK 及其它音频服务器。因此,建议先尝试在默认 Arch Linux 内核下使用仅 PipeWire 配置,并通过安装 pipewire-jackJACK 客户端 提供支持。

仅使用 JACK[编辑 | 编辑源代码]

通用性的原则下,你可以将 JACK 与实时内核搭配进一步的系统配置以达到进阶应用所需的低延迟。使用 JACK 作为唯一的音频服务器时,需要所有音频交互应用都作为 JACK 客户端运行。

不幸的是,一些流行的桌面应用(例如火狐)以及大多数游戏都取消了或是根本不支持 JACK。因此,该配置仅适合作为专业音频系统的独立设备,此时不支持 JACK 的软件影响可以忽略不计。如果你仍需使用到不支持 JACK 的软件,可以在完成下列设置后参考 Professional audio/Examples#Advanced sound server setups。在安装和运行 JACK 前,请确保它可以访问到你的音频设备。

PulseAudio 或者其它软件在占用我的设备吗?

$ lsof +c 0 /dev/snd/pcm* /dev/dsp*

或者

$ fuser -fv /dev/snd/pcm* /dev/dsp*}}

如果你的音频设备没有显示出来,它可能是在被 PulseAudio 占用(可能是由其它软件作为需求包安装)。如果你不打算使用 Professional audio/Examples#PulseAudio+JACK,可以将 PulseAudio 连带其它软件一起移除,以使其释放音频设备。

JACK 版本 1 已处于 “逐渐淘汰”[2] 阶段中,其不支持 对称多处理(SMP),缺乏 D-BusSystemd 整合,因此建议使用官方软件源中的版本 2 jack2。If you're going to use a JACK control GUI or a Systemd user service for Starting the audio graph, also install jack2-dbus.

More details in JACK Audio Connection Kit#Comparison of JACK implementations

The article on JACK describes a GUI-based and a shell-based example setup as a point of reference for your own scenario. Parameter values of JACK are discussed in detail in the #JACK parameters section and may depend on other system factors covered by the #System configuration section above.

JACK 参数[编辑 | 编辑源代码]

注意: The following guidelines should support finding best possible parameter values for running JACK without audio drop-outs (xruns) when using the #JACK-only or #PulseAudio+JACK[损坏的链接:无效的章节] sound server setup type. Due to differences depending on the hardware, whether a #Realtime kernel is used or not, and if further #System configuration is applied, there is no general preset.

The aim here is to find the best possible combination of buffer size and periods, given the hardware you have. Frames/Period = 256 is a sane starter. For onboard and USB devices, try Periods/Buffer = 3 before lowering both values. Commonly used values are: 256/3, 256/2, 128/3, 128/2.

另外,采样率也需要与硬件设备匹配,你可以通过以下命令查看设备支持的采样率选项:

$ cat /proc/asound/card0/codec#0

card0codec#0 替换为你的设备对应的值;在输出结果中,查找 Extended ID 中寻找 ratesVRA 的值。目前常见的采样率值为 48000 Hz,另外比较常见的值有 44100 Hz,96000 Hz 和 192000 Hz。

Almost always, when recording or sequencing with external gear is concerned, realtime is a must. Also, you may like to set maximum priority (at least 10 lower than system limits defined in /etc/security/limits.d/99-realtime-privileges.conf; the highest is for the device itself).

使用你找到的参数启动 jack,如下所示:

$ /usr/bin/jackd -R -P89 -dalsa -dhw:0 -r48000 -p128 -n2

可以使用 qjackctlcadencepatchagestudio-controls-gitAUR 通过图形界面来监控 JACK 的状态和修改配置。

注意: 配置好 JACK 后,建议使用多个不同的音频软件来验证你的配置。例如,对于 JACK 在 LMMS 上的 xrun 问题,不要当问题出在后者时花费过多时间排障。
建议阅读 Linux Magazine article (2006) 来理解 JACK 参数调优

验证延迟[编辑 | 编辑源代码]

JACK 参数在很大程度上影响着 往返延迟(RTD)。在本文中,这表示音频信号从录制,处理到回放这一过程的总耗时。下一部分将介绍影响 RTD 的各个来源相关背景,如果你已了解这一概念,可直接跳到 #测量延迟 一节,或是完全跳过该部分。

延迟来源[编辑 | 编辑源代码]

假设有一标准的歌手录音场景。歌手的声音以声速通过空气传播到麦克风并被捕获。接下来,通过模数转换使得捕获的电信号可以被计算机进行数字信号处理。最后,通过数模转换将信号传到歌手的耳机进行回放监听,与舞台监听系统的使用场景类似。

在这一场景中,有五个对 RTD 影响最大的延迟源,并按如下顺序出现:

  1. 声音从歌手的嘴通过空气进行传播
  2. 模数转换
  3. 数字信号处理
  4. 数模转换
  5. 声音通过空气传播到歌手的耳朵

由于在技术上,必须在录音及回放过程中保持特定距离才能获得理想的声音,因此很难对第一个及最后一个延迟源进行改善。另外,在近距离进行录制并使用耳机进行回放时,由声音传播造成的延迟通常在个位数毫秒范围内,对人类而言难以察觉。所以,需要通过优化其它延迟源来降低 RTD。

转换延迟[编辑 | 编辑源代码]

理论上,JACK 通过在采样过程中使用固定值(包括帧,周期及采样率)并对模数转换过程中的音频数据进行缓存来保持低延迟,反之亦然。采样过程中的延迟可以用以下公式描述:

Lc = n / f

Lc:毫秒(ms)为单位的采样延迟,n:帧或缓冲大小(从 16 开始的 2 的倍数),f:赫兹(Hz)为单位的采样率。

回放延迟同时用到了周期值:

Lp = n * p / f

Lp:毫秒(ms)为单位的回放延迟,n:帧或缓冲大小(从 16 开始的 2 的倍数),p: 周期值,f:赫兹(Hz)为单位的采样率。

如之前所说,音频接口的性能决定了可用的参数搭配,具体的配置需要你进行试错。虽然需要在防止 xrun 及低延迟间进行取舍,但现在的音频接口基本都可以通过高采样率(通常到 192 KHz)来满足该需求。The audio flux of JACK clients in the digital domain is about zero and thus, negligible for latency measurements [3].

更多信息可参考 ALSA 维基的FramesPeriods 一节。

测量延迟[编辑 | 编辑源代码]

在完成#JACK 参数配置后,你可能会想验证下当前 RTD。例如,在帧或缓存大小 n = 128,周期值 p = 2,采样率 f = 48000 时,采样延迟大约为 Lc = 2,666... ms,回放延迟大约为 Lp = 5,333... ms,加起来总往返延迟 RTD = 8 ms

注意: 根据声速可计算出该延迟值与舞台上使用距表演者耳朵距离在 2 m 到 3 m 之间的扬声器的典型监听情况相当。有过舞台经历的表演家通常已习惯该延迟。

由 Fons Adriaensen 编写的 jack_delay 工具可以在单个回放通道播放一个测试音,并在单个录制通道上进行捕获来,通过测量信号的相位差来估计整个链的往返延迟。建议使用合适的线缆将音频接口的输入和输出通道连一起,或是参照 JACK 延迟测试将音响和麦克风靠近放一起。

例如,在一台仅配置 JACK 的设备上,将 playback_1capture_1 (名称根据设备不同可能会改变)用线缆连接起来运行 jack_delay,并根据上文描述的参数得到以下输出:

$ jack_delay -O system:playback_1 -I system:capture_1
capture latency  = 128
playback_latency = 256
Signal below threshold...
Signal below threshold...
Signal below threshold...
  422.507 frames      8.802 ms total roundtrip latency
       extra loopback latency: 38 frames
       use 19 for the backend arguments -I and -O
  422.507 frames      8.802 ms total roundtrip latency
       extra loopback latency: 38 frames
       use 19 for the backend arguments -I and -O
  422.506 frames      8.802 ms total roundtrip latency
       extra loopback latency: 38 frames
       use 19 for the backend arguments -I and -O
  422.507 frames      8.802 ms total roundtrip latency
       extra loopback latency: 38 frames
       use 19 for the backend arguments -I and -O
<output omitted>

根据输出的提示,可以使用 -I 19-O 19 参数对 JACK 进行进一步优化,以补偿链中额外的回环延迟:

$ /usr/bin/jackd -R -P89 -dalsa -dhw:0 -r48000 -p128 -n2 -I19 -O19   
更多信息可参考 Ardour 文档中的 延迟与延迟补偿一节。

实时内核[编辑 | 编辑源代码]

"实时" 这一概念在操作系统中的 定义 为:操作的结果可以在固定时间内得出,只有在更广的意义上才是“与现实时间同步”,例如:用户在输入后可以立即产生相应的声音。这个案例称为“低延迟”,而达成它的操作这篇文章的主要目标之一。

从一段时间前开始,默认的 Linux 内核(Arch Linux 的初始内核默认CONFIG_PREEMPT=y 选项)已被证明适用于低延迟操作。操作系统中对延迟的定义为:从硬件中断的开始,到对应的中断线程开始运行的时间。不幸的是,某些硬件的驱动会导致更高的延迟。因此,根据你的硬件、驱动和需求,你可能需要一个满足 实时计算标准 的内核。

优势与劣势[编辑 | 编辑源代码]

Ingo Molnar 和 Thomas Gleixner 创造的 RT_PREEMPT 补丁集是对于软/硬实时应用而言非常有意思的选项,涵盖了从专业音频到工业控制等范围。大多数专注于音频的 Linux 发行版都启用了该补丁集。一个可实时抢占的内核也将使调整 IRQ 处理线程的优先级成为可能,并有助于确保几乎不受负载影响的流畅音频。

注意: 目前,在实时内核上使用某些应用会有些已知限制,通常与 虚拟化(例如 XenKVM)相关。如果你同时需要使用这类功能,可以考虑在默认 Arch Linux 内核外同时安装实时内核,并在 引导加载程序 创建另一个入口以按需启动到对应的内核。

安装[编辑 | 编辑源代码]

安装 linux-rt 或是 linux-rt-lts 包。

编译[编辑 | 编辑源代码]

如果你要使用 实时内核补丁集编译你自己的内核,请记住,移除模块或选项并不等同于精简内核。虽然内核映像的体积会减小,但现代的计算机系统以不再像 1995 年那时对大小敏感了。

更多信息可参考 如何正确配置带 PREEMPT_RT 的 Linux

不论如何,你必须要确保:

  • Timer Frequency 设为 1000Hz(CONFIG_HZ_1000=y;不使用 MIDI 可以无视该项)
  • 禁用 APMCONFIG_APM=n;在某些硬件上会产生问题 - 在 x86_64 中为默认配置)

If you truly want a slim system, we suggest you go your own way and deploy one with static /devs. You should, however, set your CPU architecture. Selecting "Core 2 Duo" for appropriate hardware will allow for a good deal of optimisation, but not so much as you go down the scale.

(实时)内核的常见问题:

  • 超线程(如果怀疑是它导致的问题,可以在 UEFI 设置中将其禁用)

Tips and tricks[编辑 | 编辑源代码]

  • Disable WiFi and close any programs that do not need to be open when recording such as browsers. Many have reported disabling WiFi has led to more reliable JACK performance.
  • Some USB audio hardware is known not to work properly when plugged into USB 3 ports so try USB 2/1 ports instead.
  • IRQ issues can occur and cause problems. An example is video hardware reserving the bus, causing needless interrupts in the system I/O path. See discussion at FFADO IRQ Priorities How-To. If you have a realtime or a recent kernel, you can use rtirq to adjust priorities of IRQ handling threads.
  • Do not use the irqbalance daemon, or do so carefully [4].
  • If you need to use multiple audio devices with JACK2, the alsa_in and alsa_out utilities can be used to have extra devices wrapped and show up as outputs in the JACK patchbay.
  • Some daemons/processes can unexpectedly cause xruns. If you do not need it - kill it. No questions asked.
$ ls /var/run/daemons
$ top # or htop, ps aux, whatever you are comfortable with
$ killall -9 $processname
# systemctl stop $daemonname
  • If you are facing a lot of xruns especially with nvidia, disable your GPU throttling. This can be done via the card's control applet and for NVIDIA it is "prefer maximum performance" (thanks to a post in LAU by Frank Kober[5]).

软件[编辑 | 编辑源代码]

Arch Linux provides the package group pro-audio包组 holding all relevant (semi-) professional applications. All applications in the pro-audio package group are JACK clients. Also lv2-plugins包组, ladspa-plugins包组, dssi-plugins包组 and vst-plugins包组 are subgroups of the pro-audio group.

提示: See Pacman/Tips and tricks#Listing packages for listing members of and Pacman#Installing package groups for installing package groups.

An overview and brief information on some applications is found in List of applications/Multimedia#Audio. Especially the categories Digital audio workstations, Audio effects and Music trackers, as well as Audio synthesis environments and Sound generators, provide examples of pro audio software for e.g. recording, mixing, mastering, and sound design. Other categories include Scorewriters, Audio editors, Audio converters, and DJ software.

Packages not (yet) in the official repositories can be found in proaudio. Browse the list of packages to find the application you need or request packaging of your desired applications via GitHub.

Hardware[编辑 | 编辑源代码]

The majority of sound cards and audio devices will work with no extra configuration or packages, simply set JACK to use the desired one.

This is not true for all devices, have a look at the Category:Sound as well as Envy24control#Supported cards for those special cases.

Get help[编辑 | 编辑源代码]

Mailing lists[编辑 | 编辑源代码]

  • Arch Linux Pro-audio Discussion about real-time multimedia, including (semi-)pro audio and video.
  • Linux Audio User The Linux pro-audio related mailing list with much traffic and a huge subscriber community of users and developers.

IRC[编辑 | 编辑源代码]

  • #archlinux-proaudio - Arch Linux pro-audio channel
  • #lau - General Linux Audio channel for users
  • #jack - Development and support related to JACK audio system
  • #lv2 - Development and support related to the LV2 plugin format
  • #ardour - Discussion and support relating to the Ardour DAW
  • #opensourcemusicians - Large general OSS musician discussion channel

See also[编辑 | 编辑源代码]