转自:http://www.voidcn.com/article/p-snamarwr-p.htmlphp
高级Linux声音体系(英语:Advanced LinuxSound Architecture,缩写为ALSA)是Linux内核中,为声卡提供的驱动组件,以替代原先的OSS(开放声音系统)。 一部分的目的是支持声卡的自动配置,以及完美的处理系统中的多个声音设备,这些目的大多都已达到。另外一个声音框架JACK使用ALSA提供低延迟的专业级音频编辑和混音能力。html
Jaroslav Kysela过去是这个项目的领导者,这个项目开始于为1998年Gravis Ultrasound所开发的驱动,它一直做为一个单独的软件包开发,直到2002年他被引进入Linux内核的开发版本 (2.5.4-2.5.5)。从2.6版本开始ALSA成为Linux内核中默认的标准音频驱动程序集,OSS则被标记为废弃。编程
ALSA是一个彻底开放源代码的音频驱动程序集,除了像OSS那样提供了一组内核驱动程序模块以外,ALSA还专门为简化应用程序的编写提供了相应的函数库,与OSS提供的基于ioctl的原始编程接口相比,ALSA函数库使用起来要更加方便一些。利用该函数库,开发人员能够方便快捷的开发出本身的应用程序,细节则留给函数库内部处理。固然ALSA也提供了相似于OSS的系统接口,不过ALSA的开发者建议应用程序开发者使用音频函数库而不是驱动程序的API。app
ALSA体系主要分为三层,按照调用关系依次是,app、alsa-lib、kerneldriver。框架
Kernel driver 层,为内核驱动代码,主要在内核源码中的sound目录下,负责对硬件进行控制与操做。驱动建立的设备文件,在文件系统中的/dev/snd/目录下。注意,应用层使用alsa-API中打开的设备文件,并非/dev/snd/目录下的文件,而是alsa-lib对设备的再一次封装的产物,叫作plugins,如plughw:0,0 ,后面详细解释。函数
alsa驱动的设备文件结构: 字符设备
# ls /dev/snd/ -lh
total 0
crw-rw---- 1 root root 116, 0 Aug 21 16:01 controlC0
crw-rw---- 1 root root 116, 24 Aug 21 16:01 pcmC0D0c
crw-rw---- 1 root root 116, 16 Aug 21 16:01 pcmC0D0p
crw-rw---- 1 root root 116, 25 Aug 21 16:01 pcmC0D1c
crw-rw---- 1 root root 116, 17 Aug 21 16:01 pcmC0D1p
crw-rw---- 1 root root 116, 26 Aug 21 16:01 pcmC0D2c
crw-rw---- 1 root root 116, 33 Aug 21 16:01 timer
controlC0 用于声卡的控制,例如通道选择,混音,麦克风的控制等
pcmC0D0c 用于录音的pcm设备
pcmC0D0p 用于播放的pcm设备
timer 定时器
C0D0表明的是声卡0中的设备0,pcmC0D0c最后一个c表明capture,pcmC0D0p最后一个p表明playback,这些都是alsa-driver中的命名规则。spa
Alsa-lib层,为不一样的驱动提供统一的接口alsa API,简化了开发人员对于驱动层的调用开发。主要有以下接口开放源代码
网址:https://www.alsa-project.org/alsa-doc/alsa-lib/插件
The currently designed interfaces are listed below:线程
Information Interface (/proc/asound)
Control Interface (/dev/snd/controlCX)
Mixer Interface (/dev/snd/mixerCXDX)
PCM Interface (/dev/snd/pcmCXDX)
Raw MIDI Interface (/dev/snd/midiCXDX)
Sequencer Interface (/dev/snd/seq)
Timer Interface (/dev/snd/timer)
咱们在应用中,主要使用的是 PCM 接口。如Snd_pcm_open()函数。
除了Alsa-API接口之外,alsa-lib还能够经过配置文件,开放其附加功能,如采样率转换、软件混音等。
咱们就是利用alsa-lib的附加功能实现咱们的重采样功能,修改的地方主要包括alsa-lib的配置和APP调用两方面。下一章对如何利用alsa-lib的配置文件开放其采样率转换功能进行描述。
asound.conf配置文件,是alsa-lib的默认配置文件,路径在 /etc/,能够用来配置alsa库的一些附加功能。这个文件不是alsa库运行时所必须的,没有它alsa库也能够正常运行。
关于asound.conf的配置,能够参考如下文档:
http://www.alsa-project.org/main/index.php/Asoundrc
先阐述一些重要的名词:
Card:声卡,直接对应硬件,ID从0开始计数。
Device:设备,在一个card上,能够有多个device,每一个device能够独立被打开和使用,ID从0开始计数。
Plugin:插件,前文说过,应用层调用alsa库时,操做的并非驱动层建立的设备文件,而是这个plugins,plugin是alsa库对音频处理设备的抽象,hw plugin为硬件设备抽象出的plugin,是最基础的模块,不须要对alsa-lib进行配置便可使用,咱们常见的plughw:0,0含义就是类型为hw的plugin,编号声卡0上面的设备0。除了hw类型的plugin外,还有一些纯软件实现的模块,能够用来进行音频处理,例如,能够实现音频采样率转换的rate plugin,能够用来混音的dmix plugin等等。
Slave:从属设备,能够把几个plugin链接起来,sink端的设备就是source端设备的slave。
须要使用这些附加的plugin,就要对配置文件(asound.conf)进行配置,这个配置是实时生效的,因此咱们没必要修改文件系统中的文件,而是在运行咱们的应用程序以前,将本身的配置文件拷贝到/etc/下,对默认的配置文件进行覆盖就好了。
具体如何配置,书写格式,请参看Asoundrc文档。
如下就是个人配置,
pcm_slave.sl2 {
pcm"plughw:0,1"
rate48000
}
pcm.rate_convert {
typerate
slavesl2
}
这个配置的含义是,
下面一段:建立一个使用pcm API接口的设备,叫作rate_convert,它的类型是rate(能够实现采样率转换的plugin),它有一个slave叫作sl2;
上面一段:定义一个使用pcm接口的slave,叫作sl2,他其实是plughw:0,1这个设备的别名,即等同于plughw:0,1(对应我用于播放的AIC3104芯片),这个设备须要的采样率是48KHz。
经过这个配置,就能够在app中,使用pcm API打开rate_convert这个设备,并把解码后的8K采样率的PCM数据,直接使用snd_pcm_writei写入设备,rate_convert这个设备就能够自动将PCM数据重采样至48KHz,而后自动传递给plughw:0,1进行播放。
在看Asoundrc的文档中,一直不明白,为何在配置文件中,只有输出的采样率配置,而没有输入的采样率配置,要重采样,alsa-lib总得知道把啥转换成48K吧,
在实践中发现,能够经过APP调用alsa-API中的snd_pcm_hw_params_set_rate_near()函数将数据源的采样率为8K传递给alsa-lib。下面一章对app调用alsa-API进行说明。
在app调用这块儿,其余的通用调用流程在这里就不累述了,使用个项目原来的那套代码就行,只有三块儿须要修改和注意:
一、使用snd_pcm_open()打开的设备文件rate_convert(不需再打开plughw:0,1了),PCM数据的原始采样率,用snd_pcm_hw_params_set_rate_near()对rate_convert进行配置。
二、重要的参数Period_size,即播放周期大小,单位为Byte,需使用snd_pcm_hw_params_set_period_size_near()进行配置,若是period_size配的不对,或者不配置,会发生underRun,播放声音断断续续。
8K pcm, 配置sample_rate为8000,配置period_size为256
48K pcm, 配置sample_rate为48000,配置period_size为1024
三、配置负责playback的AIC3104的采样率为48K
在研究alsa-lib的调用时,还有一些没有搞明白的地方,这里记录下来,未来你们有时间能够研究研究。
一、个人设备上音频输入输出分开使用了两块AIC3104,这样重采样后G711的自编自解就不成问题,由于输入的AIC3104设为8K,输出的AIC3104设为48K播放重采样后的数据,若是系统中只使用一块AIC3104,就必须对输入的PCM数据也进行一次重采样,这里没有进行研究。
二、多设备绑定,假如咱们系统中有多个playback设备,如今的作法是启两个线程,分别写入数据,若是可使用alsa-lib的slave配置将多个设备进行绑定,例如一个rate plugin绑定两个 hw plugin,而后只需向这一个rate plugin写入数据便可,不会遇到两个播放线程同步的问题,我试了一下,只能绑定一个slave,再多绑一个,第一个slave就会没有播放声音。
三、混音功能,这个混音功能看似是很是强大的,它能够把多个不一样采样率的通道,混合成一路统一采样率的数据进行播放,若是咱们之后能够进行多路解码,或者要实现视频会议中MCU的功能,那势必要用到这个功能,在这里尚未进行深究。