linux音频采集

采集的时候,先写wav头文件,头文件格式以下:linux

  表1 WAV文件的文件头git

  

偏移地址 字节数 类型 内容
00H~03H 4 字符 资源交换文件标志(RIFF)
04H~07H 4 长整数 从下个地址开始到文件尾的总字节数
08H~0BH 4 字符 WAV文件标志(WAVE)
0CH~0FH 4 字符 波形格式标志(FMT)
10H~13H 4 整数 过滤字节(通常为00000010H)
14H~15H 2 整数 格式种类(值为1时,表示数据为线性PCM编码)
16H~17H 2 整数 通道数,单声道为1,双声音为2
18H~1BH 4 长整数 采样频率
1CH~1FH 4 长整数 波形数据传输速率(每秒平均字节数)
20H~21H 2 整数 数据的调整数(按字节计算)
22H~23H 2 整数 样本数据位数

  表2 WAV声音文件的数据块程序员

 WAV文件做为最经典的Windows多媒体音频格式,应用很是普遍,它使用三个参数来表示声音:采样位数、采样频率和声道数。编程

  声道有单声道和立体声之分,采样频率通常有11025Hz(11kHz)、22050Hz(22kHz)和44100Hz(44kHz)三种。WAV文件所占容量=(采样频率×采样位数×声道)×时间/8(1字节=8bit)。安全

偏移地址 字节数 类型 内容
24H~27H 4 字符 数据标志符(data)
28H~2BH 4 长整型 采样数据总数
2CH... ... 采样数据
虽然目前Linux的优点主要体如今网络服务方面,但事实上一样也有着很是丰富的媒体功能,本文就是以多媒体应用中最基本的声音为对象,介绍如何在Linux平台下开发实际的音频应用程序,同时还给出了一些经常使用的音频编程框架。 1、数字音频 音频信号是一种连续变化的模拟信号,但计算机只能处理和记录二进制的数字信号,由天然音源获得的音频信号必须通过必定的变换,成为数字音频信号以后,才能送到计算机中做进一步的处理。 数字音频系统经过将声波的波型转换成一系列二进制数据,来实现对原始声音的重现,实现这一步骤的设备常被称为模/数转换器(A/D)。A/D转换器以每秒钟上万次的速率对声波进行采样,每一个采样点都记录下了原始模拟声波在某一时刻的状态,一般称之为样本(sample),而每一秒钟所采样的数目则称为采样频率,经过将一串连续的样本链接起来,就能够在计算机中描述一段声音了。对于采样过程当中的每个样原本说,数字音频系统会分配必定存储位来记录声波的振幅,通常称之为采样分辩率或者采样精度,采样精度越高,声音还原时就会越细腻。 数字音频涉及到的概念很是多,对于在Linux下进行音频编程的程序员来讲,最重要的是理解声音数字化的两个关键步骤:采样和量化。采样就是每隔必定时间就读一次声音信号的幅度,而量化则是将采样获得的声音信号幅度转换为数字值,从本质上讲,采样是时间上的数字化,而量化则是幅度上的数字化。下面介绍几个在进行音频编程时常常须要用到的技术指标: 采样频率  采样频率是指将模拟声音波形进行数字化时,每秒钟抽取声波幅度样本的次数。采样频率的选择应该遵循奈奎斯特(Harry Nyquist)采样理论:若是对某一模拟信号进行采样,则采样后可还原的最高信号频率只有采样频率的一半,或者说只要采样频率高于输入信号最高频率的两倍,就能从采样信号系列重构原始信号。正常人听觉的频率范围大约在20Hz~20kHz之间,根据奈奎斯特采样理论,为了保证声音不失真,采样频率应该在40kHz左右。经常使用的音频采样频率有8kHz、11.025kHz、22.05kHz、16kHz、37.8kHz、44.1kHz、48kHz等,若是采用更高的采样频率,还能够达到DVD的音质。 量化位数  量化位数是对模拟音频信号的幅度进行数字化,它决定了模拟信号数字化之后的动态范围,经常使用的有8位、12位和16位。量化位越高,信号的动态范围越大,数字化后的音频信号就越可能接近原始信号,但所须要的存贮空间也越大。 声道数  声道数是反映音频数字化质量的另外一个重要因素,它有单声道和双声道之分。双声道又称为立体声,在硬件中有两条线路,音质和音色都要优于单声道,但数字化后占据的存储空间的大小要比单声道多一倍。 回页首  2、声卡驱动 出于对安全性方面的考虑,Linux下的应用程序没法直接对声卡这类硬件设备进行操做,而是必须经过内核提供的驱动程序才能完成。在Linux上进行音频编程的本质就是要借助于驱动程序,来完成对声卡的各类操做。 对硬件的控制涉及到寄存器中各个比特位的操做,一般这是与设备直接相关而且对时序的要求很是严格,若是这些工做都交由应用程序员来负责,那么对声卡的编程将变得异常复杂而困难起来,驱动程序的做用正是要屏蔽硬件的这些底层细节,从而简化应用程序的编写。目前Linux下经常使用的声卡驱动程序主要有两种:OSS和ALSA。 最先出如今Linux上的音频编程接口是OSS(Open Sound System),它由一套完整的内核驱动程序模块组成,能够为绝大多数声卡提供统一的编程接口。OSS出现的历史相对较长,这些内核模块中的一部分(OSS/Free)是与Linux内核源码共同免费发布的,另一些则以二进制的形式由4Front Technologies公司提供。因为获得了商业公司的鼎力支持,OSS已经成为在Linux下进行音频编程的事实标准,支持OSS的应用程序可以在绝大多数声卡上工做良好。 虽然OSS已经很是成熟,但它毕竟是一个没有彻底开放源代码的商业产品,ALSA(Advanced Linux Sound Architecture)刚好弥补了这一空白,它是在Linux下进行音频编程时另外一个可供选择的声卡驱动程序。ALSA除了像OSS那样提供了一组内核驱动程序模块以外,还专门为简化应用程序的编写提供了相应的函数库,与OSS提供的基于ioctl的原始编程接口相比,ALSA函数库使用起来要更加方便一些。ALSA的主要特色有: 支持多种声卡设备  模块化的内核驱动程序  支持SMP和多线程  提供应用开发函数库  兼容OSS应用程序  ALSA和OSS最大的不一样之处在于ALSA是由志愿者维护的自由项目,而OSS则是由公司提供的商业产品,所以在对硬件的适应程度上OSS要优于ALSA,它可以支持的声卡种类更多。ALSA虽然不及OSS运用得普遍,但却具备更加友好的编程接口,而且彻底兼容于OSS,对应用程序员来说无疑是一个更佳的选择。 回页首  3、编程接口 如何对各类音频设备进行操做是在Linux上进行音频编程的关键,经过内核提供的一组系统调用,应用程序可以访问声卡驱动程序提供的各类音频设备接口,这是在Linux下进行音频编程最简单也是最直接的方法。 3.1 访问音频设备 不管是OSS仍是ALSA,都是之内核驱动程序的形式运行在Linux内核空间中的,应用程序要想访问声卡这一硬件设备,必须借助于Linux内核所提供的系统调用(system call)。从程序员的角度来讲,对声卡的操做在很大程度上等同于对磁盘文件的操做:首先使用open系统调用创建起与硬件间的联系,此时返回的文件描述符将做为随后操做的标识;接着使用read系统调用从设备接收数据,或者使用write系统调用向设备写入数据,而其它全部不符合读/写这一基本模式的操做均可以由ioctl系统调用来完成;最后,使用close系统调用告诉Linux内核不会再对该设备作进一步的处理。 open系统调用  系统调用open能够得到对声卡的访问权,同时还能为随后的系统调用作好准备,其函数原型以下所示: int open(const char *pathname, int flags, int mode); 参数pathname是将要被打开的设备文件的名称,对于声卡来说通常是/dev/dsp。参数flags用来指明应该以什么方式打开设备文件,它能够是O_RDONLY、O_WRONLY或者O_RDWR,分别表示以只读、只写或者读写的方式打开设备文件;参数mode一般是可选的,它只有在指定的设备文件不存在时才会用到,指明新建立的文件应该具备怎样的权限。 若是open系统调用可以成功完成,它将返回一个正整数做为文件标识符,在随后的系统调用中须要用到该标识符。若是open系统调用失败,它将返回-1,同时还会设置全局变量errno,指明是什么缘由致使了错误的发生。 read系统调用  系统调用read用来从声卡读取数据,其函数原型以下所示: int read(int fd, char *buf, size_t count); 参数fd是设备文件的标识符,它是经过以前的open系统调用得到的;参数buf是指向缓冲区的字符指针,它用来保存从声卡得到的数据;参数count则用来限定从声卡得到的最大字节数。若是read系统调用成功完成,它将返回从声卡实际读取的字节数,一般状况会比count的值要小一些;若是read系统调用失败,它将返回-1,同时还会设置全局变量errno,来指明是什么缘由致使了错误的发生。 write系统调用  系统调用write用来向声卡写入数据,其函数原型以下所示: size_t write(int fd, const char *buf, size_t count); 系统调用write和系统调用read在很大程度是相似的,差异只在于write是向声卡写入数据,而read则是从声卡读入数据。参数fd一样是设备文件的标识符,它也是经过以前的open系统调用得到的;参数buf是指向缓冲区的字符指针,它保存着即将向声卡写入的数据;参数count则用来限定向声卡写入的最大字节数。 若是write系统调用成功完成,它将返回向声卡实际写入的字节数;若是read系统调用失败,它将返回-1,同时还会设置全局变量errno,来指明是什么缘由致使了错误的发生。不管是read仍是write,一旦调用以后Linux内核就会阻塞当前应用程序,直到数据成功地从声卡读出或者写入为止。 ioctl系统调用  系统调用ioctl能够对声卡进行控制,凡是对设备文件的操做不符合读/写基本模式的,都是经过ioctl来完成的,它能够影响设备的行为,或者返回设备的状态,其函数原型以下所示: int ioctl(int fd, int request, ...); 参数fd是设备文件的标识符,它是在设备打开时得到的;若是设备比较复杂,那么对它的控制请求相应地也会有不少种,参数request的目的就是用来区分不一样的控制请求;一般说来,在对设备进行控制时还须要有其它参数,这要根据不一样的控制请求才能肯定,而且多是与硬件设备直接相关的。 close系统调用  当应用程序使用完声卡以后,须要用close系统调用将其关闭,以便及时释放占用的硬件资源,其函数原型以下所示: int close(int fd); 参数fd是设备文件的标识符,它是在设备打开时得到的。一旦应用程序调用了close系统调用,Linux内核就会释放与之相关的各类资源,所以建议在不须要的时候尽可能及时关闭已经打开的设备。 3.2 音频设备文件 对于Linux应用程序员来说,音频编程接口实际上就是一组音频设备文件,经过它们能够从声卡读取数据,或者向声卡写入数据,而且可以对声卡进行控制,设置采样频率和声道数目等等。 /dev/sndstat  设备文件/dev/sndstat是声卡驱动程序提供的最简单的接口,一般它是一个只读文件,做用也仅仅只限于汇报声卡的当前状态。通常说来,/dev/sndstat是提供给最终用户来检测声卡的,不宜用于程序当中,由于全部的信息均可以经过ioctl系统调用来得到。 Linux提供的cat命令能够很方便地从/dev/sndstat得到声卡的当前状态: [xiaowp@linuxgam sound]$ cat /dev/sndstat /dev/dsp  声卡驱动程序提供的/dev/dsp是用于数字采样(sampling)和数字录音(recording)的设备文件,它对于Linux下的音频编程来说很是重要:向该设备写数据即意味着激活声卡上的D/A转换器进行放音,而向该设备读数据则意味着激活声卡上的A/D转换器进行录音。目前许多声卡都提供有多个数字采样设备,它们在Linux下能够经过/dev/dsp1等设备文件进行访问。 DSP是数字信号处理器(Digital Signal Processor)的简称,它是用来进行数字信号处理的特殊芯片,声卡使用它来实现模拟信号和数字信号的转换。声卡中的DSP设备实际上包含两个组成部分:在以只读方式打开时,可以使用A/D转换器进行声音的输入;而在以只写方式打开时,则可以使用D/A转换器进行声音的输出。严格说来,Linux下的应用程序要么以只读方式打开/dev/dsp输入声音,要么以只写方式打开/dev/dsp输出声音,但事实上某些声卡驱动程序仍容许以读写的方式打开/dev/dsp,以便同时进行声音的输入和输出,这对于某些应用场合(如IP电话)来说是很是关键的。 在从DSP设备读取数据时,从声卡输入的模拟信号通过A/D转换器变成数字采样后的样本(sample),保存在声卡驱动程序的内核缓冲区中,当应用程序经过read系统调用从声卡读取数据时,保存在内核缓冲区中的数字采样结果将被复制到应用程序所指定的用户缓冲区中。须要指出的是,声卡采样频率是由内核中的驱动程序所决定的,而不取决于应用程序从声卡读取数据的速度。若是应用程序读取数据的速度过慢,以至低于声卡的采样频率,那么多余的数据将会被丢弃;若是读取数据的速度过快,以至高于声卡的采样频率,那么声卡驱动程序将会阻塞那些请求数据的应用程序,直到新的数据到来为止。 在向DSP设备写入数据时,数字信号会通过D/A转换器变成模拟信号,而后产生出声音。应用程序写入数据的速度一样应该与声卡的采样频率相匹配,不然过慢的话会产生声音暂停或者停顿的现象,过快的话又会被内核中的声卡驱动程序阻塞,直到硬件有能力处理新的数据为止。与其它设备有所不一样,声卡一般不会支持非阻塞(non-blocking)的I/O操做。 不管是从声卡读取数据,或是向声卡写入数据,事实上都具备特定的格式(format),默认为8位无符号数据、单声道、8KHz采样率,若是默认值没法达到要求,能够经过ioctl系统调用来改变它们。一般说来,在应用程序中打开设备文件/dev/dsp以后,接下去就应该为其设置恰当的格式,而后才能从声卡读取或者写入数据。 /dev/audio  /dev/audio相似于/dev/dsp,它兼容于Sun工做站上的音频设备,使用的是mu-law编码方式。若是声卡驱动程序提供了对/dev/audio的支持,那么在Linux上就能够经过cat命令,来播放在Sun工做站上用mu-law进行编码的音频文件: [xiaowp@linuxgam sound]$ cat audio.au > /dev/audio 因为设备文件/dev/audio主要出于对兼容性的考虑,因此在新开发的应用程序中最好不要尝试用它,而应该以/dev/dsp进行替代。对于应用程序来讲,同一时刻只能使用/dev/audio或者/dev/dsp其中之一,由于它们是相同硬件的不一样软件接口。 /dev/mixer  在声卡的硬件电路中,混音器(mixer)是一个很重要的组成部分,它的做用是将多个信号组合或者叠加在一块儿,对于不一样的声卡来讲,其混音器的做用可能各不相同。运行在Linux内核中的声卡驱动程序通常都会提供/dev/mixer这一设备文件,它是应用程序对混音器进行操做的软件接口。混音器电路一般由两个部分组成:输入混音器(input mixer)和输出混音器(output mixer)。 输入混音器负责从多个不一样的信号源接收模拟信号,这些信号源有时也被称为混音通道或者混音设备。模拟信号经过增益控制器和由软件控制的音量调节器后,在不一样的混音通道中进行级别(level)调制,而后被送到输入混音器中进行声音的合成。混音器上的电子开关能够控制哪些通道中有信号与混音器相连,有些声卡只容许链接一个混音通道做为录音的音源,而有些声卡则容许对混音通道作任意的链接。通过输入混音器处理后的信号仍然为模拟信号,它们将被送到A/D转换器进行数字化处理。 输出混音器的工做原理与输入混音器相似,一样也有多个信号源与混音器相连,而且事先都通过了增益调节。当输出混音器对全部的模拟信号进行了混合以后,一般还会有一个总控增益调节器来控制输出声音的大小,此外还有一些音调控制器来调节输出声音的音调。通过输出混音器处理后的信号也是模拟信号,它们最终会被送给喇叭或者其它的模拟输出设备。对混音器的编程包括如何设置增益控制器的级别,以及怎样在不一样的音源间进行切换,这些操做一般来说是不连续的,并且不会像录音或者放音那样须要占用大量的计算机资源。因为混音器的操做不符合典型的读/写操做模式,所以除了open和close两个系统调用以外,大部分的操做都是经过ioctl系统调用来完成的。与/dev/dsp不一样,/dev/mixer容许多个应用程序同时访问,而且混音器的设置值会一直保持到对应的设备文件被关闭为止。 为了简化应用程序的设计,Linux上的声卡驱动程序大多都支持将混音器的ioctl操做直接应用到声音设备上,也就是说若是已经打开了/dev/dsp,那么就不用再打开/dev/mixer来对混音器进行操做,而是能够直接用打开/dev/dsp时获得的文件标识符来设置混音器。 /dev/sequencer  目前大多数声卡驱动程序还会提供/dev/sequencer这一设备文件,用来对声卡内建的波表合成器进行操做,或者对MIDI总线上的乐器进行控制,通常只用于计算机音乐软件中。 回页首  4、应用框架 在Linux下进行音频编程时,重点在于如何正确地操做声卡驱动程序所提供的各类设备文件,因为涉及到的概念和因素比较多,因此遵循一个通用的框架无疑将有助于简化应用程序的设计。 4.1 DSP编程 对声卡进行编程时首先要作的是打开与之对应的硬件设备,这是借助于open系统调用来完成的,而且通常状况下使用的是/dev/dsp文件。采用何种模式对声卡进行操做也必须在打开设备时指定,对于不支持全双工的声卡来讲,应该使用只读或者只写的方式打开,只有那些支持全双工的声卡,才能以读写的方式打开,而且还要依赖于驱动程序的具体实现。Linux容许应用程序屡次打开或者关闭与声卡对应的设备文件,从而可以很方便地在放音状态和录音状态之间进行切换,建议在进行音频编程时只要有可能就尽可能使用只读或者只写的方式打开设备文件,由于这样不只可以充分利用声卡的硬件资源,并且还有利于驱动程序的优化。下面的代码示范了如何以只写方式打开声卡进行放音(playback)操做: int handle = open("/dev/dsp", O_WRONLY); if (handle == -1) {         perror("open /dev/dsp");         return -1; } 运行在Linux内核中的声卡驱动程序专门维护了一个缓冲区,其大小会影响到放音和录音时的效果,使用ioctl系统调用能够对它的尺寸进行恰当的设置。调节驱动程序中缓冲区大小的操做不是必须的,若是没有特殊的要求,通常采用默认的缓冲区大小也就能够了。但须要注意的是,缓冲区大小的设置一般应紧跟在设备文件打开以后,这是由于对声卡的其它操做有可能会致使驱动程序没法再修改其缓冲区的大小。下面的代码示范了怎样设置声卡驱动程序中的内核缓冲区的大小: int setting = 0xnnnnssss; int result = ioctl(handle, SNDCTL_DSP_SETFRAGMENT, &setting); if (result == -1) {         perror("ioctl buffer size");         return -1; } // 检查设置值的正确性 在设置缓冲区大小时,参数setting实际上由两部分组成,其低16位标明缓冲区的尺寸,相应的计算公式为buffer_size = 2^ssss,即若参数setting低16位的值为16,那么相应的缓冲区的大小会被设置为65536字节。参数setting的高16位则用来标明分片(fragment)的最大序号,它的取值范围从2一直到0x7FFF,其中0x7FFF表示没有任何限制。 接下来要作的是设置声卡工做时的声道(channel)数目,根据硬件设备和驱动程序的具体状况,能够将其设置为0(单声道,mono)或者1(立体声,stereo)。下面的代码示范了应该怎样设置声道数目: int channels = 0; // 0=mono 1=stereo int result = ioctl(handle, SNDCTL_DSP_STEREO, &channels); if ( result == -1 ) {         perror("ioctl channel number");         return -1; } if (channels != 0) {         // 只支持立体声 } 采样格式和采样频率是在进行音频编程时须要考虑的另外一个问题,声卡支持的全部采样格式能够在头文件soundcard.h中找到,而经过ioctl系统调用则能够很方便地更改当前所使用的采样格式。下面的代码示范了如何设置声卡的采样格式: int format = AFMT_U8; int result = ioctl(handle, SNDCTL_DSP_SETFMT, &format); if ( result == -1 ) {         perror("ioctl sample format");         return -1; } // 检查设置值的正确性 声卡采样频率的设置也很是容易,只需在调用ioctl时将第二个参数的值设置为SNDCTL_DSP_SPEED,同时在第三个参数中指定采样频率的数值就好了。对于大多数声卡来讲,其支持的采样频率范围通常为5kHz到44.1kHz或者48kHz,但并不意味着该范围内的全部频率都会被硬件支持,在Linux下进行音频编程时最经常使用到的几种采样频率是11025Hz、16000Hz、22050Hz、32000Hz和44100Hz。下面的代码示范了如何设置声卡的采样频率: int rate = 22050; int result = ioctl(handle, SNDCTL_DSP_SPEED, &rate); if ( result == -1 ) {         perror("ioctl sample format");         return -1; } // 检查设置值的正确性 4.2 Mixer编程 声卡上的混音器由多个混音通道组成,它们能够经过驱动程序提供的设备文件/dev/mixer进行编程。对混音器的操做是经过ioctl系统调用来完成的,而且全部控制命令都由SOUND_MIXER或者MIXER开头,表1列出了经常使用的几个混音器控制命令: 名 称 做 用  SOUND_MIXER_VOLUME 主音量调节  SOUND_MIXER_BASS 低音控制  SOUND_MIXER_TREBLE 高音控制  SOUND_MIXER_SYNTH FM合成器  SOUND_MIXER_PCM 主D/A转换器  SOUND_MIXER_SPEAKER PC喇叭  SOUND_MIXER_LINE 音频线输入  SOUND_MIXER_MIC 麦克风输入  SOUND_MIXER_CD CD输入  SOUND_MIXER_IMIX 回放音量  SOUND_MIXER_ALTPCM 从D/A 转换器  SOUND_MIXER_RECLEV 录音音量  SOUND_MIXER_IGAIN 输入增益  SOUND_MIXER_OGAIN 输出增益  SOUND_MIXER_LINE1 声卡的第1输入  SOUND_MIXER_LINE2 声卡的第2输入  SOUND_MIXER_LINE3 声卡的第3输入  表1 混音器命令  对声卡的输入增益和输出增益进行调节是混音器的一个主要做用,目前大部分声卡采用的是8位或者16位的增益控制器,但做为程序员来说并不须要关心这些,由于声卡驱动程序会负责将它们变换成百分比的形式,也就是说不管是输入增益仍是输出增益,其取值范围都是从0到100。在进行混音器编程时,可使用SOUND_MIXER_READ宏来读取混音通道的增益大小,例如在获取麦克风的输入增益时,可使用以下的代码: int vol; ioctl(fd, SOUND_MIXER_READ(SOUND_MIXER_MIC), &vol); printf("Mic gain is at %d %%\n", vol); 对于只有一个混音通道的单声道设备来讲,返回的增益大小保存在低位字节中。而对于支持多个混音通道的双声道设备来讲,返回的增益大小实际上包括两个部分,分别表明左、右两个声道的值,其中低位字节保存左声道的音量,而高位字节则保存右声道的音量。下面的代码能够从返回值中依次提取左右声道的增益大小: int left, right; left = vol & 0xff; right = (vol & 0xff00) >> 8; printf("Left gain is %d %%, Right gain is %d %%\n", left, right); 相似地,若是想设置混音通道的增益大小,则能够经过SOUND_MIXER_WRITE宏来实现,此时遵循的原则与获取增益值时的原则基本相同,例以下面的语句能够用来设置麦克风的输入增益: vol = (right << 8) + left; ioctl(fd, SOUND_MIXER_WRITE(SOUND_MIXER_MIC), &vol); 在编写实用的音频程序时,混音器是在涉及到兼容性时须要重点考虑的一个对象,这是由于不一样的声卡所提供的混音器资源是有所区别的。声卡驱动程序提供了多个ioctl系统调用来得到混音器的信息,它们一般返回一个整型的位掩码(bitmask),其中每一位分别表明一个特定的混音通道,若是相应的位为1,则说明与之对应的混音通道是可用的。例如经过SOUND_MIXER_READ_DEVMASK返回的位掩码,能够查询出可以被声卡支持的每个混音通道,而经过SOUND_MIXER_READ_RECMAS返回的位掩码,则能够查询出可以被看成录音源的每个通道。下面的代码能够用来检查CD输入是不是一个有效的混音通道:   ioctl(fd, SOUND_MIXER_READ_DEVMASK, &devmask); if (devmask & SOUND_MIXER_CD)   printf("The CD input is supported");     若是进一步还想知道其是不是一个有效的录音源,则可使用以下语句: ioctl(fd, SOUND_MIXER_READ_RECMASK, &recmask); if (recmask & SOUND_MIXER_CD)   printf("The CD input can be a recording source"); 目前大多数声卡提供多个录音源,经过SOUND_MIXER_READ_RECSRC能够查询出当前正在使用的录音源,同一时刻可以使用几个录音源是由声卡硬件决定的。相似地,使用SOUND_MIXER_WRITE_RECSRC能够设置声卡当前使用的录音源,例以下面的代码能够将CD输入做为声卡的录音源使用: devmask = SOUND_MIXER_CD; ioctl(fd, SOUND_MIXER_WRITE_DEVMASK, &devmask);