【转】Alsa音频编程【精华】

1、前序git

这里了解一下各个参数的含义以及一些基本概念。程序员

声音是连续模拟量,计算机将它离散化以后用数字表示,就有了如下几个名词术语。编程

样本长度(sample):样本是记录音频数据最基本的单位,计算机对每一个通道采样量化时数字比特位数,常见的有8位和16位。缓存

通道数(channel):该参数为1表示单声道,2则是立体声。网络

帧(frame):记录了一个声音单元,其长度为样本长度与通道数的乘积,一段音频数据就是由苦干帧组成的app

采样率(rate):每秒钟采样次数,该次数是针对帧而言,经常使用的采样率如8KHz的人声, 44.1KHz的mp3音乐, 96Khz的蓝光音频。框架

周期(period):音频设备一次处理所须要的桢数,对于音频设备的数据访问以及音频数据的存储,都是以此为单位。dom

交错模式(interleaved):是一种音频数据的记录方式异步

              在交错模式下,数据以连续桢的形式存放,即首先记录完桢1的左声道样本和右声道样本(假设为立体声格式),再开始桢2的记录。ide

              而在非交错模式下,首先记录的是一个周期内全部桢的左声道样本,再记录右声道样本,数据是以连续通道的方式存储。

              不过多数状况下,咱们只须要使用交错模式就能够了。

period(周期): 硬件中中断间的间隔时间。它表示输入延时。

比特率(Bits Per Second):比特率表示每秒的比特数,比特率=采样率×通道数×样本长度

---------------------------------------------------------------------------------------------------------------------------------------------------------------

2、ALSA介绍

一、ALSA声音编程介绍

      ALSA表示高级Linux声音体系结构(Advanced Linux Sound Architecture)。

  它由一系列内核驱动,应用程序编译接口(API)以及支持Linux下声音的实用程序组成。

  这篇文章里,我将简单介绍 ALSA项目的基本框架以及它的软件组成。主要集中介绍PCM接口编程,包括您能够自动实践的程序示例。

  您使用ALSA的缘由可能就是由于它很新,但它并非惟一可用的声音API。若是您想完成低级的声音操做,以便可以最大化地控制声音并最大化地提升性能,或者若是您使用其它声音API没有的特性,那么ALSA是很好的选择。若是您已经写了一个音频程序,你可能想要为ALSA声卡驱动添加本地支持。若是您对音频不感兴趣,只是想播放音频文件,那么高级的API将是更好的选择,好比SDL,OpenAL以及那些桌面环境提供的工具集。另外,您只能在有ALSA 支持的Linux环境中使用ALSA。

二、ALSA历史

      ALSA项目发起的原由是Linux下的声卡驱动(OSS/Free drivers)没有获得积极的维护。而且落后于新的声卡技术。Jaroslav Kysela早先写了一个声卡驱动,并由此开始了ALSA项目,随便,更多的开发者加入到开发队伍中,更多的声卡获得支持,API的结构也获得了重组。

  Linux内核2.5在开发过程当中,ALSA被合并到了官方的源码树中。在发布内核2.6后,ALSA已经内建在稳定的内核版本中并将普遍地使用。

三、数字音频基础

  声音由变化的气压组成。它被麦克风这样的转换器转换成电子形式。

  模/数(ADC)转换器将模拟电压转换成离散的样本值。

  声音以固定的时间间隔被采样,采样的速率称为采样率。把样本输出到数/模(DAC)转换器,好比扩音器,最后转换成原来的模拟信号。

  样本大小以位来表示。样本大小是影响声音被转换成数字信号的精确程度的因素之一。

  另外一个主要的因素是采样率。奈奎斯特(Nyquist)理论中,只要离散系统的奈奎斯特频率高于采样信号的最高频率或带宽,就能够避免混叠现象。

四、ALSA基础

      ALSA由许多声卡的声卡驱动程序组成,同时它也提供一个称为libasound的API库

  应用程序开发者应该使用libasound而不是内核中的 ALSA接口。由于libasound提供最高级而且编程方便的编程接口。而且提供一个设备逻辑命名功能,这样开发者甚至不须要知道相似设备文件这样的低层接口。

  相反,OSS/Free驱动是在内核系统调用级上编程,它要求开发者提供设备文件名而且利用ioctrl来实现相应的功能。

     为了向后兼容,ALSA提供内核模块来模拟OSS,这样以前的许多在OSS基础上开发的应用程序不须要任何改动就能够在ALSA上运行。另外,libaoss库也能够模拟OSS,而它不须要内核模块。

     ALSA包含插件功能,使用插件能够扩展新的声卡驱动,包括彻底用软件实现的虚拟声卡。ALSA提供一系列基于命令行的工具集,好比混音器(mixer),音频文件播放器(aplay),以及控制特定声卡特定属性的工具。

五、ALSA体系结构

       ALSA API能够分解成如下几个主要的接口:

              1 控制接口:提供管理声卡注册和请求可用设备的通用功能

              2 PCM接口:管理数字音频回放(playback)和录音(capture)的接口。本文后续总结重点放在这个接口上,由于它是开发数字音频程序最经常使用到的接口。

              3 Raw MIDI接口:支持MIDI(Musical Instrument Digital Interface),标准的电子乐器。这些API提供对声卡上MIDI总线的访问。这个原始接口基于MIDI事件工做,由程序员负责管理协议以及时间处理。

              4 定时器(Timer)接口:为同步音频事件提供对声卡上时间处理硬件的访问。

              5 时序器(Sequencer)接口

              6 混音器(Mixer)接口

六、设备命名

  API库使用逻辑设备名而不是设备文件。设备名字能够是真实的硬件名字也能够是插件名字。硬件名字使用hw:i,j这样的格式。其中i是卡号,j是这块声卡上的设备号。

  第一个声音设备是hw:0,0.这个别名默认引用第一块声音设备而且在本文示例中一真会被用到。

  插件使用另外的惟一名字,好比 plughw:,表示一个插件,这个插件不提供对硬件设备的访问,而是提供像采样率转换这样的软件特性,硬件自己并不支持这样的特性。

七、声音缓存和数据传输

  每一个声卡都有一个硬件缓存区来保存记录下来的样本。

  当缓存区足够满时,声卡将产生一个中断

  内核声卡驱动而后使用直接内存(DMA)访问通道将样本传送到内存中的应用程序缓存区。相似地,对于回放,任何应用程序使用DMA将本身的缓存区数据传送到声卡的硬件缓存区中。

  这样硬件缓存区是环缓存。也就是说当数据到达缓存区末尾时将从新回到缓存区的起始位置。

  ALSA维护一个指针来指向硬件缓存以及应用程序缓存区中数据操做的当前位置。

  从内核外部看,咱们只对应用程序的缓存区感兴趣,因此本文只讨论应用程序缓存区。

  应用程序缓存区的大小能够经过ALSA库函数调用来控制。

  缓存区能够很大,一次传输操做可能会致使不可接受的延迟,咱们把它称为延时(latency)。

  为了解决这个问题,ALSA将缓存区拆分红一系列周期(period)(OSS/Free中叫片段fragments).ALSA以period为单元来传送数据。

  一个周期(period)存储一些帧(frames)。每一帧包含时间上一个点所抓取的样本。对于立体声设备,一个帧会包含两个信道上的样本。

  分解过程:一个缓存区分解成周期,而后是帧,而后是样本。

  左右信道信息被交替地存储在一个帧内。这称为交错 (interleaved)模式。

  在非交错模式中,一个信道的全部样本数据存储在另一个信道的数据以后。

八、Over and Under Run

       当一个声卡活动时,数据老是连续地在硬件缓存区应用程序缓存区间传输。

  可是也有例外。

  在录音例子中,若是应用程序读取数据不够快,循环缓存区将会被新的数据覆盖。这种数据的丢失被称为"over   run".

  在回放例子中,若是应用程序写入数据到缓存区中的速度不够快,缓存区将会"饿死"。这样的错误被称为"under   run"

  在ALSA文档中,有时将这两种情形统称为"XRUN"。适当地设计应用程序能够最小化XRUN而且能够从中恢复过来。

  XRUN状态又分有两种,在播放时,用户空间没及时写数据致使缓冲区空了,硬件没有 可用数据播放致使"under   run"; 录制时,用户空间没有及时读取数据致使缓冲区满后溢出, 硬件录制的数据没有空闲缓冲可写致使"over   run"

  当用户空间因为系统繁忙等缘由,致使hw_ptr>appl_ptr时,缓冲区已空,内核这里有两种方案: 

  中止DMA传输,进入XRUN状态。这是内核默认的处理方法。 继续播放缓冲区的重复的音频数据或静音数据。 

  用户空间配置stop_threshold可选择方案1或方案2,配置silence_threshold选择继 续播放的原有的音频数据仍是静意数据了。我的经验,偶尔的系统繁忙致使的这种状态, 重复播放原有的音频数据会显得更平滑,效果更好。 

九、音频参数(ALSA 用户空间之 TinyAlsa)

  TinyAlsa是 Android 默认的 alsalib, 封装了内核 ALSA 的接口,用于简化用户空 间的 ALSA 编程。

  合理的pcm_config能够作到更好的低时延和功耗,移动设备的开发优为敏感。

struct pcm_config {
    unsigned int channels;
    unsigned int rate;
    unsigned int period_size;
    unsigned int period_count;
    enum pcm_format format;
    unsigned int start_threshold;
    unsigned int stop_threshold;
    unsigned int silence_threshold;
    int avail_min;
};

  解释一下结构中的各个参数,每一个参数的单位都是frame(1帧 = 通道*采样位深):

  period_size. 每次传输的数据长度。值越小,时延越小,cpu占用就越高。
  period_count. 缓之冲区period的个数。缓冲区越大,发生XRUN的机会就越少。
  format. 定义数据格式,如采样位深,大小端。
  start_threshold. 缓冲区的数据超过该值时,硬件开始启动数据传输。若是太大, 从开始播放到声音出来时延太长,甚至可致使过短促的声音根本播不出来;若是过小, 又可能容易致使XRUN.
  stop_threshold. 缓冲区空闲区大于该值时,硬件中止传输。默认状况下,这个数 为整个缓冲区的大小,即整个缓冲区空了,就中止传输。但偶尔的缘由致使缓冲区空, 如CPU忙,增大该值,继续播放缓冲区的历史数据,而不关闭再启动硬件传输(通常此 时有明显的声音卡顿),能够达到更好的体验。
  silence_threshold. 这个值原本是配合stop_threshold使用,往缓冲区填充静音 数据,这样就不会重播历史数据了。但若是没有设定silence_size,这个值会生效吗? 求解??
  avail_min. 缓冲区空闲区大于该值时,pcm_mmap_write()才往缓冲写数据。这个 值越大,往缓冲区写入数据的次数就越少,面临XRUN的机会就越大。Android samsung tuna 设备在screen_off时增大该值以减少功耗,在screen_on时减少该 值以减少XRUN的机会。

  在不一样的场景下,合理的参数就是在性能、时延、功耗等之间达到较好的平衡。

  有朋友问为何在pcm_write()/pcm_mmap_write(),而不在pcm_open()调用pcm_start()? 这是由于音频流与其它的数据不一样,实时性要求很高。做为 TinyAlsa的实现者,不能假定在调用者open以后及时的write数据,因此只能在有 数据写入的时候start设备了。

  Mixer的实现很明了,经过ioctl()调用访问kcontrols.

十、一个典型的声音程序

  1 使用PCM的程序一般相似下面的伪代码:

  2 打开回放或录音接口

  3 设置硬件参数(访问模式,数据格式,信道数,采样率,等等)

  4 while 有数据要被处理:

     5 读PCM数据(录音) 或 写PCM数据(回放)

  6 关闭接口

------------------------------------------------------------------------------------------------------------------------------------------------------------------

3、实例

一、显示了一些ALSA使用的PCM数据类型和参数。

#include <alsa/asoundlib.h>

int main() 
{
    int val;

    printf("ALSA library version: %s\n",
                       SND_LIB_VERSION_STR);

    printf("\nPCM stream types:\n");
    for (val = 0; val <= SND_PCM_STREAM_LAST; val++)
            printf(" %s\n",
                  snd_pcm_stream_name((snd_pcm_stream_t)val));

    printf("\nPCM access types:\n");
    for (val = 0; val <= SND_PCM_ACCESS_LAST; val++)
    {
            printf(" %s\n",
                  snd_pcm_access_name((snd_pcm_access_t)val));
    }

    printf("\nPCM formats:\n");
    for (val = 0; val <= SND_PCM_FORMAT_LAST; val++)
        {
        if (snd_pcm_format_name((snd_pcm_format_t)val)!= NULL)
        {
                  printf(" %s (%s)\n",
                    snd_pcm_format_name((snd_pcm_format_t)val),
                    snd_pcm_format_description(
                            (snd_pcm_format_t)val));
        }
    }
printf(
"\nPCM subformats:\n"); for (val = 0; val <= SND_PCM_SUBFORMAT_LAST;val++) { printf(" %s (%s)\n", snd_pcm_subformat_name(( snd_pcm_subformat_t)val), snd_pcm_subformat_description(( snd_pcm_subformat_t)val)); }
printf(
"\nPCM states:\n"); for (val = 0; val <= SND_PCM_STATE_LAST; val++) printf(" %s\n", snd_pcm_state_name((snd_pcm_state_t)val)); return 0; }

  首先须要作的是包括头文件。这些头文件包含了全部库函数的声明。其中之一就是显示ALSA库的版本。

     这个程序剩下的部分的迭代一些PCM数据类型,以流类型开始。ALSA为每次迭代的最后值提供符号常量名,而且提供功能函数以显示某个特定值的描述字符串。你将会看到,ALSA支持许多格式,在个人1.0.15版本里,支持多达36种格式。

     这个程序必须连接到alsalib库,经过在编译时须要加上-lasound选项。有些alsa库函数使用dlopen函数以及浮点操做,因此您可能还须要加上-ldl,-lm选项。

     编译:gcc -o main test.c -lasound

二、打开默认的PCM设备,设置一些硬件参数而且打印出最经常使用的硬件参数值

Int32 Audio_alsaSetparams(Alsa_Env *pEnv, int verbose)
{
        Int32 err = 0;
        Uint32 rate, n;

        snd_pcm_t *handle;
        snd_output_t *log;

        snd_pcm_hw_params_t *params;
        snd_pcm_sw_params_t *swparams; 

        snd_pcm_uframes_t buffer_size;
        snd_pcm_uframes_t start_threshold, stop_threshold;

        unsigned int buffer_time, period_time;

        handle = pEnv->handle;

        err = snd_output_stdio_attach(&log, stderr, 0);
        OSA_assert(err >= 0);

        snd_pcm_hw_params_alloca(&params);
        snd_pcm_sw_params_alloca(&swparams);

        err = snd_pcm_hw_params_any(handle, params);
        if (err < 0) { 
                AUD_DEVICE_PRINT_ERROR_AND_RETURN("Broken configuration for this PCM:"
                          "no configurations available(%s)\n", err, handle); 
        } 

        err = snd_pcm_hw_params_set_access(handle, params, SND_PCM_ACCESS_RW_INTERLEAVED);
        if (err < 0) {
                AUD_DEVICE_PRINT_ERROR_AND_RETURN("cannot set access type (%s)\n", err, handle); 
        } 

        err = snd_pcm_hw_params_set_format(handle, params, pEnv->format);
        if (err < 0) { 
                AUD_DEVICE_PRINT_ERROR_AND_RETURN("cannot set sample format (%s)\n", err, handle); 
        }

        err = snd_pcm_hw_params_set_channels(handle, params, pEnv->channels); 
        if (err < 0) { 
                AUD_DEVICE_PRINT_ERROR_AND_RETURN("cannot set channel count (%s)\n", err, handle); 
        }

        rate = pEnv->rate;
        err = snd_pcm_hw_params_set_rate_near(handle, params, &pEnv->rate, 0);
        OSA_assert(err >= 0);

        if ((float)rate * 1.05 < pEnv->rate || (float)rate * 0.95 > pEnv->rate) {
                fprintf(stderr, "Warning: rate is not accurate"
                        "(requested = %iHz, got = %iHz)\n", rate, pEnv->rate);
        }
        rate = pEnv->rate;

        /* following setting of period size is done only for AIC3X. Leaving default for HDMI */
        if (pEnv->resample) {
                /* Restrict a configuration space to contain only real hardware rates. */
                snd_pcm_hw_params_set_rate_resample(handle, params, 1);
        } 

        buffer_time = 0;
        period_time = 0;
        if (pEnv->periods == 0) {
                err = snd_pcm_hw_params_get_buffer_time_max(params, &buffer_time, 0);
        OSA_assert(err >= 0);

        /* in microsecond */
        if (buffer_time > 500000)
                buffer_time = 500000; /* 500ms */ 
        }

        if (buffer_time > 0)
                period_time = buffer_time / 4;

        if (period_time > 0)
                err = snd_pcm_hw_params_set_period_time_near(handle, params,
                             &period_time, 0);
        else
                err = snd_pcm_hw_params_set_period_size_near(handle, params,
                             &pEnv->periods, 0);
        OSA_assert(err >= 0);

        if (period_time > 0) {
                err = snd_pcm_hw_params_set_buffer_time_near(handle, params,
                             &buffer_time, 0);
        } else {
                buffer_size = pEnv->periods * 4;
                err = snd_pcm_hw_params_set_buffer_size_near(handle, params,
                             &buffer_size);
        }
        OSA_assert(err >= 0);

        err = snd_pcm_hw_params(handle, params);
        if (err < 0) { 
                fprintf(stderr, "cannot set alsa hw parameters %d\n", err);
                return err; 
        } 

        /* Get alsa interrupt duration */
        snd_pcm_hw_params_get_period_size(params, &pEnv->periods, 0);
        snd_pcm_hw_params_get_buffer_size(params, &buffer_size);
        if (pEnv->periods == buffer_size) {
                fprintf(stderr, "Can't use period equal to buffer size (%lu == %lu)\n",
                                        pEnv->periods, buffer_size);
                return -1;
        }

        /* set software params */
        snd_pcm_sw_params_current(handle, swparams);

        n = pEnv->periods;
        /* set minimum avil size -> 1 period size */
        err = snd_pcm_sw_params_set_avail_min(handle, swparams, n);
        OSA_assert(err >= 0);

        n = buffer_size;
        /* in microsecond -> divide 1000000 */
        if (pEnv->start_delay <= 0) 
                start_threshold = n + (double)rate * pEnv->start_delay / 1000000;
        else
                start_threshold = (double)rate * pEnv->start_delay / 1000000;

        if (start_threshold < 1)
                start_threshold = 1;

        if (start_threshold > n)
                start_threshold = n;

        /* set pcm auto start condition */
        err = snd_pcm_sw_params_set_start_threshold(handle, swparams, start_threshold);
        OSA_assert(err >= 0);

        /* in microsecond -> divide 1000000 */
        if (pEnv->stop_delay <= 0) 
                stop_threshold = buffer_size + (double)rate * pEnv->stop_delay / 1000000;
        else
                stop_threshold = (double)rate * pEnv->stop_delay / 1000000;

        err = snd_pcm_sw_params_set_stop_threshold(handle, swparams, stop_threshold);
        OSA_assert(err >= 0);

        err = snd_pcm_sw_params(handle, swparams);
        if (err < 0) {
                fprintf(stderr, "unable to install sw params\n");
                return err;
        }

        if (verbose)
                snd_pcm_dump(handle, log);

        snd_output_close(log);

        return err;
}

  1)snd_pcm_open打开默认的PCM 设备并设置访问模式为PLAYBACK。这个函数返回一个句柄,这个句柄保存在第一个函数参数中。该句柄会在随后的函数中用到。像其它函数同样,这个函数返回一个整数。

  2)若是返回值小于0,则代码函数调用出错。若是出错,咱们用snd_errstr打开错误信息并退出。

  3)为了设置音频流的硬件参数,咱们须要分配一个类型为snd_pcm_hw_param的变量。分配用到函数宏 snd_pcm_hw_params_alloca。

  4)下一步,咱们使用函数snd_pcm_hw_params_any来初始化这个变量,传递先前打开的 PCM流句柄。

  5)接下来,咱们调用API来设置咱们所需的硬件参数。

    这些函数须要三个参数:PCM流句柄,参数类型,参数值。

    咱们设置流为交错模式,16位的样本大小,2 个信道,44100bps的采样率。

    对于采样率而言,声音硬件并不必定就精确地支持咱们所定的采样率,可是咱们可使用函数 snd_pcm_hw_params_set_rate_near来设置最接近咱们指定的采样率的采样率。

    其实只有当咱们调用函数 snd_pcm_hw_params后,硬件参数才会起做用。

  6)程序的剩余部分得到并打印一些PCM流参数,包括周期和缓冲区大小。结果可能会由于声音硬件的不一样而不一样。

  运行该程序后,作实验,改动一些代码。把设备名字改为hw:0,0,而后看结果是否会有变化。设置不一样的硬件参数而后观察结果的变化。

三、添加声音回放

/*

This example reads standard from input and writes
to the default PCM device for 5 seconds of data.

*/

/* Use the newer ALSA API */
#define ALSA_PCM_NEW_HW_PARAMS_API

#include <alsa/asoundlib.h>

int main() 
{
  long loops;
  int rc;
  int size;
  snd_pcm_t *handle;
  snd_pcm_hw_params_t *params;
  unsigned int val;
  int dir;
  snd_pcm_uframes_t frames;
  char *buffer;

  /* Open PCM device for playback. */
  rc = snd_pcm_open(&handle, "default",
                    SND_PCM_STREAM_PLAYBACK, 0);
  if (rc < 0)
  {
    fprintf(stderr,"unable to open pcm device: %s\n",snd_strerror(rc));
    exit(1);
  }

  /* Allocate a hardware parameters object. */
  snd_pcm_hw_params_alloca(?ms);

  /* Fill it in with default values. */
  snd_pcm_hw_params_any(handle, params);

  /* Set the desired hardware parameters. */

  /* Interleaved mode */
  snd_pcm_hw_params_set_access(handle, params,
                      SND_PCM_ACCESS_RW_INTERLEAVED);

  /* Signed 16-bit little-endian format */
  snd_pcm_hw_params_set_format(handle, params,
                              SND_PCM_FORMAT_S16_LE);

  /* Two channels (stereo) */
  snd_pcm_hw_params_set_channels(handle, params, 2);

  /* 44100 bits/second sampling rate (CD quality) */
  val = 44100;
  snd_pcm_hw_params_set_rate_near(handle, params,
                                  &val, &dir);

  /* Set period size to 32 frames. */
  frames = 32;
  snd_pcm_hw_params_set_period_size_near(handle,
                              params, &frames, &dir);

  /* Write the parameters to the driver */
  rc = snd_pcm_hw_params(handle, params);
  if (rc < 0) {
    fprintf(stderr,
            "unable to set hw parameters: %s\n",
            snd_strerror(rc));
    exit(1);
  }

  /* Use a buffer large enough to hold one period */
  snd_pcm_hw_params_get_period_size(params, &frames,
                                    &dir);
  size = frames * 4; /* 2 bytes/sample, 2 channels */
  buffer = (char *) malloc(size);

  /* We want to loop for 5 seconds */
  snd_pcm_hw_params_get_period_time(params,&val, &dir);
  /* 5 seconds in microseconds divided by
   * period time */
  loops = 5000000 / val;

  while (loops > 0) //循环录音 5 s  
  {
    loops--;
    rc = read(0, buffer, size);
    if (rc == 0) //没有读取到数据 
    {
      fprintf(stderr, "end of file on input\n");
      break;
    } 
    else if (rc != size)//实际读取 的数据 小于 要读取的数据 
    {
      fprintf(stderr,"short read: read %d bytes\n", rc);
    }
    
    rc = snd_pcm_writei(handle, buffer, frames);//写入声卡  (放音) 
    if (rc == -EPIPE) 
    {
      /* EPIPE means underrun */
      fprintf(stderr, "underrun occurred\n");
      snd_pcm_prepare(handle);
    } else if (rc < 0) {
      fprintf(stderr,"error from writei: %s\n",snd_strerror(rc));
    }  else if (rc != (int)frames) {
      fprintf(stderr,"short write, write %d frames\n", rc);
    }
  }

  snd_pcm_drain(handle);
  snd_pcm_close(handle);
  free(buffer);

  return 0;
}

  在这个例子中,咱们从标准输入中读取数据,每一个周期读取足够多的数据,而后将它们写入到声卡中,直到5秒钟的数据所有传输完毕。

  这个程序的开始处和以前的版本同样---打开PCM设备、设置硬件参数。咱们使用由ALSA本身选择的周期大小,申请该大小的缓冲区来存储样本。而后咱们找出周期时间,这样咱们就能计算出本程序为了可以播放5秒钟,须要多少个周期。

  在处理数据的循环中,咱们从标准输入中读入数据,并往缓冲区中填充一个周期的样本。而后检查并处理错误,这些错误多是由到达文件结尾,或读取的数据长度与我指望的数据长度不一致致使的。

  咱们调用snd_pcm_writei来发送数据。它操做起来很像内核的写系统调用,只是这里的大小参数是以帧来计算的。咱们检查其返回代码值。返回值为EPIPE代表发生了underrun,使得PCM音频流进入到XRUN状态并中止处理数据。从该状态中恢复过来的标准方法是调用snd_pcm_prepare()函数,把PCM流置于PREPARED状态,这样下次咱们向该PCM流中数据时,它就能从新开始处理数据。若是咱们获得的错误码不是EPIPE,咱们把错误码打印出来,而后继续。最后,若是写入的帧数不是咱们指望的,则打印出错误消息。      

  这个程序一直循环,直到5秒钟的帧所有传输完,或者输入流读到文件结尾。而后咱们调用snd_pcm_drain把全部挂起没有传输完的声音样本传输彻底,最后关闭该音频流,释放以前动态分配的缓冲区,退出。        

  咱们能够看到这个程序没有什么用,除非标准输入被重定向到了其它其它的文件。

  尝试用设备/dev/urandom来运行这个程序,该设备产生随机数据:

  ./example3    </dev/urandom        

  随机数据会产生5秒钟的白色噪声。        

  而后,尝试把标准输入重定向到设备/dev/null和/dev/zero上,并比较结果。改变一些参数,例如采样率和数据格式,而后查看结果的变化。

四、添加录音

/*

This example reads from the default PCM device
and writes to standard output for 5 seconds of data.

*/

/* Use the newer ALSA API */
#define ALSA_PCM_NEW_HW_PARAMS_API

#include <alsa/asoundlib.h>

int main() {
long loops;
int rc;
int size;
snd_pcm_t *handle;
snd_pcm_hw_params_t *params;
unsigned int val;
int dir;
snd_pcm_uframes_t frames;
char *buffer;

/* Open PCM device for recording (capture). */
rc = snd_pcm_open(&handle, "default",
                    SND_PCM_STREAM_CAPTURE, 0);
if (rc < 0) {
    fprintf(stderr,
            "unable to open pcm device: %s\n",
            snd_strerror(rc));
    exit(1);
}

/* Allocate a hardware parameters object. */
snd_pcm_hw_params_alloca(?ms);

/* Fill it in with default values. */
snd_pcm_hw_params_any(handle, params);

/* Set the desired hardware parameters. */

/* Interleaved mode */
snd_pcm_hw_params_set_access(handle, params,
                      SND_PCM_ACCESS_RW_INTERLEAVED);

/* Signed 16-bit little-endian format */
snd_pcm_hw_params_set_format(handle, params,
                              SND_PCM_FORMAT_S16_LE);

/* Two channels (stereo) */
snd_pcm_hw_params_set_channels(handle, params, 2);

/* 44100 bits/second sampling rate (CD quality) */
val = 44100;
snd_pcm_hw_params_set_rate_near(handle, params,
                                  &val, &dir);

/* Set period size to 32 frames. */
frames = 32;
snd_pcm_hw_params_set_period_size_near(handle,
                              params, &frames, &dir);

/* Write the parameters to the driver */
rc = snd_pcm_hw_params(handle, params);
if (rc < 0) {
    fprintf(stderr,
            "unable to set hw parameters: %s\n",
            snd_strerror(rc));
    exit(1);
}

/* Use a buffer large enough to hold one period */
snd_pcm_hw_params_get_period_size(params,
                                      &frames, &dir);
size = frames * 4; /* 2 bytes/sample, 2 channels */
buffer = (char *) malloc(size);

/* We want to loop for 5 seconds */
snd_pcm_hw_params_get_period_time(params,
                                         &val, &dir);
loops = 5000000 / val;

while (loops > 0) {
    loops--;
    rc = snd_pcm_readi(handle, buffer, frames);
    if (rc == -EPIPE) {
      /* EPIPE means overrun */
      fprintf(stderr, "overrun occurred\n");
      snd_pcm_prepare(handle);
    } else if (rc < 0) {
      fprintf(stderr,
              "error from read: %s\n",
              snd_strerror(rc));
    } else if (rc != (int)frames) {
      fprintf(stderr, "short read, read %d frames\n", rc);
    }
    rc = write(1, buffer, size);
    if (rc != size)
      fprintf(stderr,
              "short write: wrote %d bytes\n", rc);
}

snd_pcm_drain(handle);
snd_pcm_close(handle);
free(buffer);

return 0;
} 

  当打开PCM设备时咱们指定打开模式为SND_PCM_STREAM_CPATURE。在主循环中,咱们调用snd_pcm_readi()从声卡中读取数据,并把它们写入到标准输出。一样地,咱们检查是否有overrun,若是存在,用与前例中相同的方式处理。

  运行清单4的程序将录制将近5秒钟的声音数据,并把它们发送到标准输出。你也能够重定向到某个文件。若是你有一个麦克风链接到你的声卡,可使用某个混音程序(mixer)设置录音源和级别。一样地,你也能够运行一个CD播放器程序并把录音源设成CD。

  运行程序4并把输出定向到某个文件,而后运行程序 3播放该文件里的声音数据:

  ./listing4   > sound.raw

  ./listing3   < sound.raw

   若是你的声卡支持全双工,你能够经过管道把两个程序链接起来,这样就能够从声卡中听到录制的声音:

  ./listing4 | ./listing3

   一样地,您能够作实验,看看采样率和样本格式的变化会产生什么影响。

------------------------------------------------------------------------------------------------------------------------------------------------------------------

4、高级特性

  在前面的例子中,PCM流是以阻塞模式操做的,也就是说,直到数据已经传送完,PCM接口调用才会返回。在事件驱动的交互式程序中,这样会长时间阻塞应用程序,一般是不能接受的。

  ALSA支持以非阻塞模式打开音频流,这样读写函数调用后当即返回。若是数据传输被挂起,调用不能被处理,ALSA就是返回一个 EBUSY的错误码。

  许多图形应用程序使用回调来处理事件。ALSA支持以异步的方式打开一个PCM音频流。这使得当某个周期的样本数据被传输完后,某个已注册的回调函数将会调用。

  这里用到的snd_pcm_readi()和snd_pcm_writei()调用和Linux下的读写系统调用相似。

  字母i表示处理的帧是交错式 (interleaved)的。ALSA中存在非交互模式的对应的函数。

  Linux下的许多设备也支持mmap系统调用,这个调用将设备内存映射到主内存,这样数据就能够用指针来维护。

  ALSA也运行以mmap模式打开一个PCM信道,这容许有效的零拷贝(zero copy)方式访问声音数据。

 

  最后,我但愿这篇文章可以激励你尝试编写某些ALSA程序。伴随着2.6内核在Linux发布版本(distributions)中被普遍地使用,ALSA也将被普遍地采用。它的高级特征将帮助Linux音频程序更好地向前发展。

本文转载自网络,仅供学习交流

相关文章
相关标签/搜索