wav文件音频头的研究

 


分类: 音频处理 2011-03-21 17:55  473人阅读  评论(0)  收藏  举报

 

首先,下面这个博客中对wav音频头的结构作了一个介绍,能够去参考下。 html

http://blog.csdn.net/yzhouen/archive/2006/06/07/777459.aspx 函数

 

 

音频头中是一个一个的标识,表明这个音频文件的一些配置参数。那当要播放这个音频的时候,解码器就经过音频头先读取这个音频文件的相关参数,好比采样率(rate),通道数(channels)等等..那固然包括这个音频文件的大小、语音数据长度等信息都在里面。最后会由这些信息中的一些关键信息,计算出一个该音频的播放时长~具体公式立刻再议。 spa

 

 

  1. #define WAVE_FORMAT_PCM 1  
  2. unsigned char wav_header[] = {  
  3.    'R''I''F''F',// "RIFF" 标志  
  4.    0xfc, 0xff, 0xff, 0xff,// 文件长度  
  5.    'W''A''V''E'// "WAVE" 标志  
  6.    'f''m''t'' '// "fmt" 标志  
  7.    16, 0, 0, 0,        // 过渡字节(不定)  
  8.    WAVE_FORMAT_PCM, WAVE_FORMAT_PCM >> 8,// 格式类别  
  9.    0, 0,  // 声道数  
  10.    0, 0, 0, 0,  // 采样率  
  11.    0, 0, 0, 0,  // 位速  
  12.    0, 0,       // 一个采样多声道数据块大小  
  13.    16, 0,      // 一个采样占的 bit 数  
  14.    'd''a''t''a',  // 数据标记符"data "  
  15.    0xd8, 0xff, 0xff, 0xff    
  16.       // 语音数据的长度,比文件长度小42通常。这个是计算音频播放时长的关键参数~  
  17. };  

 

上面的结构就是音频头的基本结构,每个字节都显示出来了。有些是4字节,有些是2字节。 .net

那,只要按照这个结构,在音频文件开始处写上面格式的文档,就能够正确配置一个音频头~ htm

 

那音频的播放时长计算以下: blog

  1. 每一个采样点字节数:bits = channels * BitsPerSample / 8   ( BitsPerSample: 16bit 通常 )
  2. 每秒字节数: m = nSamplesPerSec * bits;  (nSamplesPerSec:每秒采样数,也就是采样率~rate)
  3. 音频文件播放时长:time = dlen / m;     ( dlen就是语音数据长度,也就是文件大小减去42~ )

因此,只要咱们正确的设置好dlen,采样率rate以及channels就能够自动的内部计算好该音频的播放时长。很好~~ 文档

在写音频头的函数中,把必须条件以参数的形式传进去,而后构造每个字节按照上面的方式,接着写到音频文件的起始处~finish... get

 

 

附: 博客

 

wave文件的格式:
 
00H 4 char "RIFF"标志  04H 4 long int 文件长度  08H 4 char "WAVE"标志  0CH 4 char "fmt"标志  10H 4 过渡字节(不定)  14H 2 int 格式类别(10H为PCM形式的声音数据)  16H 2 int 通道数,单声道为1,双声道为2  18H 2 int 采样率(每秒样本数),表示每一个通道的播放速度,  1CH 4 long int 波形音频数据传送速率,其值为通道数×每秒数据位数×每样                本的数据位数/8。播放软件利用此值能够估计缓冲区的大小。  20H 2 int 数据块的调整数(按字节算的),其值为通道数×每样本的数据位            值/8。播放软件须要一次处理多个该值大小的字节数据,以便将其            值用于缓冲区的调整。  22H 2  每样本的数据位数,表示每一个声道中各个样本的数据位数。若是有多            个声道,对每一个声道而言,样本大小都同样。  24H 4 char 数据标记符"data"  28H 4 long int 语音数据的长度 
相关文章
相关标签/搜索