wav文件音频头的研究

时间 2019-11-15

标签 wav 文件音频研究繁體版

原文原文链接

分类：音频处理 2011-03-21 17:55 473人阅读评论(0) 收藏举报

首先，下面这个博客中对wav音频头的结构作了一个介绍，能够去参考下。 html

http://blog.csdn.net/yzhouen/archive/2006/06/07/777459.aspx 函数

音频头中是一个一个的标识，表明这个音频文件的一些配置参数。那当要播放这个音频的时候，解码器就经过音频头先读取这个音频文件的相关参数，好比采样率(rate)，通道数(channels)等等..那固然包括这个音频文件的大小、语音数据长度等信息都在里面。最后会由这些信息中的一些关键信息，计算出一个该音频的播放时长~具体公式立刻再议。 spa

[cpp] view plain copy print ?

#define WAVE_FORMAT_PCM 1
unsigned char wav_header[] = {
'R', 'I', 'F', 'F',// "RIFF" 标志
0xfc, 0xff, 0xff, 0xff,// 文件长度
'W', 'A', 'V', 'E', // "WAVE" 标志
'f', 'm', 't', ' ', // "fmt" 标志
16, 0, 0, 0, // 过渡字节（不定）
WAVE_FORMAT_PCM, WAVE_FORMAT_PCM >> 8,// 格式类别
0, 0, // 声道数
0, 0, 0, 0, // 采样率
0, 0, 0, 0, // 位速
0, 0, // 一个采样多声道数据块大小
16, 0, // 一个采样占的 bit 数
'd', 'a', 't', 'a', // 数据标记符＂data ＂
0xd8, 0xff, 0xff, 0xff
// 语音数据的长度，比文件长度小42通常。这个是计算音频播放时长的关键参数~
};

上面的结构就是音频头的基本结构，每个字节都显示出来了。有些是4字节，有些是2字节。 .net

那，只要按照这个结构，在音频文件开始处写上面格式的文档，就能够正确配置一个音频头~ htm

那音频的播放时长计算以下： blog

每一个采样点字节数：bits = channels * BitsPerSample / 8 ( BitsPerSample: 16bit 通常 )
每秒字节数： m = nSamplesPerSec * bits; (nSamplesPerSec：每秒采样数，也就是采样率~rate)
音频文件播放时长：time = dlen / m; ( dlen就是语音数据长度，也就是文件大小减去42~ )

因此，只要咱们正确的设置好dlen，采样率rate以及channels就能够自动的内部计算好该音频的播放时长。很好~~ 文档

在写音频头的函数中，把必须条件以参数的形式传进去，而后构造每个字节按照上面的方式，接着写到音频文件的起始处~finish... get

附：博客

wave文件的格式：

00H 4 char "RIFF"标志 04H 4 long int 文件长度 08H 4 char "WAVE"标志 0CH 4 char "fmt"标志 10H 4 过渡字节（不定） 14H 2 int 格式类别（10H为PCM形式的声音数据) 16H 2 int 通道数，单声道为1，双声道为2 18H 2 int 采样率（每秒样本数），表示每一个通道的播放速度， 1CH 4 long int 波形音频数据传送速率，其值为通道数×每秒数据位数×每样本的数据位数／8。播放软件利用此值能够估计缓冲区的大小。 20H 2 int 数据块的调整数（按字节算的），其值为通道数×每样本的数据位值／8。播放软件须要一次处理多个该值大小的字节数据，以便将其值用于缓冲区的调整。 22H 2 每样本的数据位数，表示每一个声道中各个样本的数据位数。若是有多个声道，对每一个声道而言，样本大小都同样。 24H 4 char 数据标记符＂data＂ 28H 4 long int 语音数据的长度