音频编码（转载）

时间 2019-12-11

原文原文链接

频率
　　不一样频率的正弦波，下部分比上部分频率高频率是单位时间内某事件重复发生次数的度量，在物理学中一般以符号罗马字f 或希腊字ν表示，其国际单位为赫兹（Hz）。设 t 时间内某事件重复发生 n 次，则此事件发生的频率为 f = n/t赫兹。又由于周期定义为重复事件发生的最小间隔，故频率也能够周期的倒数表示，即 f = 1/T ，其中 T 表示周期。
60X=n=> x= n/60
在国际标准单位里，频率的单位——赫兹，是以海因里希?鲁道夫?赫兹的名字命名。1 赫兹表示事件每一秒发生一次。
每秒一个振动周期称为1HZ，人耳可听到的音频约为20HZ到20KHZ。每秒20~20000振动周期。

音频 - 声音信息数字化
音频数字化就是将模拟的声音波形数字化，以便计算机处理，包括采样、量化、编码三个步骤。
（1）采样
以固定的时间间隔（采样周期）抽取模拟信号的幅度值。采样后获得的是离散的声音振幅样本序列，还是模拟量。采样频率越高，声音的保真度越好，但采样得到的数据量也越大。在MPC中，采样频率标准定为：11,025KHz，22,05KHz，44,1KHz。
（2）量化
把采样获得的信号幅度的样本值从模拟量转换成数字量。数字量的二进制位数是量化精度。在MPC中，量化精度标准定为8位，16位。
采样和量化过程称为模/数（A/D）转换。
（3）编码
把数字化声音信息按必定数据格式表示，它的实现方法是靠各类不一样的压缩方法将数据编码压缩。[1]
音频 - 影响因素
（1）采样频率：采样频率是指单位时间内的采样次数。采样频率越大，采样点之间的间隔就越小，数字化后获得的声音就越逼真，但相应的数据量就越大。声音采样频率以KHz（千赫兹）衡量。
（2）量化位数（采样位数）：量化位数是模拟量转换成数字量以后的数据位数。量化位数表示的是声音的振幅，位数越多，音质越细腻，相应的数据量就越大。量化位数主要有8位和16位两种。
（3）声道数：声道数是指处理的声音是单声道仍是立体声。单声道在声音处理过程当中只有单数据流，而立体声则须要左、右声道的两个数据流。显然，立体声的效果要好，但相应的数据量要比单声道的数据量加倍。
声音数据量通常都被称为海量数据。这是由于对音质要求越高，数据量就越大。[

解读音频属性
采样精度
什么是采样精度？由于wav使用的是数码信号，它是用一堆数字来描述原来的模拟信号，因此它要对原来的模拟信号进行分析，咱们知道全部的声音都有其波形，数码信号就是在原有的模拟信号波形上每隔一段时间进行一次“取点”，赋予每个点以一个数值，这就是“采样”，而后把全部的“点”连起来就能够描述模拟信号了，很明显，在必定时间内取的点越多，描述出来的波形就越精确，这个尺度咱们就称为“采样精度”。咱们最经常使用的采样精度是44.1kHz，它的意思是每秒取样44100次。之因此使用这个数值是由于通过了反复实验，人们发现这个采样精度最合适，低于这个值就会有较明显的损失，而高于这个值人的耳朵已经很难分辨，并且增大了数字音频所占用的空间。通常为了达到“万分精确”，咱们还会使用48kHz甚至96kHz的采样精度，实际上，96kHz采样精度和44.1kHz采样精度的区别绝对不会象44.1kHz和22kHz那样区别如此之大，咱们所使用的CD的采样标准就是44.1kHz，目前44.1kHz仍是一个最通行的标准，有些人认为96kHz将是将来录音界的趋势。

比特率
比特率是你们常据说的一个名词，数码录音通常使用16比特、20比特或24比特制做音乐。什么是“比特”？咱们知道声音有轻有响，影响声音响度的物理要素是振幅，做为数码录音，必须也要能精确表示乐曲的轻响，因此必定要对波形的振幅有一个精确的描述。“比特(bit)”就是这样一个单位，16比特就是指把波形的振幅划为2^16即65536个等级，根据模拟信号的轻响把它划分到某个等级中去，就能够用数字来表示了。和采样精度同样，比特率越高，越能细致地反映乐曲的轻响变化。20比特就能够产生1048576个等级，表现交响乐这类动态十分大的音乐已经没有什么问题了。刚才提到了一个名词“动态”，它其实指的是一首乐曲最响和最轻的对比能达到多少，咱们也常说“动态范围”，单位是dB，而动态范围和咱们录音时采用的比特率是紧密结合在一块儿的，若是咱们使用了一个很低的比特率，那么就只有不多的等级能够用来描述音响的强弱，固然就不能听到大幅度的强弱对比了。动态范围和比特率的关系是；比特率每增长1比特，动态范围就增长6dB。因此假如咱们使用1比特录音，那么咱们的动态范围就只有6dB，这样的音乐是不可能听的。16比特时，动态范围是96dB。这能够知足通常的需求了。20比特时，动态范围是120dB，对比再强烈的交响乐均可以应付自如了，表现音乐的强弱是绰绰有余了。发烧级的录音师还使用24比特，可是和采样精度同样，它不会比20比特有很明显的变化，理论上24比特能够作到144 dB的动态范围，但其实是很难达到的，由于任何设备都不可避免会产生噪音，至少在现阶段24比特很难达到其预期效果。
音频文件格式的特色。　　要在计算机内播放或是处理音频文件，也就是要对声音文件进行数、模转换，这个过程一样由采样和量化构成，人耳所能听到的声音，最低的频率是从20Hz起一直到最高频率20KHZ，20KHz以上人耳是听不到的，所以音频的最大带宽是20KHZ，故而采样速率须要介于40~50KHZ之间，并且对每一个样本须要更多的量化比特数。音频数字化的标准是每一个样本16位(16bit，即96dB)的信噪比，采用线性脉冲编码调制PCM，每一量化步长都具备相等的长度。在音频文件的制做中，正是采用这一标准。

                                         |
                                                                        |
                                                                        |
                        --------------------------------------------------------------------------采样
                                                                        |
                                                                        |比特率
音频编码
天然界中的声音很是复杂，波形极其复杂，一般咱们采用的是脉冲代码调制编码，即PCM编码。PCM经过抽样、量化、编码三个步骤将连续变化的模拟信号转换为数字编码。
有损和无损
　　根据采样率和采样大小能够得知，相对天然界的信号，音频编码最多只能作到无限接近，至少目前的技术只能这样了，相对天然界的信号，任何数字音频编码方案都是有损的，由于没法彻底还原。在计算机应用中，可以达到最高保真水平的就是PCM编码，被普遍用于素材保存及音乐欣赏，CD、DVD以及咱们常见的WAV文件中均有应用。所以，PCM约定俗成了无损编码，由于PCM表明了数字音频中最佳的保真水准，并不意味着PCM就可以确保信号绝对保真，PCM也只能作到最大程度的无限接近。咱们而习惯性的把MP3列入有损音频编码范畴，是相对PCM编码的。强调编码的相对性的有损和无损，是为了告诉你们，要作到真正的无损是困难的，就像用数字去表达圆周率，无论精度多高，也只是无限接近，而不是真正等于圆周率的值。
为何要使用音频压缩技术
　　要算一个PCM音频流的码率是一件很轻松的事情，采样率值×采样大小值×声道数 bps。一个采样率为44.1KHz，采样大小为16bit，双声道的PCM编码的WAV文件，它的数据速率则为 44.1K×16×2 =1411.2 Kbps。咱们常说128K的MP3，对应的WAV的参数，就是这个1411.2 Kbps，这个参数也被称为数据带宽，它和ADSL中的带宽是一个概念。将码率除以8,就能够获得这个WAV的数据速率，即176.4KB/s。这表示存储一秒钟采样率为44.1KHz，采样大小为16bit，双声道的PCM编码的音频信号，须要176.4KB的空间，1分钟则约为10.34M，这对大部分用户是不可接受的，尤为是喜欢在电脑上听音乐的朋友，要下降磁盘占用，只有2种方法，下降采样指标或者压缩。下降指标是不可取的，所以专家们研发了各类压缩方案。因为用途和针对的目标市场不同，各类音频压缩编码所达到的音质和压缩比都不同，在后面的文章中咱们都会一一提到。有一点是能够确定的，他们都压缩过。

频率与采样率的关系
　　采样率表示了每秒对原始信号采样的次数，咱们常见到的音频文件采样率多为44.1KHz，这意味着什么呢？假设咱们有2段正弦波信号，分别为20Hz和20KHz，长度均为一秒钟，以对应咱们能听到的最低频和最高频，分别对这两段信号进行40KHz的采样，咱们能够获得一个什么样的结果呢？结果是：20Hz的信号每次振动被采样了40K/20=2000次，而20KHz的信号每次振动只有2次采样。显然，在相同的采样率下，记录低频的信息远比高频的详细。
PCM编码
　　PCM 脉冲编码调制是Pulse Code Modulation的缩写。前面的文字咱们提到了PCM大体的工做流程，咱们不须要关心PCM最终编码采用的是什么计算方式，咱们只须要知道PCM编码的音频流的优势和缺点就能够了。PCM编码的最大的优势就是音质好，最大的缺点就是体积大。咱们常见的Audio CD就采用了PCM编码，一张光盘的容量只能容纳72分钟的音乐信息。

WAV
咱们接触到比较多的DivX就是一种视频编码，AVI能够采用DivX编码来压缩视频流，固然也可使用其余的编码压缩。一样，WAV也可使用多种音频编码来压缩其音频流，不过咱们常见的都是音频流被PCM编码处理的WAV，但这不表示WAV只能使用PCM编码，MP3编码一样也能够运用在WAV中，和AVI同样，只要安装好了相应的Decode，就能够欣赏这些WAV了。
MP3编码
MP3简介
　　MP3做为目前最为普及的音频压缩格式，为你们所大量接受，编码

编码：用代码表示信息的过程。
解码：将信息从已经编码的形式恢复到编码前原状的过程。
数字模式下，音频的初始信号是PCM（例如wav），可是PCM体积庞大，不利于传输，因而通过编码使其体积变下，例如wav编码成mp3。
解码，就是编码的逆过程，例如播放mp3时，是先将mp3解码成pcm，而后播放。
音频格式也分无损和有损，mp3就是有损的音频编码，mp3还原成pcm时，与以前的是pcm有差异！感受上就是音质降低！code

音频编码视频