写给小白的音频认识基础

时间 2019-11-17

标签写给白的音频认识基础繁體版

原文原文链接

初识音频

从初中物理上咱们就学到，声音是一种波。计算机只能处理离散的信号，经过收集足够多的离散的信号，来不断逼近波形，这个过程咱们叫作采样。怎么样才能更好的还原声音信息呢？这里很天然引出两个概念了。算法

采样频率(Sample Rate)：每秒采集声音的数量，它用赫兹(Hz)来表示。bash

采样率越高越靠近原声音的波形，常见的采样率有如下几种：app

8khz：电话等使用，对于记录人声已经足够使用。
22.05khz：广播使用频率。
44.1kb：音频CD。
48khz：DVD、数字电视中使用。
96khz-192khz：DVD-Audio、蓝光高清等使用。

采样精度(Bit Depth): 它表示每次采样的精度，位数越多，能记录的范围就越大。工具

采样精度经常使用范围为8bit-32bit，而CD中通常都使用16bit。学习

把声音记录下来以后，经过喇叭的震动把波再还给空气传到你的耳朵就完成了这个完美的循环了。可是富有创造力的人类不会限制于此就结束了，很快人们发现，当把不一样的声音传递到不一样的喇叭的时候，居然会惊奇地让声音变得有空间感了，即时是同一个声音，也比单个通道能得到更好的体验，因而就出现了什么立体声，5.1 环绕等看起来很高大上的东西。因此，音频又多了一个东西：网站

声音通道(Channel): 你知道每一个通道存储的声音会从其中的一个喇叭出来就行了，不过能够经过算法的模拟来让没有那么多喇叭也能出来相似的效果。ui

有了声音通道，乐队在录音的时候就能够每一个人插一条音轨了，而后每个声音能够写到不一样的通道里面，固然，实际录音固然都是后期混音而成的。下面介绍的其中一个混音算法会用到声音通道这个特性。编码

最后再介绍一个你们常常看到的概念：spa

比特率(bps [bits per second]): 其实看单位就很容易知道它要表达的意思了，就是每秒钟要播放多少 bit 的数据。公式一目了然：3d

比特率 = 采样率 × 采样深度 × 通道。
复制代码

好比采样率 = 44100，采样深度 = 16，通道 = 2 的音频的的比特率就是 44100 * 16 * 2 = 1411200 bps。

通常来讲，比特率越高，音频质量越好。要注意一些比特率的换算不是 1024 做为一个级别换算的哈。

1,000 bps	= 【1 kbps】 =	1,000 bit/s
1,000,000 bps	= 【1 Mbps】 =	1,000,000 bit/s	
1,000,000,000 bps	= 【1 Gbps】 =	1,000,000,000 bit/s
复制代码

音频在计算机中的表示

咱们来看一下真实音频在计算机中到底是怎样的表示状态，这里指的是原始的数据表示，而非编码(Mp3,Acc等)后的表示，平时咱们看到的.wav后缀的音频，把前面 44 个字节用于记录采样率、通道等的头部信息去掉后就是就是原始的音频数据了。

在理解了上面的概念以后，咱们再来看这张图。对于文件头部信息咱们就不详细介绍了，不影响咱们理解介绍的混音处理方式，须要了解的能够点击这里。

咱们抽取其中的一个采样来看，这里我加多了一个通道，便于你们理解通道的存储位置。

不难理解，这个采样中有三个通道，每通道采样精度是 16 比特。每一个采样值的排序是 Little-Endian 低位在前的方式，好比通道 1 的采样值就是 AB03, 每一个采样值的大小表示的是幅度信息。

好了，先介绍到这里，但愿对你有帮助，若是文章有理解错误的地方，请给我留言指出，感谢你的阅读，下一篇将会介绍有关音频混音的相关知识。

参考资料

技术交流群：70948803，大部分时间群里都是安静的，只交流技术相关，不多发言，不欢迎广告喷子。

不玩音乐的看到这里能够关闭了。

色彩浓重的广告时间：

若是你有玩音乐，我作了一个音乐学习和记录的辅助工具。刚在 Google Play 发布，能够直接点击这里下载：下载声音笔记+。我平时会用它来做即兴练习和合奏练习。

如下是免费的：