声音数字化及调音基本原理-学习资料汇总

声音数字化及调音基本原理-学习资料汇总

理论知识储备

人体发声原理

人体发声器官

undefined

发声原理

  • 简而言之,人体经过吸气增长肺气压,呼气时肺气压上升冲击声带,形成声门的闭合,成为素音,而素音通过了共鸣腔体,最终发出声音

音色的构成

  • 人的声音由基音和泛音构成,基因决定音调的高低,泛音则决定了人的音色

语言的造成

  • 语言的造成,主要取决于口腔共鸣区(包括口腔、口咽腔和喉腔)各个器官的协做(舌头位置与形状、上下颚的空间大小、喉头的升降、两唇的形状和长短),选择合适的共鸣频率,这个过程叫作“语言的格式化”,而不一样的语言的频段也会有所区别:
    undefined

<参考文档> 发声器官及发声原理 语言的声音频谱 如何训练腔体共鸣 开口音和闭口音 声音的三要素跟声波的幅度、频率和频谱的对应关系 图解泛音及造成原理 声频率范围及各频段音色效果html

声音的物理及数学模型

声波的组成

undefined

  • 如上图所示,声音能够量化成许多振幅和相位各异的正弦波,

频域与时域

undefined

  • 频域上的各个正弦波,经过傅立叶变换,在时域上投影成一个二维的周期性非正弦波,也就是音频数字化采样的模拟波形

混响原理

undefined

  • 声源产生的声波会向四面八方传播,声波遇到障碍物会反射,致使接收方会收到不一样延迟的声波,这些不一样延时的声波混合叫作“混响”
  • 在特定的延迟范围以内,混响能够造成有立体感的声音,但大于延迟阀值,则可能致使声音模糊不清

<参考文档> 深刻浅出讲解傅立叶变换 基波和谐波 混响音效原理和解析android

音频数字化

  • 数字化的主要步骤:采样->量化->编码
    undefined
  • 对模拟音源的声波进行抽样,一般选取的采样率是人耳听觉频率上限(20kHz)的2倍,44.1kHz,采样率越大,声音质量越高,数据量也越大
  • 对采样数据进行量化,选取合适的采样单位(以比特为单位,又称比特率),决定了声音响度变化的精确度
    undefined
  • 对量化后的数据进行编码,转换数字信号

<参考文档> 视频公开课:声音与数字技术算法

调音原理

环境降噪(//TODO)

EQ均衡器调音

  • 数字化的声波是时域上的二维波,经过傅立叶分解以后,能够获得基波和谐波,基波决定了音调,而谐波则决定了音色,EQ经过调整不一样频段的谐波的振幅(增益或衰减),达到调节音色的效果

EQ均衡器原理api

调音操做实践

pc端专业调音软件

  • logic pro x2均衡器调音
    undefined
    录制一段音频,经过手动调节20~20kHz频段范围的分贝值,能够很大程度地改变总体的音色,好比:对中低频进行增益,能够有效突出人声

手机端音乐播放器

  • 网易云音乐-云鲸音效
    net_cloud_music_effect.jpg
  • QQ音乐-super sound
    qq_music_effect.jpg

除了经过eq调节音效,同时还能够经过混响营造不一样的声场(譬如:客厅,歌剧院,演唱会)ide

技术方案调研

android系统解决方案

device-2018-11-08-174441.png

  • 系统api支持回声消除,自动加强,噪音压制,重低音调节,均衡器控制以及内置的均衡器模版,但选取的几部测试机只支持均衡器调节,而且调节的幅度范围偏小,音效的变化不明显

自定义算法实现(//TODO)

相关文章
相关标签/搜索