多媒体通信技术课件第三章 音频信息处理技术.ppt

多媒体通信技术课件第三章 音频信息处理技术.ppt

  1. 1、本文档共51页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三章 音频信息处理技术 3.1 声学基础知识 3.2 音频信号数字化 3.3 音频信号压缩编码 3.4 语音压缩编码标准 3.5 IP电话技术 自然界的声音信号究其本质是一种机械振动,是一种在空气中随时间而变化的压力信号。 音频信息涉及人耳所能听到的声音信息,包括语声和乐声。 2.1 声学基础知识 2.1.1 音频信号特征 1、声音信号的时域特征 该特征说明人们听到的声音从产生到结束的过程。 这个过程大致可分为三个阶段:起始、稳定和结束。 2、声音信号的频域特征 声音信号是有很多的正弦分量组成的。 声音信号在频域是具有离散的线性谱和连续谱的特征 声波频率 20Hz~20kHz 声压:对声音强弱的感觉 1kHz~听阈2*10-5Pa 声压级:表示声音强弱的对数级(分贝) 听阈0dB 痛阈 120dB 3.1.2 人耳听觉特性 1、响度:人耳对声音强弱的感觉。 2、掩蔽效应: 一个声音的存在会影响人们对其他声音的听觉能力, 使一个声音在听觉上掩蔽了另一个声音。 3.2 音频信号数字化 音频信号的数字化过程就是将模拟音频信号转换成有限个数字表示的离散序列, 即数字音频序列。 1、采样 在时间上将连续信号离散化的过程,采样一般都是按照均匀的时间间隔进行。 2、量化 量化是将每个采样值在幅度上进行离散化处理。 3、编码 编码过程是指用二进制数来表示每个采样的量化值。 3.3 音频信号压缩编码 3.3.1 音频信号编码分类 1、波形编码:基于对语音信号波形的数字化处理,试图使处理后重建的语音信号波形与原信号波形保持一致。 优点:实现简单、语音质量较好、适应性强。 缺点:压缩程度不高,需要较高的编码速率。 常用的波形编码技术:增量调制编码(DM)差值脉冲编码调制(DPCM)自适应差分脉冲编码调制(ADPCM)子带编码(SBC)矢量量化编码(VQ) 2、参数编码 通过语音信号的数学模型,对语音信号特征参数进行提取及编码,力图使重建的语音信号尽可能保持原信号的语意。 语音编码速率较低,压缩的比特率较低。 合成语音质量较差,很难辨别说话人是谁。 常用的有线性预测编码。 多用在移动通信、多媒体通信和IP网络电话中。 3、混合编码 同时使用两种或两种以上编码方法进行编码的过程。 采用混合编码的编码器有多脉冲激励线性预测编码器(MPE-LPC)、规则脉冲激励线性预测编码器(RPE-LPC)、码激励线性预测编码器(celp)等。 3.3.2 常用的压缩编码方法 1 一般增量调制(DM) 基本思想:在编码端,由前一个输入信号的编码值经解码器可得到下一个信号的预测值。输入的模拟音频信号与预测值在比较器上相减,从而得到差值。若为正,则编码输出为1;若为负,则编码输出为0。 当输入模拟信号的变化速度超过了经解码器输出的预测信号的最大变化速度时,会发生斜率过载。 当输入信号没有变化时,预测信号和输入信号的差会十分接近,这时,编码器的输出是1和0交替出现的,这种现象叫散粒噪声。 2、自适应增量调制(ADM) 输出编码1位所表示的模拟电压叫做量化

文档评论(0)

zhuliyan1314 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档