第4章音频媒体压缩编码.ppt

下载文档 降价啦

4
0
约1.48万字
约 87页
2021-04-19 发布于广东
举报
版权申诉
保障服务

第4章音频媒体压缩编码.ppt

1、本文档共87页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第4章音频媒体压缩编码层1、2和层3的子带样本 ①. 层1 ISO/MPEG audio层1和层2编码器和解码器的结构层1的子带是频带相等的子带，它的心理声学模型仅使用频域掩蔽特性。层1的“时间-频率多相滤波器组根据信号的频率、强度和音调，输出掩蔽阈值。使用这个阈值与子带中的最大信号进行比较，产生信掩比SMR之后再输入到“量化和编码器”。　　“量化和编码器”首先检查每个子带的样本，找出这些样本中的最大的绝对值，然后量化成6比特，这个比特数称为比例因子(scale factor)。“量化和编码器”然后根据SMR确定每个子带的比特分配(bit allocation)，子带样本按照比特分配进行量化和编码。对被高度掩蔽的子带自然就不需要对它进行编码。 4.2.2 MPEG-X系列音频信号压缩标准 MPEG-1制定于1992年，为工业级标准而设计。它处理音频时，具有CD(指激光唱盘)音质，质量级别基本与VHS相当。MPEG-1是针对整个音频范围的声音进行编码，采样频率为48kHz、采样精度为16位的立体声数据压缩到256b/s时，即在6:1的压缩率下，即使是专业测试员，也难以分辨出是解压声音还是原始声音。 4.2.2 MPEG-X系列音频信号压缩标准 MPEG-2制定于1994年，设计目标是高级工业标准的图象质量以及更高的传输率。MPEG-2可提供CD级的音质。MPEG-2的音频编码可提供左右中及两个环绕声道,以及一个加重低音声道，和多达7个伴音声道(DVD可有8种语言配音的原因)。由于MPEG-2在设计时的巧妙处理，使得大多数MPEG-2解码器也可播放MPEG-1格式的数据，如VCD。 4.2.2 MPEG-X系列音频信号压缩标准两种声音数据压缩格式（1）MPEG-2 Audio，或者称为MPEG-2多声道（Multichannel）声音，又称为MPEG-2 BC（Backward Compatible，后向兼容），与MPEG-1 Audio是兼容的。（2）MPEG-2 AAC（Advanced Audio Coding，先进的音频编码），通常称为非后向兼容MPEG-2 NBC(Non-Backward-Compatible，非后向兼容)标准，与MPEG-1声音格式不兼容。 MPEG-4音频编码 1996年11月在Maceio举行的MPEG第37次会议正式确定的MPEG-2先进音频编码AAC（Advanced Audio Coding），已被作为目前正在制定的MPEG-4音频标准的一部分。 1996年3月在意大利Florence举行的MPEG第34次会议上给出了MPEG-4音频验证模型VM的第一个完整描述。通过大量的核心实验（Core Experiment），音频验证模型得到了迅速的发展。 1996年11月就公布了第一个MPEG-4的音频工作草案。在MPEG第40次会议上，结构音频SA（Structured Audio）和文语转换TTS（Text to Speech）被加到MPEG-4音频标准中，作为合成的音频编码部分。 1997年11月在Fribourg举行的MPEG第41次会议公布了音频标准的最终标准草案（Final Draft International Standard），内容与正式标准基本相同。 1999年1月公布正式标准版本1 2000年1月公布标准的版本2 4.2.2 MPEG-X系列音频信号压缩标准 4.2.2 MPEG-X系列音频信号压缩标准 MPEG-4音频标准（ISO/IEC 14496-3）分为自然音频编码和合成音频编码两大类。 MPEG-4（ISO/IEC 14496）已建立了两个版本，正在开发第3版。MPEG-4音频部分促进广泛的应用，这些应用可能包括从智能语音到高质量多声道音频，从自然声音到合成声音。特别是，它支持由下述成分组成的音频对象的高效表示： · 语音信号： · 合成语音：它允许一个文本或带有韵律参数的文本（基音轮廓，音素持续期等等）作为输入产生可理解的合成语音。 4.3 G.7XX声音压缩编码 G.711声音压缩编码 G.722声音压缩编码 G.723声音压缩编码 G.729声音压缩编码各自的编码方法编/解码器结构及工作原理 4.3.1 G.722声音压缩编码 G.722基于子带 ADPCM技术 (SB—ADPCM) ，它是将现有的带宽分成两个独立的子带信道分别采用差分脉冲编码调制算法。 G.722压缩信号的带宽范围为50Hz到7kHz,而G.711仅限于4.4kHz。其比特率为48、56、64Kbps，在标准模式下，采样速率是16KHz，幅度深度为14比特。 1、G.722的编码方法采用子带自适应差分脉冲编码调制技术（SB