第二章语音信号产生的数字模型汇编.ppt

下载文档 降价啦

4
0
约6.1千字
约 59页
2017-07-12 发布于湖北
举报
版权申诉
保障服务

第二章语音信号产生的数字模型汇编.ppt

1、本文档共59页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第二章语音信号产生的数字模型汇编

发音的三种方式－excitation 浊音（voiced sounds）声带开启和闭合，在声门处产生一个准周期性脉冲序列。（quasi-periodic sequence）清音（unvoiced sounds）声带完全舒展开来，声道的某个部位发生收缩形成了一个狭窄的通道，当空气流到达此处时被迫以高速冲过收缩区，并在附近产生空气的湍流，类似于白噪声。（white noise）爆破音（plosive/stop sounds）声带完全舒展开来，声道的某个部位完全闭合在一起，当空气流到达时便在此处建立起空气压力，一旦闭合点突然开启便会让气压快速释放，实际上也是一种空气的湍流。（white noise） Matlab 命令：specgram Wideband spectrogram：给出共振峰频率 Narrow spectrogram：基音周期及其谐波声母、韵母和声调是汉语语音的三要素。汉语语音的一个不同于其他语言的是它具有声调（音调）。声调是1个音节在念法上的高低升降的变化，汉语中有4个声调，即阴平（－）、阳平（ ′）、上声（ ? ）、和去声（‵）。三、汉语音节的一般结构声调的变化就是浊音基音周期的变化，为了将调值描写地具体一些，一般采用“五度标记法”，用一条竖线表示声音的高低，从上而下用1、2、3、4、5依次表示低、半低、中、半高、高。 5 高 4 半高 3 中 2 半低 1 低阴平阳平上声去声 51 214 35 55 调值去声上声阳平阴平调类四、语音信号的统计特性语音信号振幅分布的概率密度有两种逼近方法：修正伽玛（Gamma）分布概率密度函数：拉谱拉斯（Laplace）分布概率密度函数: 人类接收语音由人耳来完成，空气振动由耳廓收集，经外耳道而抵达鼓膜，鼓膜随之振动，使鼓室中的空气和听骨链也发生振动，听骨链的振动经前庭窗（卵圆窗）激励前庭淋巴，变为液波，液波使位于基底膜上的螺旋器受到刺激，将神经冲动经听神经传到中枢而产生听觉。 §2.5 人类的听觉功能正常人的听觉系统是极为灵敏的，可听声的范围为20Hz-20kHz。可听声的最小声压级(dB)称为听阈。-5～130dB，对低频和高频是不敏感的，听阈为60dB，在1kHz附近最敏感。如果信号是一个多频率的信号，则产生的行波将沿着基底膜在不同的位置产生最大幅度，从这个意义上讲，耳蜗就像一个频谱分析仪，将复杂信号分解成各种频率分量，这种作用称为人耳的时频分析特性。耳蜗在语音接收过程起着重要的作用。耳蜗对声信号的时频分析特性人工耳蜗是一种电子装置，能帮助重度及极重度耳聋患者获得或重新恢复听觉。它代替病变受损的听觉器官，把声音转换成编码的电信号传入内耳耳蜗，刺激分布在那里的听神经，再由大脑产生听觉。人工耳蜗麦克风接收声音，并通过导线将其传至言语处理器；言语处理器对声音进行数字化、滤波编码等处理，并将编码信号经导线传至传输线圈；传输线圈将编码信号通过耦合传至皮下的接收器；接收器对编码信号进行解码；按信号选择一定位置的电极，刺激耳蜗内的听神经纤维，使其产生兴奋，将信号传入大脑，产生听觉。人工耳蜗的工作原理人耳的掩蔽效应人耳的掩蔽（masking phenomenon）效应:在一个强信号附近弱信号将变得不可闻，被掩蔽掉了。掩蔽阈值被掩蔽掉的不可闻信号的最大声压级称为掩蔽门限和掩蔽阈值（masking threshold）,在这个掩蔽阈值以下的声音将被掩蔽掉。掩蔽效应分为同时掩蔽(频域掩蔽)和短时掩蔽（时域掩蔽）。同时掩蔽是指存在一个弱信号和一个强信号，当其频率接近时，强信号会提高弱信号的阈值，就会导致弱信号变得不可闻。 1kHz的听阈 1dB 20dB 4dB 可闻声 3dB 不可闻声图形描述同时出现的A声和B声，若原来A声的阈值为50dB,由于另一个频率不同的B声的存在使得A声的阈值提高了68dB,则B声称为掩蔽声，A声称为被掩蔽声。掩蔽量为68dB－50dB＝18dB。数学描述掩蔽效应的作用当只有A声时，必须将声压级在50dB以上的声音信号传送出去，50dB以下的声音是听不到的。当同时出现了B声，由于掩蔽效应，使得A声中的68dB以下的声音是听不到了，可以不予传送，只是传送50dB以上的信号。同时掩蔽时，掩蔽声越强，掩蔽作用越大；掩蔽声和被掩蔽声的频率越接近，掩蔽效果越明显，当频率相同时，掩蔽效果最大。前向掩蔽：若被掩蔽声A出现后，相隔(0.05s,2s)之内出现了掩蔽声B，对A起掩蔽作用，因为A声尚未被人所