基于张量分解的音频信号分类研究论文设计.docx

基于张量分解的音频信号分类研究论文设计.docx

  1. 1、本文档共60页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
PAGE III 摘 要 随着多媒体和互联网技术的不断进步与发展,音频信号作为多媒体信号的重要组成成分,对其进行信息处理与挖掘受到越来越多的研究者所青睐,而张量作为一种近年来被广泛使用的多线性分析工具,可以处理高维以及多模态的信号。如今网络上进行海量音频信息的查询时,那些混在其中的不良信息和危害性的信息就可以凭借音频分类技术完成审核,这样不仅可以降低人力成本,还能更加便捷的将有害的信息进行屏蔽。因此对于当今社会而言,音频分类技术的应用层面是非常广泛的。而随着人工智能的发展,研究人员对音频场景的分析展现出极大的兴趣,其中音频场景分类逐渐成为焦点。 音频场景分类,是基于音频识别的一种具体的应用。给出音频场景,其中包含各种各样的音频信号,传统的摄像头进行的视频监测,极易受到大雾、暴雨等天气状况以及视野盲区的影响,这些外因都不可避免的会使视频监控的效率降低。而利用音频分类时就能解决这些问题带来的弊端,音频分类只需要一个采集声音的设备和一个接受的设备,视频监控结合音频分类使得我们在今后的生产生活有一定的积极影响,对于单一的监控有很好的效果。 本课题是将音频分类技术进行深入研讨,利用张量分析挖掘出音频信号的高维特征和内部结构信息来提高分类的准确率。本课题研究过程中利用梅尔频谱倒谱系数作为音频特征,在音频进行张量建模和Tucker分解之后生成特征,最后用支持向量机作为分类器完成声学场景的分类。在包含汽车喇叭、发动机空转声、枪击声、儿童游戏声、狗叫、街头音乐等10种类型的共计8732个声音片段进行分类。最终获得分类的正确率为92.4%,单类场景分类的正确率都达到了90%以上,从而为音频场景的分类和音频件检测打下了良好的基础。 关键词:音频分类;特征提取;张量分析;梅尔频谱倒谱系数;支持向量机 Abstract With the progress and development of multimedia and Internet technology, audio signal as an important component of multimedia signal, on the information processing and mining researchers favored by more and more, and the tensor analysis in recent years, as a kind of widely used linear analysis, these factors can deal with high-dimensional and signals. Nowadays, in the search of massive audio information on the Internet, those bad information and harmful information mixed in them can be automatically classified by audio classification. In this way, you can not only reduce the human cost, but also classify the harmful information more effectively and conveniently. Therefore, for todays society, the application of audio classification technology is very wide. With the development of artificial intelligence, researchers have shown great interest in the analysis of audio scenes, and the classification of audio scenes has gradually become the focus. Audio scene classification is a specific application based on audio recognition. Given the audio scene, which contains all kinds of audio signals, the video monitoring carried out by the traditional camera is highly susceptible to the influence of fog, heavy rain and other we

文档评论(0)

专业写作找文采 + 关注
实名认证
服务提供商

修改润色代笔文章撰写。

1亿VIP精品文档

相关文档