- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于词项聚类的文本语义标签抽取研究-计算机科学.PDF
第 卷 第 期 计 算 机 科 学
45 11A Vol.45No.11A
年 月
2018 11 COMPUTER SCIENCE Nov.2018
基于词项聚类的文本语义标签抽取研究
李 雄 丁治明 苏 醒 郭黎敏
(北京工业大学信息学部 北京 )
100124
. ,
摘 要 本研究主要解决在大量文本数据中抽取关键语义信息的问题 文本是 自然语言的信息载体 在分析和处理
, , .
文本信息时 由于目标与方式不同 对文本信息的特征表达方式也各不相同 已有的语义抽取方法往往是针对单篇文
, . , .
本的 忽略了不同文本间的语义联系 为此 文中提出了基于词项聚类的文本语义标签提取方法 该方法以语义抽取
, ,
为目标 以Hinton的分布式表示假说为文本信息的表达方式 并以最大化语义标签与原文本数据间的语义相似度为
, . ,
目标 使用聚类算法对语义标签进行聚类 实验表明 所提方法由于是基于全体词汇表对语义信息分布进行聚类计算
, .
的 因此在语义丰富度和表达能力上相比很多现有方法具有更好的表现
, , ,
关键词 语义抽取 分布式表示假说 聚类 相似度
中图法分类号 TP391 文献标识码 A
WordClusterin BasedTextSemanticTa in ExtractionMethod
g gg g
LIXion DINGZhiGmin SUXin GUOLiGmin
g g g
( , , , )
DeartmentofInformationBeiin UniversitofTechnolo Beiin 100124China
p jg y gy jg
Abstract Thisresearchmainlsolvesthe roblemofextractin ke semanticinformationfromalarenumberoftext
y p g y g
,
data.Textistheinformationcarrierofthenaturallanuae.Whenthetextinfo
您可能关注的文档
- 基于Python的健康数据爬虫设计与实现-软件导刊.PDF
- 基于QtEmbedded和Qtopia的GUI设计-Read.doc
- 询价文件-丽水市妇幼保健院.doc
- 基于SDNNFV技术的vBNG演进方案研究-邮电设计技术.PDF
- 基于SDN的OpenFlow交换机数据包流水线处理机制-计算机科学.PDF
- 基于SMP集群的混合并行编程模型研究-计算机工程.PDF
- 基于SMT求解器的嵌入式多线程程序数据竞态-计算机与数字工程.PDF
- 基于Spark平台的离群数据并行挖掘算法-计算机与数字工程.PDF
- 基于SRAM编程技术的PLD核心可重构电路结构设计-更多文档分类.PDF
- 基于STM32的建筑物接地电阻检测仪-计算机测量与控制.doc
- 2024年镇巴县残疾人联合会一级科员公务员招录1人《行政职业能力测验》模拟试卷(答案详解版).docx
- 2024年清丰县仙庄镇人民政府一级科员公务员招录1人《行政职业能力测验》模拟试卷(答案详解版).docx
- 年产婴幼儿玩具1300万件环评环境影响报告表(新版环评).pdf
- 2021秋季AMC12A 真题与答案.docx
- 4 现值和年金分析法——【工程经济学】.pdf
- 女性乳腺疾病.pdf
- 【公务员资料】猫哥行测理论课讲义 -考公 -2024-.pdf
- 幼儿园 中班语言《月亮》.ppt
- 年产350万个合金塑胶车模玩具改扩建项目(含水环境影响专项评价)环评环境影响报告表(新版环评).pdf
- 佳和医院项目环评环境影响报告表(新版环评).pdf
文档评论(0)