非文本资源内容获取与利用的调研报告v10.doc

非文本资源内容获取与利用的调研报告v10.doc

  1. 1、本文档共46页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
非文本资源内容获取与利用的调研报告v10

基于主题词间语义关联规则挖掘的文献推荐研究报告 中国学国学图书馆兰馆统2013.11 版本更新历史 版本 日期 作者 内容 1.0 2013-11-6 刘巍 初始版本。 目 录 版本更新历史 I 1. 引言 1 1.1. 研究背景及意义 1 1.2. 国内外研究现状 2 1.2.1. 研究目标和内容 3 1.2.2. 研究目的 3 1.2.3. 研究内容 3 2. 语义WEB、叙词表与本体 5 2.1. 语义WEB概述 5 2.1.1. 语义WEB的起源 5 2.1.2. 语义WEB的体系结构 6 2.2. 叙词表概述 10 2.2.1. 叙词语言与叙词表 10 2.2.2. 叙词表的结构 11 2.3. 本体概述 11 2.3.1. 本体的定义及分类 12 2.3.2. 本体的建模元语 13 2.3.3. 本体的描述语言 14 3. 关联规则挖掘算法 18 3.1. 关联规则挖掘概念 18 3.2. 关联规则的种类 19 3.3. 经典关联规则挖掘算法—Apriori 20 3.3.1. Apriori 算法的挖掘步骤 20 3.3.2. Apriori 算法性质 21 3.3.3. Apriori 算法 21 4. 基于主题词间语义关联的文献检索、推荐功能设计及实现 23 4.1. 系统框架 23 4.2. 功能的主要模块 23 4.3. 开发环境及使用的关键技术 24 4.3.1. 功能的开发环境 24 4.3.2. 关键技术Jena的开发应用 24 4.4. 结合转化SKOS和关联规则挖掘构建本体 27 4.4.1. 构建本体框架 27 4.4.2. 通过转化SKOS创建本体流程 28 4.4.3. 通过关联规则挖掘补充本体关联属性 30 4.5. 基于本体实现检索、推荐 32 4.6. 本体维护策略 38 5. 用户测试及反馈意见 39 6. 结语 40 引言 研究背景及意义 语义 Web 是 Web 应用的发展方向,本体是语义 Web 体系结构中用于50年代末,(Descriptor)是以概念为基础,经过规范化(Nondescriptor)是叙词的同义词或准同义词,Web环境下,语义关系的描述要求更加精确,不同学科不同类型的资源(概念术语、约束、)的参照、映射或其他方法,理解多个领域的知识表达,从Web环境下的资源语义互通。Web体系中本体表示技术提供了比我们以前所用等级关键词树结构Web环境下统一的知识组织体系以及基于该体系的本体构建。 SKOS 标准构建基于 语义WEB、叙词表与本体 语义WEB概述 Web 创始人 Tim berners-Lee 将 Web 的发展分为两个阶段;在第一个阶段, Web 上的资源共享和协作,Web 发展的最初 HTML 网页的方式向人们提供了大量的信 Web 是未来 Web 发展的一个蓝图。然而到目前为止什么是语义 WebTim berners-Lee 对语义 Web 做了如下的描述[]:语义 Web 并不是一个孤立的 Web,而是对当前 Web 的扩展,语义 Web 上的信息 Web 做出这样的定义:语义 Web 是机器可以理解信息 Web。 HTML 语言本身的固有缺陷,这种标记[2]。HTML 语言的这种特 Web 上的信息内容很难被机器所理解,从而制约了一些需要对 Web Web 上海量的信息能够以一 HTML 的 Web 技术已[3]。 近年来出现的Web新标准——可扩展标记语言XML[](Extensible Markup Language)及其相关的技术的出现,使传统 Web 上的信息内容从面向人浏览到XML 实现了 Web 语义标 Web 上的信息标记包含相应的语义,为语义 Web 的 Web 通过扩展现有互联网,在信息中加入表示其含义的内容,使计 Web 中的各种资源不再只是各种相连的信息, Web 的建立需要研究者们对信息进行有效的 Web 的发展起源来看,语义 Web 是人工智能领域和 Web 技术相互 Intranet/Extranet 的信息系统集成,最后扩展到整个 Internet。在这个研究Web 经过十几年的发展,积累了海量信息,需要一种新[5]。 语义 Web 建立的基础是知识的概念化和形式化以及相应的推理。许多分(专有)的系统。语义Web 中的知识,是一系列对资源的建模及描述。资源,是一个非常广泛的概 Web 上的与该资源相关的其它资源,以及这些资源之 Web 的知识表示的特 Web 的分散性和通用性的特点,要求能够被各种各Web 上的知识具有创建上的分散性,同时又具有应用上的通用性。这是语义Web 和传统的人工智能系统的一个非常

文档评论(0)

kabudou + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档