Web的多维数据仓库建模方法分析.docxVIP

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE 1 PAGE 1 Web的多维数据仓库建模方法分析 基于对Web数据的多维数据仓库建模方法的研究,以便更好地支持企业的经营决策和联机分析处理,是当前教据库研究的一个热点。数据模型是数据仓库的核心问题之一。本文基于这样一个现实背景,对基于Web的多维数据建模的目的、概念、基本方法、关键技术、国内外研究现状进行了深入地归纳总结。 引言 Internet作为为时代的基础构架,涵盖了更为广泛的信息类型的内容,有着更为广泛的应用范围,各类应用的Web数据在深度和广度方面的快速发展,使WWW成为全球化信息传播和信息共享的最有潜力的数据中心。将Web数据集成到企业的数据仓库中去,以便更好地支持企业的经营决策和联机分析处理,是当前数据库研究的一个热点。这一过程需要从相关的Web数据源抽取感兴趣的数据,然后对异构数据进行集成,再对集成后的数据加以适当的转换,将其装入到数据仓库中。把这个过程称为数据仓库化Web数据。其产品支持数据仓库并提出一整套用以建立和使用数据仓库的产品时,业界掀起了数据库热。比如InformixGongside公司的数据仓库解决方案Oracle公司的数据仓库解决方案Sybase公司的交互式数据仓库解决方案等等。这同时也引起了学术界的极大兴趣,国际上很多重要的学术会议,如超大型数据库国际会议VLDB数据工程国际会议DataEngineering等都出现了特地研究数据仓库、联机分析处理OnlineAnalyticalProcessing简记为OLAP和数据挖掘DataMining简记为DM的论文。在激烈的市场竞争中企业必需把业务经营同市场需求联系起来,在此基础上做出科学、正确的决策,以求生存,为此,企业纷纷建立起了自己的数据库系统,由计算机管理代替手工操作,以此来收集、存贮、管理业务操作数据,改善办公环境,提高操作人员的工作效率。 然而,传统的数据库应用系统并不能很好地支持决策,由于传统的数据库应用系统是面向业务操作设计的,只是借助计算机快速、精确处理优势简化了详细操作人员的劳动强度。而企业的中高层领导却没有相应的系统,企业需要新的技术来弥补原有数据库系统的不足,需要把已经广泛收集到的数据集成到一起,那就是数据仓库DataWarehouse简记为DW,以便从业务数据中提取有用的信息,帮助他们在业务管理和发展上做出即时、正确的推断,因此数据仓库成为信息技术领域特别热门的话题之一。 1、多维数据仓库数据建模的发呈现状 数据仓库总是物理地分别存放数据,这些数据源干操作环境下的应用数据,由于这种分别,数据仓库不需要事务处理、故障恢复和并发掌握机制,通常,它只需要两种数据访问:数据的初始扮装入和数据查询;数据经加工和集成进入数据仓库后是极少或根本不修改的,数据仓库最根本的特点是物理地存放数据,而且这些数据并不是最新的、专有的,而是来源于其它数据库的。数据仓库的建立并不是要取代数据库,它要建立在一个较全面和完善的信息应用的基础上,用于支持高层决策分析,而事务处理数据库在企业的信息环境中担当的是日常操作性的任务,数据仓库是数据库技术的一种新的应用,而且到目前为止,数据仓库还是用关系数据库管理系统来管理其中的数据。在数据的存储方面,目前解决多维数据存储的方法一般有两种:关系型和多维型简称为ROLAP及MOLAP。其中ROLAP定义为在建模时,将多维数据模型转换成为关系模式进行物理存储。MOLAP定义为采用多维数据库的方式对海量数据进行组织和管理。 多维数据模型,从理论角度来看这些数据模型分为以下几类:简洁立方体模型、结构化立方体模型、统计对象模型。 简洁立方体模型把数据集合视为多维空间中的点集,把数据集合中的属性分为维和度量两类,维属性用来描述度量属性,是多维空间的维度,度量属性用来进行分析处理,是多维空间中的点。简洁多维数据模型具有一个致命的弱点,即没有维层次结构的概念和语义,不能表示维层次结构。简洁立方体模型包括星型模型。 结构化立方体模型:考虑了如何表示多维数据集合的维层次结构问题,为用户导航立方体供应了更好的指导。这些信息在查询优化时也很有用。一般通过以下途径获取层次关系:分组关系、维合并功能、度量图、上钻功能、格或把明确的层次树结构作为立方体的部分。 统计对象模型:支持结构化的分类层次,但是每个结构化的分类层次必需与一个特定的聚集函数相关,而且每个结构化的分类层次只能定义在一个度量属性上,用来回答特定的统计分析查询。明显,统计对象模型具有很大的局限性,缺少敏捷性。但是这种模型使用聚类语义供应一些保护,避免得到一些对用户无意义的或不正确的结果。 2、数据仓库化Web数据的模型 MIX模型:Web

文档评论(0)

183****5020 + 关注
实名认证
文档贡献者

本账号部分文档来源于互联网和内部收集,仅用于学习交流,版权为原作者所有;文档内容纯属来自网络意见,与本账号立场无关。涉及政治言论一律相应删除,请大家监督;请下载试用后二十四小时内删除。

1亿VIP精品文档

相关文档