- 1、本文档共64页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
ch04 数据仓库与OLAP技术
Data Mining:
Concepts and Techniques
— Chapter 4 —
1
第4章: 数据仓库与OLAP技术
数据仓库: 基本概念
数据仓库建模: 数据立方体和OLAP
数据仓库设计和使用
数据仓库实现
数据泛化:面向属性的归纳
小结
2
什么是数据仓库? (1)
著名的数据仓库专家William.H.Inmon在其著作《
Building the Data Warehouse》中给予如下描述
:数据仓库是一个面向主题的、集成的、时变的
、非易失的数据集合,用于支持管理决策
面向主题的(subject-oriented):数据仓库
中的数据是按照一定的主题域进行组织。主题
是一个抽象的概念,是指用户使用数据仓库进
行决策时所关心的重点方面,一个主题通常与
多个操作型信息系统相关
3
什么是数据仓库? (2)
集成的(integrated):数据仓库中的数据是在对
原有分散的数据库数据抽取、清理的基础上经过系
统加工、汇总和整理得到的,必须消除源数据中的
不一致性,以确保命名约定、编码结构、属性度量
等的一致性
时变的(time-variant):数据仓库中的数据通常
包含历史信息,系统记录了企业从过去某一时点(
如开始应用数据仓库的时点)到目前的各个阶段的
信息,通过这些信息,可以对企业的发展历程和未
来趋势做出定量分析和预测
4
什么是数据仓库? (3)
非易失的(nonvolatile):数据仓库的数据主要供企
业决策分析之用,所涉及的数据操作主要是数据的初
始化装入和数据访问,一旦某个数据进入数据仓库以
后,一般情况下将被长期保留,即数据仓库中一般有
大量的查询操作,但修改和删除操作很少,通常只需
要定期的加载、刷新,不需要事务处理、恢复和并发
控制机制
数据仓库的构造需要数据集成、数据清理和数据统一
数据仓库的构造需要决策支持技术
数据仓库使用更新驱动而不是查询驱动的方法对异种数据库集
成
5
数据仓库 vs.操作数据库系统
联机操作数据库系统的主要任务是执行联机事务和查
询处理,称为OLTP系统
数据仓库在数据分析和决策方面为用户提供服务,称
为OLAP系统
OLTP和OLAP的主要区别
OLTP和OLAP的主要区别
OLTP OLAP
功能 日常操作 长期信息需求,决策支持
特征 操作处理 信息处理
系统面向性 事务和查询处理 数据分析
用户面向性 客户 知识工人
数据内容
您可能关注的文档
- C6000 DSP 硬件结构.pdf
- C4 交互设计流程.pdf
- C6v3.2-集团版-实施手册v1.0.pdf
- C7-电解质溶液.pdf
- C3线路GSM-R运营维护探讨-蒋.pdf
- CABLE线焊接检验.pdf
- C8-可逆电池的电动势及其应用.pdf
- CADCAECAM课程设计实例.pdf
- CAD-7尺寸标注.pdf
- CAD技巧120个(整理).pdf
- 【单元整体教学】Unit 1 Part A Let’s learn第2课时教学课件 (1).pptx
- 高考必备:2024年高考语文文学常识汇总.doc
- 【新课标】Unit 1 B Let’s talk第4课时单元整体课件.pptx
- 中国铸铁件市场最新调研与投资发展战略咨询报告(2024-2025年).doc
- 【单元整体教学】Module 3 Unit 2 I don’t like riding my bike.课件.pptx
- 三级心血管病医院评审标准(2024年版).doc
- 一种换点装置.pdf
- 学前心理学2024—2024历年试题答案.doc
- 2024年05月二级心理咨询师真题及答案.doc
- 用于钢桁拱上弦检查车的自动调平装置.pdf
文档评论(0)