- 1、本文档共21页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
v1.0 可编辑可修改
数据挖掘报告书
题 目: 关联规则算法在电影爱好中的应用
院 系: 经济管理学院
专 业: 信息管理与信息系统
班 级: 07304 班
小组成员: 王梦宇 李肖楠 黄林橙 沈岁 张舒
2010年6月
1
v1.0 可编辑可修改
〇、 SQL Server 2005
Microsoft SQL Server 2005 是微软公司在 2005 年 12 月推出的
一个全面的数据库平台, 使用集成的商业智能工具, 提供了企业级的
数据管理。使用 Business Intelligence Development Studio 在
Analysis Services 项目中定义数据源、数据源视图、维度和多维数
据集,并可以利用其现有的数据挖掘算法方便简单的对数据进行分
析。 SQL Server 2005 包括算法主要有:决策树,关联规则,神经网
络,时序,聚类分析等。
微软公司的数据库产品 SQLServer 2005 中包含了数据挖掘特性 ,
可以直接从数据库或者数据仓库中进行数据挖掘操作, 实现数据挖掘
与数据库以及应用程序的紧密耦合,从而大大提高数据挖掘效率。
Microsoft 关联规则算法属于 priori 关联规则算法家族,该算
法适用于挖掘频繁项集的非常流行和有效的算法。 在关联算法中有两
个步骤:第一个步骤是挖掘频繁项集; 第二步是基于频繁项集来生成
关联规则。
关联规则算法对算法参数的设置非常敏感。以下是用于
Microsoft 关联规则算法的一系列参数:
1.Minimum_Support: 定义了项要成为频繁项集所必须满足的最
小支持度。
2.Maximum_Support:定义了频繁项集的最大支持度阈值。
3.Minimum_Probability :定义了一个关联规则的最小概率。
4.Minimum_Importance:重要性小于它的规则会被过滤掉。
2
v1.0 可编辑可修改
5.Maximum_Itemset_Size:指定项集大小的最大值。
6.Minimum_Itemset_Size :指定项集大小的最小值。
7.Maximum_Itemset_Count:定义项集数目的最大值。
一、引言
当今社会是网络的社会, 人们通过上网能做很多事情, 比如学习、看新闻、交友等等。当然我们觉得有很多人会和我们一样,无聊的时候上网看看电影电视剧。 因此说随着网络的发展, 电影事业的也得到了发展。现在电影的种类也越来越丰富, 不过不是所有电影都符合大家的口味,有的人喜欢惊悚的,有的人喜欢搞笑的等等。这些我们认为都和人们各自的兴趣爱好有一定的关系, 同时我们也觉得也能通过
人们喜欢看什么样的电影反应出那个人的兴趣爱好。 所以我们小组想
通过数据挖掘的关联规则算法对电影( movies)和爱好( hobbies )的关系进行挖掘,并希望通过这次的研究挖掘,对 SQL Server 2005 和数据挖掘能有进一步的了解。
二、应用背景情况
数据来源:数据库 MovieClick
挖掘算法:关联规则算法
3
v1.0 可编辑可修改
三、数据挖掘算法的实施
1、添加数据库:打开 SQL Server Management Studio ,建立
连接,然后右击数据库,点击“附加” ,然后添加数据库
MovieClick ,确定后数据库就添加成功。
4
v1.0 可编辑可修改
2、创建新项目:打开 business intelligence development studio ,
选择“文件”→“新建”命令, 新建一个 Analysis Services
项目。在“名称”文本框中将新项目命名为 Adventure Works ,
点击“确定”按钮。
5
v1.0 可编辑可修改
3、创建数据源及视图:在解决方案管理器中,右击“数据源” ,从弹
出的快捷菜单中选择“新建数据源”命令。系统将打开数据源向
导。单击“新建”按钮,向数据库添加连接。系统将打开“连接
管理器”对话框,在提供程序下拉列表中选择“本机 OLE DB\SQL Native Client ” 选 项, 在 服 务 器 名下 拉 列 表 中 选择 承 载 MovieClick 在“选择或者输入一个数据库名”下拉列表中选择
MovieClick 选项,再点击确定。
6
v1.0 可编辑可修改
7
v1.0 可编辑可修改
在创建视图时,在解决方案管理器中,右击“数据源视图” ,从弹出
的快捷菜单中选择 “新建数据源视图”,系统将打开数据源视图向导。
在“选择数据源”页的“关系数据源”下,默认选中在上一步中创建
的 MovieClick 数据源。单击“下一步” ,在“选择表和视图”页上选择表 movies 和 hobbies ,然后单击右箭
文档评论(0)