数据挖掘报告书.docx

  1. 1、本文档共21页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
v1.0 可编辑可修改 数据挖掘报告书 题 目: 关联规则算法在电影爱好中的应用 院 系: 经济管理学院 专 业: 信息管理与信息系统 班 级: 07304 班 小组成员: 王梦宇 李肖楠 黄林橙 沈岁 张舒 2010年6月 1 v1.0 可编辑可修改 〇、 SQL Server 2005 Microsoft SQL Server 2005 是微软公司在 2005 年 12 月推出的 一个全面的数据库平台, 使用集成的商业智能工具, 提供了企业级的 数据管理。使用 Business Intelligence Development Studio 在 Analysis Services 项目中定义数据源、数据源视图、维度和多维数 据集,并可以利用其现有的数据挖掘算法方便简单的对数据进行分 析。 SQL Server 2005 包括算法主要有:决策树,关联规则,神经网 络,时序,聚类分析等。 微软公司的数据库产品 SQLServer 2005 中包含了数据挖掘特性 , 可以直接从数据库或者数据仓库中进行数据挖掘操作, 实现数据挖掘 与数据库以及应用程序的紧密耦合,从而大大提高数据挖掘效率。 Microsoft 关联规则算法属于 priori 关联规则算法家族,该算 法适用于挖掘频繁项集的非常流行和有效的算法。 在关联算法中有两 个步骤:第一个步骤是挖掘频繁项集; 第二步是基于频繁项集来生成 关联规则。 关联规则算法对算法参数的设置非常敏感。以下是用于 Microsoft 关联规则算法的一系列参数: 1.Minimum_Support: 定义了项要成为频繁项集所必须满足的最 小支持度。 2.Maximum_Support:定义了频繁项集的最大支持度阈值。 3.Minimum_Probability :定义了一个关联规则的最小概率。 4.Minimum_Importance:重要性小于它的规则会被过滤掉。 2 v1.0 可编辑可修改 5.Maximum_Itemset_Size:指定项集大小的最大值。 6.Minimum_Itemset_Size :指定项集大小的最小值。 7.Maximum_Itemset_Count:定义项集数目的最大值。 一、引言 当今社会是网络的社会, 人们通过上网能做很多事情, 比如学习、看新闻、交友等等。当然我们觉得有很多人会和我们一样,无聊的时候上网看看电影电视剧。 因此说随着网络的发展, 电影事业的也得到了发展。现在电影的种类也越来越丰富, 不过不是所有电影都符合大家的口味,有的人喜欢惊悚的,有的人喜欢搞笑的等等。这些我们认为都和人们各自的兴趣爱好有一定的关系, 同时我们也觉得也能通过 人们喜欢看什么样的电影反应出那个人的兴趣爱好。 所以我们小组想 通过数据挖掘的关联规则算法对电影( movies)和爱好( hobbies )的关系进行挖掘,并希望通过这次的研究挖掘,对 SQL Server 2005 和数据挖掘能有进一步的了解。 二、应用背景情况 数据来源:数据库 MovieClick 挖掘算法:关联规则算法 3 v1.0 可编辑可修改 三、数据挖掘算法的实施 1、添加数据库:打开 SQL Server Management Studio ,建立 连接,然后右击数据库,点击“附加” ,然后添加数据库 MovieClick ,确定后数据库就添加成功。 4 v1.0 可编辑可修改 2、创建新项目:打开 business intelligence development studio , 选择“文件”→“新建”命令, 新建一个 Analysis Services 项目。在“名称”文本框中将新项目命名为 Adventure Works , 点击“确定”按钮。 5 v1.0 可编辑可修改 3、创建数据源及视图:在解决方案管理器中,右击“数据源” ,从弹 出的快捷菜单中选择“新建数据源”命令。系统将打开数据源向 导。单击“新建”按钮,向数据库添加连接。系统将打开“连接 管理器”对话框,在提供程序下拉列表中选择“本机 OLE DB\SQL Native Client ” 选 项, 在 服 务 器 名下 拉 列 表 中 选择 承 载 MovieClick 在“选择或者输入一个数据库名”下拉列表中选择 MovieClick 选项,再点击确定。 6 v1.0 可编辑可修改 7 v1.0 可编辑可修改 在创建视图时,在解决方案管理器中,右击“数据源视图” ,从弹出 的快捷菜单中选择 “新建数据源视图”,系统将打开数据源视图向导。 在“选择数据源”页的“关系数据源”下,默认选中在上一步中创建 的 MovieClick 数据源。单击“下一步” ,在“选择表和视图”页上选择表 movies 和 hobbies ,然后单击右箭

文档评论(0)

187****3657 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档