《关联规则数据挖掘结果的可视化方法》.ppt

《关联规则数据挖掘结果的可视化方法》.ppt

  1. 1、本文档共20页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
报告人:赵娇娇 导 师:赵书良教授 日 期:2012.10.29 报告内容 尚未完成的工作 4 研究目的和意义 1 国内外研究现状 2 主要研究内容 3 5 目前已完成情况 后期工作安排 6 1.研究目的和意义 1)关联规则挖掘是数据挖掘的一个重要研究方向 关联规则挖掘目的是发现大量数据中有趣的关联或相关联系,从中发现一些对用户有用的信息。因此,有效地表示关联规则挖掘结果是至关重要的。 2)关联规则可视化是关联规则挖掘研究的一个新方向 关联规则可视化是将关联规则挖掘后得到的结果以图形等可视化形式表示出来,充分利用图形和图像的表达能力以及人对于色彩和形状敏锐的感知能力,使用户更加方便地对结果进行观察和分析。 研究目的和意义(续) 3)面向非数据挖掘领域专家的关联规则展示方法甚少。 随着关联规则挖掘的普及和应用,关联规则挖掘结果的展示也应更加大众化,更加贴近普通用户的需求,因为并非所有用户都能理解“啤酒=尿布,conf=90%”所表达的信息或者知识。针对此问题,提出了一种新的基于自然语言生成的关联规则可视化方法,将关联规则解释成大众化的自然语言。 2.国内外研究现状 1)基于表的可视化技术 类似于关联规则的原始行文字描述形式,用表结构文字化描述关联规则(如图1),表中的每一行描述一条关联规则,每一列分别描述关联规则中的参数,包括规则的前项、后项、支持度和置信度。此方法的优点是能够利用表的基本操作,对感兴趣的列(如支持度)进行排序,存在的不足是一般用户可理解性差,即不具有数据挖掘背景的一般用户对挖掘出的关联规则很难理解,降低了用户体验,导致无法充分利用挖掘出的价值信息。 图1 基于表的关联规则可视化 国内外研究现状(续) 2)基于图形的可视化技术 包括基于平行坐标的可视化技术(如图2)、基于矩阵的可视化技术(如图3)等等。此类方法将关联规则映射成不同的图形原语,例如位置、形状、颜色和大小。此类方法的优势是充分利用图形和图像的表达能力以及人对于色彩和形状敏锐的感知能力,利于用户方便深入地对结果进行观察和分析,但是需要用户对色彩和形状有敏锐的感知能力,一般用户很难达到这个要求,所以此类方法对一般用户来说,易理解性较差。 图2 基于平行坐标的关联规则可视化 图3 基于矩阵的关联规则可视化 国内外研究现状(续) 3)自然语言生成的现状 自然语言生成(Natural Language Generation,NLG)是人工智能和计算语言学的分支,是从抽象的概念层次开始,通过选择并执行一定的语义和语法规则来生成文本。 自然语言生成技术的发展已相对比较成熟,并已应用到很多领域,如路线描述系统、文章摘要、医学诊断报告、专家系统中规则的自然语言解释、对话系统等等。但是,将自然语言生成技术应用到关联规则结果展示上的研究还很少。 3.主要研究内容 本文研究核心为将自然语言生成引入到关联规则可视化中,结合相应的领域知识库将关联规则解释成大众化的自然语言,更加重视不具有挖掘领域知识的非专家用户是否能够清楚地理解挖掘出的知识,主要内容为: 1)单维关联规则的自然语言生成方法 2)通用的关联规则自然语言生成方法 3)系统原型的实现 4.目前已完成情况 已完成的研究内容为: 4.1单维关联规则的自然语言生成方法 (1)结构图 (2)算法 4.2通用的关联规则自然语言生成方法 (1)结构图 (2)指导本体 (3)算法 目前已完成情况(续) 4.1单维关联规则的自然语言生成方法—概念解释 单维关联规则中的项或属性只涉及一个维: 例如:关联规则buys(啤酒)= buys(尿布), 它只涉及一个维buys,即一个谓词。 目前已完成情况(续) 4.1单维关联规则的自然语言生成方法—结构图 图 该方法结构图 pattern(subject,predicate,object) 规则1:pattern(s1,p,o)+pattern(s2,p,o)=pattern(s1、s2, p, o) 规则2:pattern(s,p,o1)+pattern(s, p, o2)=pattern(s,p,o1、o2) 规则3:pattern(s,p1,o)+pattern(s,p2,o)=pattern(s,p1、p2, o) 模板1 template1(pattern,sup) 模板2 template2(pattern1,pattern2,con) 目前已完成情况(续) 4.1单维关联规则的自然语言生成方法—算法 算法步骤如下: 1)构建挖掘领域的知识库,即定义解释模式pattern、合并规则等; 2)根据预定

文档评论(0)

边缘人物 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档