《基于WebGIS的计生药具数据挖掘系统》.ppt

《基于WebGIS的计生药具数据挖掘系统》.ppt

  1. 1、本文档共18页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于WebGIS的计生药具数据挖掘系统的研究与应用 王长宾 导师:赵书良 教授 2011年10月27日 目录 1 研究背景和意义 2 国内外研究现状 3 主要研究内容 4 目前完成情况 5 尚未完成的工作 6 后期工作安排 1 研究背景和意义 计划生育避孕药具是落实我国计划生育基本国策的重要物质保证,河北省已将药具管理的信息化建设纳入全省人口和计划生育信息化建设的统一规划中。 随着“河北省计划生育药具管理服务平台”在全省的逐步推广,基层大量育龄妇女信息和服用药具信息不断汇聚到省级中心数据库;原有WIS数据库中也积累了大量的历史数据。此外,“河北省人口统筹管理信息系统”的提出,全员人口和流动人口等基础数据库也汇聚了大量数据。 海量数据虽然蕴含着更丰富的信息,但同时也成了“数据坟墓”。为了更好地推进全省药具服务建设,提高服务水平,迫切需要从药具数据库及相关数据库中挖掘有价值的信息;然后,将这些信息直观地展示出来,为领导决策和规划提供建议性支持。 1 研究背景和意义(续) 论文针对海量数据,综合利用当前流行的WebGIS、Ajax、数据挖掘等技术,从“河北省计划生育药具管理服务平台”数据库及相关数据库中深入抽取和集成有价值的数据,并对相关数据进行转换、聚合、分析、统计、多环节动态跟踪、检测、预警,预测未来发展趋势,挖掘出有兴趣的模式、知识; 利用地理信息技术在数据可视化方面的优势,在地图上以各种统计专题图(如饼图、直方图、折线图、散点图等)和报表的形式直观展示出来,便于进行宏观和微观相结合的数据分析,从而为领导提供决策支持,进而提高全省药具的服务水平。 2 国内外研究现状 微软学术搜索: / 1989年8月在美国底特律召开的第11届国际人工智能会议上首次提出;1995年发展成为国际会议年会。目前,研究在向系统的、全面的方向发展,主要围绕理论、技术和应用三方面展开。理论研究集中在大学,IBM、Microsoft、SPSS、SAS等各大公司也在研究行列中。 数据挖掘与GIS系统的结合主要集中在:对数据挖掘算法进行改进应用到GIS空间数据库中,发现一些空间联系和有趣模式,然后用GIS显式地展示出来。基于WebGIS的数据挖掘应用尚未发现。 2 国内外研究现状(续) CNKI学术趋势: / 目前国内也有相当一部分人员正在从事数据挖掘方面的研究,大致始于1997年。中国科技大学蔡庆生教授领导的针对关联规则的研究小组,哈工大李建中教授的并行数据挖掘系统,四川大学的唐长杰教授在地震中的动态检测数据的发现,上海复旦大学施伯乐教授领导开发的 AMINER、北京大学的基于空间数据挖掘的客户分析系统模型 CASDM,中国科学院计算技术研究所史忠植主持研发的多策略数据挖掘平台MSMiner,清华大学的陆玉昌教授领导开发的数据挖掘系统,李德毅院士基于云模型的数据挖掘技术的创新性工作,清华大学张钹院士在支持向量机的基础理论方面的创新性工作等。 3 研究内容 (1)研究数据挖掘流程模型,科学规范地进行数据挖掘任务,避免时间和精力的浪费; 区别:局部的步骤次序和细分程度、每个步骤所占用的时间、迭代的范围等。 模型 Fayyad Cabena Anand Buchner CRISP-DM Cios Generic Model 领域 学术 商业 学术 商业 学术 - 年份 1996 1998 1998 2000 2000 - 步骤数量 9 5 8 6 6 6 步骤 1研究和理解应用领域 1业务目标检测 1人力确认 1业务理解 1理解问题领域 1应用领域理解 2问题描述 2构造目标数据集 2数据准备 3数据探测 2数据理解 2理解数据 2数据理解 4领域知识诱导 3数据清洗和预处理 5方法识别 3数据准备 3准备数据 3数据准备和确定挖掘技术 6数据预处理 4数据降维和映射 5选择挖掘任务 6选择挖掘算法 7数据挖掘 3数据挖掘 7模式发现 4建立模型 4数据挖掘 4数据挖掘 8解释挖掘出的模式 4领域知识诱导 8知识后处理 5评估 5评估知识 5评估 9合并发现的知识 5吸纳知识 6部署 6利用知识 6知识合并和部署 3 研究内容(续) (2)研究主流数据挖掘系统的结构和实现方案,同时参考GIS结合开发的设计方案,设计了一种基于WebGIS的可视化数据挖掘原型系统; 商业软件:无法定制,灵活性不好,不支持个性化服务与二次开发; 开源软件:对数据集格式有要求,且对大数据集支持不好。 软件 DBMiner Clementine Enterprise Miner Cognos SqlServer Weka RapidMiner 机构 Simon Fraser University, Canada SPSS SAS IBM Microsoft Univ.of Waik

文档评论(0)

边缘人物 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档