基于K-means算法的平面点集聚类系统论文.doc

下载文档 降价啦

1
0
约1.46万字
约 32页
2017-08-12 发布于湖北
举报
版权申诉
保障服务

基于K-means算法的平面点集聚类系统论文.doc

1、本文档共32页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

基于K-means算法的平面点集聚类系统毕业论文目录 1绪论 1 1.1研究意义及背景 1 1.2系统设计要求 2 1.3本文目的 3 2研究现状及设计目标 4 2.1国内外相关研究现状 4 2.2现行研究存在的问题及解决办法 5 2.2.1K-means的基本思想 6 2.2.2K-means的优点 6 2.2.3聚类分析中常用的距离计算函数 6 2.2.4聚类方法分析 7 2.2.5其他聚类算法 8 2.2设计目标 9 2.3 经济效益分析 9 3关键问题及分析 10 3.1研究设计中要解决的问题 10 3.2前期工作 12 3.3关键技术 12 3.3.1K-means算法 12 3.3.2相关技术介绍 13 4需求分析 15 4.1总体设计思想及设计原则 15 4.1.1设计思想 15 4.1.2设计原则 16 4.2可行性分析 16 4.3系统开发工具及环境 16 5系统设计及实现 17 5.1系统构架 17 5.2各模块的实现方法及关键代码 18 5.2.1数据输入模块 18 5.2.2K-means算法计算模块 19 5.2.3结果输出模块 19 5.2.4绘图模块 20 5.3系统流程 22 5.4界面设计 23 5.4.1数据输入界面 23 5.4.2结果输出界面 23 5.4.3绘图界面 24 6系统测试 25 6.1测试实例的研究与选择 25 6.2实例测试 25 7结论与展望 28 参考文献 29 致谢 31 绪论随着计算机硬件和软件技术的飞速发展，尤其是数据库技术的普及，人们面临着日益扩张的数据海洋，原来的数据分析工具已无法有效地为决策者提供决策支持所需要的相关知识，从而形成一种独特的现象“丰富的数据，贫乏的知识”。数据挖掘（Data Mining）又称为数据库中知识发现（Knowledge Discovery form Database，KDD），它是一个从大量数据中抽取挖掘出未知的、有价值的模式或规律等知识的复杂过程。目前是在大量的数据中发现人们感兴趣的知识。常用的数据挖掘技术包括关联分析、异类分析、分类与预测、聚类分析以及演化分析等。由于数据库中收集了大量的数据，聚类分析已经成为数据挖掘领域的重要技术之一，本文中介绍的K-means算法就是聚类分析中应用最广泛的一种聚类算法。研究意义及背景面对信息技术的日新月异，人们利用信息技术生产和搜集数据的能力大幅度提高，大量的数据库被用于商业管理、政府办公、科学研究和工程开发等等，要想使数据真正成为一个公司的资源，只有充分利用它为公司自身的业务决策和战略发展服务才行，否则大量的数据可能成为包袱，数据挖掘和知识发现技术应运而生，并得以蓬勃发展，越来越显示出其强大的生命力。数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中，提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。人们把原始数据看作是形成知识的源泉，就像从矿石中采矿一样。原始数据可以是结构化的，如关系数据库中的数据，也可以是半结构化的，如文本、图形、图像数据，甚至是分布在网络上的异构型数据。发现知识的方法可以是数学的，也可以是非数学的可以是演绎的，也可以是归纳的。挖掘出的知识可以被用于信息管理。查询优化、决策支持、过程控制等，还可以用于数据自身的维护。因此，数据挖掘是一门交叉学科，涉及人工智能技术、统计技术与数据库技术等多种技术。它汇聚了不同领域的研究者，尤其是数据库、人工智能、数理统计、可视化、并行计算等方面的学者和工程技术人员。聚类是数据挖掘技术研究中的重要技术的一种，能有效的通过分析数据并从中发现有用的信息。聚类将数据对象分组成为若干个类或簇，使得在同一个簇中的对象之间具有较高的相似度，而不同簇中的对象差别很大，通过聚类，人们能够识别密集和稀疏的区域，发现全局的分布模式以及数据属性之间有趣的相互关系。聚类分析在客户分类、基因识别、文本分类、空间数据处理、卫星照片分析、医疗图像自动检测等领域有着广泛的应用，而其本身的研究也是一个蓬勃发展的领域，数据挖掘、统计学、机器学习、空间数据库技术、生物学和市场学的发展推动着聚类分析研究的进展，使它已成为数据挖掘研究中的一个热点，在市场分析中，通过聚类分析能帮助决策者识别不同特征的客户群以及各客户群的行为特征在生物工程研究中，聚类分析能够用于推导动植物的分类，按照功能对基因进行划分并获取种群中的固有结构特征在非关系数据库领域如空间数据库领域，聚类分析能够识别具有相同地理特征的区域以及该区域的环境和人的特征在信息检索领域，聚类分析能够对文档进行分类，提高检索效率。聚类分析将大量数据划分为性质相同的子类，便于了解数据的分布情况。与其他数据挖掘方法不同，在进行聚类分析前用户一般并不知道数据集的特征。因此，从某种