- 1、本文档共13页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
小麦遗传术语解答 - - - - - -精品可编辑word学习资料
gX6N9X6U2C2 — — hA6Q3D5B10A8 — — lC4Q5E6Q4V5
聚类分析
科技名词定义
|精.
|品.
|可.
|编.
|辑.
|学.
|习.
|资.
|料.
*
|
*
|
*
|
*
|
|欢.
|迎.
|下.
|载.
聚类分析
cluster analysis
依据某种距离算法对数据点分类;
地理学 (一级学科); 数量地理学 (二级学科)
把观测或变量按肯定规章分成组或类的数学分析方法;
生态学 (一级学科); 数同学态学 (二级学科)
本内容由 全国科学技术名词审定委员会 审定公布
百科名片
中文名称:
英文名称:
定义 1:
所属学科:
定义 2:
所属学科:
聚类分析指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的分 析过程;它是一种重要的人类行为; 聚类分析的目标就是在相像的基础上收集数据来分类;聚类源于很多领域,包括数学,运算机科学,统计学,生物学和经济
学;在不同的应用领域, 很多聚类技术都得到了进展, 这些技术方法 被用作描述数据,衡量不同数据源间的相像性,以及把数据源分类到不同的簇中;
目录
概念
聚类分析的定义 二、判别分析模型三、有关统计量 四、两组判别
一、因子分析模型( FA) 二、有关统计量
三、FA步骤概念
聚类分析的定义 二、判别分析模型
三、有关统计量四、两组判别
一、因子分析模型( FA) 二、有关统计量
三、FA步骤
主要应用主要步骤
聚类分析算法
|精.
|品.
|可.
|编.
|辑.
|学.
|习.
|资.
|料.
*
|
*
|
*
|
*
|
|欢.
|迎.
|下.
|载.
绽开
编辑本段 概念
聚类与分类的不同在于,聚类所要求划分的类是未知的;
聚类是将 数据分类 到不同的类或者簇这样的一个过程,所以同一个簇中的对象有很大的相像性,而不同簇间的对象有很大的相异性;
从统计学的观点看,聚类分析是通过 数据建模 简化数据的一种方法;
传统的统计聚类分析方法包括 系统聚类 法、分解法、加入法、动态聚类法、 有序样品聚类、有重叠聚类和模糊聚类等;采纳 k- 均值、 k- 中心点等算法的聚类分析工具已被加入到很多闻名的统计分析 软件包 中,如 SPSS、SAS 等;
从机器学习的角度讲,簇相当于隐匿模式;聚类是搜寻簇的无监督学习过程;与分类不同,无监督学习不依靠预先定义的类或带类标记的训练
实例,需要由聚类学习算法自动确定标记,而分类学习的实例或 数据对象有类别标记;聚类是观看式学习,而不是示例式的学习;
从实际应用的角度看,聚类分析是数据挖掘的主要任务之一;而且聚类能够作为一个独立的工具获得数据的分布状况,观看每一簇数据的特点,
集中对特定的聚簇集合作进一步地分析; 聚类分析仍可以作为其他算法 (如分类和定性归纳算法)的预处理 步骤 ;
编辑本段 聚类分析的定义
依据讨论对象(样品或指标)的特点,对其进行分类的方法,削减讨论对象的数目;
各类事物缺乏牢靠的历史资料,无法确定共有多少类别,目的是将性质相近事物归入一类;
各指标之间具有肯定的相关关系;
聚类分析 (cluster analysis) 是一组将讨论对象分为相对同质的群组(clusters) 的统计分析技术; 聚类分析也叫分类分析 (classification analysis) 或数值分类 (numerical taxonomy)
变量类型:定类变量、定量(离散和连续)变量聚类方法
|精.
|品.
|可.
|编.
|辑.
|学.
|习.
|资.
|料.
*
|
*
|
*
|
*
|
|欢.
|迎.
|下.
|载.
层次聚类( Hierarchical Clustering ) 合并法
分解法树状图
非层次聚类
K 均值聚类法( K-means Clustering ) 智能聚类法
聚类分析的有关统计量聚合过程表
群重心 群中心 群间距离
分层聚类分析的步骤
定义问题与挑选分类变量聚类方法
确定群组数目聚类结果评估
结果的描述、说明 K-means Cluster( 快速样品聚类 ) 过程属于非层次聚类法的一种
方法原理
挑选(或人为指定)某些记录作为凝结点按就近原就将其余记录向凝结点凝集
运算出各个初始分类的中心位置(均值) 用运算出的中心位置重新进行聚类
如此反复循环,直到凝结点位置收敛为止
K-means Cluster 过程方法特点
要求已知类别数
可人为指定初始位置节约运算时间
样本量大于 100 时有必要考虑只能使用连续性变量
|精.
|品.
|可.
|编.
|辑.
|学.
|习.
|资.
|料.
*
|
*
|
*
|
*
|
|欢.
|迎.
|下.
|载.
K 均值聚类法分析步骤定
文档评论(0)