- 1、本文档共72页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
聚类分析
引
相似性度量
系统聚类
K-均值聚类
聚类分析的SPSS实现
引l言
俗语说,物以类聚、人以群分
但什么是分类的根据呢?
比如,要想把中国的县分成若干类,就有很
多种分类法;
可以按照自然条件来分,
比如考虑降水、土地、日照、湿度等各方面;
也可以考虑收入、教育水准、医疗条件、基
础设施等指标;
既可以用某一项来分类,也可以同时考虑多
项指标来分类
聚类分析
对于一个数据,人们既可以对变量(指标)进行分类
(相当于对数据中的列分类),也可以对观测值(事件
样品)来分类(相当于对数据中的行分类
●比如学生成绩数据就可以对学生按照理科或文科成绩
(或者综合考虑各科成绩)分类,当然,并不一定事
先假定有多少类,完全可以按照数据本身的规律来分
类
●这里要介绍的分类的方法称为聚类分析( cluster
analysis)。对变量的聚类称为R型聚类,而对观测值
聚类称为Q型聚类。这两种聚类在数学上是对称的,
没有什么不同。
饮料数据
●16种饮料的热量、咖啡因、钠及价格四种变量
饮料编号
啡因
3.30
320
4.00
9941
00
10.60
1191321320
哪些少数民族的生存状况更接近?
原始数据
民族
标化死亡率(%)出生时期望寿命(岁)
满族
580
70.59
朝鲜族
7.44
67.14
蒙古族
8.11
65.48
维吾尔族
10.21
5888
藏族
9.51
59.24
哈萨克族9816047
标化死亡率是根据相同的人口年龄结构(标准组)计算的,因而更具可比性
您可能关注的文档
- 联想市部年会的方案.ppt
- 联想与想象作文训练精品.ppt
- 联想文化和心价值观.ppt
- 联想服务的体系之服务规范精选.ppt
- 联想的思维及及其训练.ppt
- 联想新员工工培训的资料.ppt
- 联想电脑公司的项目建议书详解.ppt
- 联想战略析报告.ppt
- 联想销售经的理能力的素质模型.ppt
- 联恩集团品牌推的策略计划.ppt
- 新的一年工作展望.docx
- 医生年终个人工作的述职报告(3篇).docx
- 2023年消防设施操作员之消防设备中级技能考前冲刺练习题附答案详解.docx
- 2022-2023年环境影响评价工程师之环评技术导则与标准通关练习题包括详细解答.docx
- 2023年中级注册安全工程师之安全生产管理考前冲刺检测卷和答案.docx
- 2023年中级银行从业资格之中级银行管理考前冲刺测试卷提供答案解析.docx
- 2023年公共营养师之二级营养师通关模拟考试试卷附带答案.docx
- 证券分析师之发布证券研究报告业务考前冲刺模拟题库.docx
- 2022-2023年二级建造师之二建建设工程法规及相关知识综合提升测试卷附答案.docx
- 2023年二级建造师之二建机电工程实务通关模拟考试试卷提供答案解析.docx
1亿VIP精品文档
相关文档
最近下载
- 儿科病历书写PDCA.docx VIP
- 人教版新教材必修一 第三章第一节 水循环.ppt
- 《建筑制图》教案.pdf VIP
- 专题04 重大基础设施和国防建设、科学研究(9大热点话题 6大考点提炼)(课件)-2024年中考地理二轮复习讲练测(全国通用).pptx VIP
- 2023考研英语5500词汇(适合打印).docx
- 2023-2024学年第一学期语文教研组工作计划范文(2篇).pdf VIP
- 2.2.智能家居软件.doc VIP
- 广告营销策划PPT.pptx VIP
- 高中地理课件:城镇化.ppt
- 专题05+区域协调发展(7大热点话题+8大考点提炼)(课件)-2024年中考地理二轮复习讲练测(全国通用).pptx VIP
文档评论(0)