第7章主成分课件.ppt

  1. 1、本文档共35页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第7章主成分课件

第7章 主成分分析(PCA) principal component analysis; 背景:一项十分著名的工作是美国的统计学家斯通(stone)在1947年关于国民经济的研究。他曾利用美国1929一1938年各年的数据,得到了17个反映国民收入与支出的变量要素,例如雇主补贴、消费资料和生产资料、纯公共支出、净增库存、股息、利息外贸平衡等等。 在进行主成分分析后,竟以97.4%的精度,用三新变量就取代了原17个变量。根据经济学知识,斯通给这三个新变量分别命名为总收入F1、总收入变化率F2和经济发展或衰退的趋势F3。更有意思的是,这三个变量其实都是可以直接测量的;假定只有两个变量x1和x2,从散点图可见两个变量存在相关关系,这意味着两个变量提供的信息有重叠;多维变量的情形类似,只不过是一个高维椭球,无法直观地观察 每个变量都有一个坐标轴,所以有几个变量就有几主轴。对变量进行线性处理,???代表大多数数据信息的最长的几个轴作为新变量,这样,降维过程也就完成了;; (1) 基于相关系数矩阵还是基于协方差矩阵做主成分分析。当分析中所选择的经济变量具有不同的量纲,变量水平差异很大,应该选择基于相关系数矩阵的主成分分析。 (2) 选择几个主成分。主成分分析的目的是简化变量,一般情况下主成分的个数应该小于原始变量的个数。关于保留几个主成分,应该权衡主成分个数和保留的信息。 ;;1 计算步骤;1 计算步骤;1 计算步骤;;满足如下的条件:;方法一:;地区;地区;【解】 1. 数据标准化后,求7个变量相关系数矩阵:;2. 求R的特征根及相应的单位正交特征向量和贡献率 由R的特征方程 求得R的单位特征根λ为: ;3. 确定主成分的个数 按 的原则,取三个主成分就能够对工业企业经济效益进行分析,且这三个主成分的累计方差贡献率达到84.06%主成分的表达式为: ;利用SPSS进行主成分分析;主成分分析 ; 某市工业部门13个行业8项指标; (一)利用SPSS进行因子分析 将原始数据输入SPSS数据编辑窗口,将5个变量分别命名为X1~X5。在SPSS窗口中选择分析→降维→因子分析菜单项,调出因子分析主界面,并将变量X1~X5移入变量框中,其他均保持系统默认选??,单击OK按钮,执行因子分析过程; 特征根和方差贡献率表; (二)利用因子分析结果进行主成分分析 1. 将成分矩阵中的数据输入SPSS数据编辑窗口,分别命名为t1和t2。; 2. 计算第一个特征向量,点击菜单项中的转换→计算变量,调出对话框,在对话框中输入等式 a1=t1 / SQRT(3.105) 点击OK按钮,即可在数据编辑窗口中得到以a1为变量名的第一特征向量。 同样方法可以得到以a2为变量名第二特征向量。;7.4主成分的应用之 二——聚类;综合评价:如何选择评价指标体系? 如何对这些指标进行综合? 指标权重如何更加客观? 主成分根据样本数据提供的信息计算指标的权重,客观加权,可以避免综合评价者的主观影响,在实际应用中越来越受到人们的重视。 如何确定权重? 将主成分的权数根据方差贡献率来确定,因为方差贡献率反映了各个主成分的信息含量多少。 ; ;主成分综合评价实例 ; 某市工业部门13个行业8项指标;计算这些指标的主成分,然后通过主成分的大小进行排序 利用主成分得分进行综合评价时,从特征向量我们可以写出所有8个主成分的具体形式:;特征根和累计贡献率;特征向量;以特征根为权,对8个主成分进行加权综合,得出各工业部门的综合得分,具体数据见表。 综合得分的计算公式是: 计算出各工业部门的综合得分,并可据此排序。; 各行业主成分得分及排序

文档评论(0)

baa89089 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档