- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
应用多元统计分析 第七章、主成分分析第5讲、主成分分析的应用
设n次观测数据阵X已标准化,这时样本协方差阵就是样本相关阵R, R的特征值为λ1≥λ2 ≥ …≥λp 相应的标准化特征向量为a1,a2, …,ap 。样本主成分为 Zi=ai'X (i=1,…,p). 设m为满足累计贡献率>P0(一般取1≥P0≥0.7 )的最小正整数,取前m个主成分Z1 ,Z2 ,… ,Zm,由样本观测数据X(i) (i=1,2,…n)可求得m个主成分的得分值zij :
利用样本主成分的性质(3),Xk由前m个主成分Z1 ,Z2 ,… ,Zm的最佳(残差平方和最小)表示式为把Z(i )(i=1,2,…,n)代入上式,可得
由此可得出由主成分得分值估计变量Xk的得分向量.记其中(7.3.2)
当选取合适的m,可使得后面的p-m个?i的和很小,这时就有其中可以证明
一、指标分类(变量分类) 如果第i个变量和第j个变量的相关系数rij≈1,显然这两个变量应归为一 类. 仍用Xi和Xj表示这两个变量的n次观测向量.考虑n维空间中这两点的距离:因 (n-1)R=X 'X=(X1,…, Xp ) '(X1,…, Xp ), 故有 Xi 'Xj =(n-1) rij (i,j=1,…,p)
zi 'zi=(n-1) λi (i=1,2,…,p) zi'zj=0 (当i≠j 时 )
因第k个主成分Zk与原标准化变量Xi的相关系数为?ik也称为第k个主成分Zk对Xi的因子负荷量. 这时 2(1- rij)≈(?i1-?j1)2+…+ (?im-?jm)2 ,若rij≈1, 则有 (?i1-?j1)2+…+ (?im-?jm)2 ≈ 0 .
考察m维空间的p个点Qi,其坐标为 Qi=(?i1 ,?i2 ,...,?im ) (i=1,2,…,p) .按距离最近准则对p个点进行分类. 当m=2时,p个点可在平面上点出来,利用散布图可直观地给出指标的分类.
二、样品分类 对p个变量(指标)观测n次,得n个样品,记 X(i) =(xi1, xi2 ,…, xip)′为第i个样品,看成p维空间的点,可按距离相近的程度进行分类(参见第六章聚类分析),即若‖ X(i) - X(j)‖≈0,就把第i个样品和第j个样品归为一类.。 因原始数据阵X≈X*,故 ‖ X(i) - X(j)‖≈ ‖ X*(i) - X*(j)‖由(7.3.1)及(7.3.2)式中x*ik的定义知
因‖X*(i)-X*(j)‖2=‖a1(zi1- zj1)+…+am(zim- zjm )‖2 =(zi1- zj1)2 +…+(zim- zjm ) 2 注意:a1, a2,…, am,为单位正交向量.
这样就把考察二个p维空间点的靠近程度转化为考察两个m(m<p)维空间点的靠近程度. 若取m=2,n个样品点可在平面上点出,利用点的分布规律对样品进行分类.三、样品排序或系统评估 对多指标系统进行排序评估的主要方法是加权评估法.比如专家评估方法,综合评分法,层次分析法等.随着多元统计方法的普及与应用,主成分分析方法也成为构造系统排序评估指数的常用方法之一. 设Z1是标准化随机向量X=(X1,…,Xp)′的第一主成分.由主成分的性质可知,Z1与原始标准化变量X1,X2,…,Xp的综合相关程度最强,
即ρ2(Z1,X1)+…+ρ2(Z1,Xp)= λ1达最大,其中λ1为X的相关阵R的最大特征值.如果只选一个综合变量来代表原来所有的原始变量,最佳的选择就是Z1 . 另方面,由于第一主成分Z1对应于数据变异最大的方向,这说明Z1是使数据信息损失最小,精度最高的一维综合变量,因此它可用于构造系统排序评估指数.
小结主成分分析的应用:1、变量的分类2、样品的分类3、样品的排序和评估
您可能关注的文档
- 多元统计分析多元统计分析 (41).ppt
- 多元统计分析多元统计分析 (43).ppt
- 多元统计分析多元统计分析 (44).ppt
- 多元统计分析多元统计分析 (45).ppt
- 多元统计分析多元统计分析 (46).ppt
- 多元统计分析多元统计分析 (47).ppt
- 多元统计分析多元统计分析 (48).ppt
- 复变函数与积分变换 (1).ppt
- 复变函数与积分变换 (2).ppt
- 复变函数与积分变换 (3).ppt
- GB/T 29324-2024架空导线用碳纤维增强复合材料芯.pdf
- 《GB/T 29324-2024架空导线用碳纤维增强复合材料芯》.pdf
- GB/T 43905.1-2024焊接及相关工艺中烟尘和气体取样的实验室方法 第1部分:电弧焊中烟尘排放速率的测定和分析用烟尘的收集.pdf
- 《GB/T 43905.1-2024焊接及相关工艺中烟尘和气体取样的实验室方法 第1部分:电弧焊中烟尘排放速率的测定和分析用烟尘的收集》.pdf
- 中国国家标准 GB/T 43905.1-2024焊接及相关工艺中烟尘和气体取样的实验室方法 第1部分:电弧焊中烟尘排放速率的测定和分析用烟尘的收集.pdf
- 中国国家标准 GB/T 18910.21-2024液晶显示器件 第2-1部分:无源矩阵单色液晶显示模块 空白详细规范.pdf
- GB/T 18910.21-2024液晶显示器件 第2-1部分:无源矩阵单色液晶显示模块 空白详细规范.pdf
- 《GB/T 18910.21-2024液晶显示器件 第2-1部分:无源矩阵单色液晶显示模块 空白详细规范》.pdf
- GB/T 43860.1220-2024触摸和交互显示 第12-20部分:触摸显示测试方法 多点触摸性能.pdf
- 中国国家标准 GB/T 43860.1220-2024触摸和交互显示 第12-20部分:触摸显示测试方法 多点触摸性能.pdf
1亿VIP精品文档
相关文档
最近下载
- 2023年第四届“红旗杯”班组长大赛考试题库附答案(含各题型).docx VIP
- 南宁网约车区域科目考试题库.pdf
- 2023年“红旗杯” 第四届全国机械行业班组长管理技能大赛考试题库.docx VIP
- 清华同方水源热泵中央空调.doc VIP
- 2024年高考语文一轮复习讲练测(新教材新高考)第03讲小说形象类题目(讲义)(原卷版+解析).docx VIP
- 守纪律讲规矩党课课件.pptx VIP
- SGHP清华同方水源热泵操作说明技术手册.pdf VIP
- 第三次全国土壤普查理论考试题 (含答案).docx VIP
- 安徽省近5年中考语文作文真题及模拟题汇编(含参考例文).docx VIP
- 通桥(2017)2101-Ⅰ时速160公里客货共线铁路预制后张法简支T梁(钢横梁人行道方案)32m.pdf
文档评论(0)