- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
应用多元统计分析 第七章、主成分分析第5讲、主成分分析的应用
设n次观测数据阵X已标准化,这时样本协方差阵就是样本相关阵R, R的特征值为λ1≥λ2 ≥ …≥λp 相应的标准化特征向量为a1,a2, …,ap 。样本主成分为 Zi=ai'X (i=1,…,p). 设m为满足累计贡献率>P0(一般取1≥P0≥0.7 )的最小正整数,取前m个主成分Z1 ,Z2 ,… ,Zm,由样本观测数据X(i) (i=1,2,…n)可求得m个主成分的得分值zij :
利用样本主成分的性质(3),Xk由前m个主成分Z1 ,Z2 ,… ,Zm的最佳(残差平方和最小)表示式为把Z(i )(i=1,2,…,n)代入上式,可得
由此可得出由主成分得分值估计变量Xk的得分向量.记其中(7.3.2)
当选取合适的m,可使得后面的p-m个?i的和很小,这时就有其中可以证明
一、指标分类(变量分类) 如果第i个变量和第j个变量的相关系数rij≈1,显然这两个变量应归为一 类. 仍用Xi和Xj表示这两个变量的n次观测向量.考虑n维空间中这两点的距离:因 (n-1)R=X 'X=(X1,…, Xp ) '(X1,…, Xp ), 故有 Xi 'Xj =(n-1) rij (i,j=1,…,p)
zi 'zi=(n-1) λi (i=1,2,…,p) zi'zj=0 (当i≠j 时 )
因第k个主成分Zk与原标准化变量Xi的相关系数为?ik也称为第k个主成分Zk对Xi的因子负荷量. 这时 2(1- rij)≈(?i1-?j1)2+…+ (?im-?jm)2 ,若rij≈1, 则有 (?i1-?j1)2+…+ (?im-?jm)2 ≈ 0 .
考察m维空间的p个点Qi,其坐标为 Qi=(?i1 ,?i2 ,...,?im ) (i=1,2,…,p) .按距离最近准则对p个点进行分类. 当m=2时,p个点可在平面上点出来,利用散布图可直观地给出指标的分类.
二、样品分类 对p个变量(指标)观测n次,得n个样品,记 X(i) =(xi1, xi2 ,…, xip)′为第i个样品,看成p维空间的点,可按距离相近的程度进行分类(参见第六章聚类分析),即若‖ X(i) - X(j)‖≈0,就把第i个样品和第j个样品归为一类.。 因原始数据阵X≈X*,故 ‖ X(i) - X(j)‖≈ ‖ X*(i) - X*(j)‖由(7.3.1)及(7.3.2)式中x*ik的定义知
因‖X*(i)-X*(j)‖2=‖a1(zi1- zj1)+…+am(zim- zjm )‖2 =(zi1- zj1)2 +…+(zim- zjm ) 2 注意:a1, a2,…, am,为单位正交向量.
这样就把考察二个p维空间点的靠近程度转化为考察两个m(m<p)维空间点的靠近程度. 若取m=2,n个样品点可在平面上点出,利用点的分布规律对样品进行分类.三、样品排序或系统评估 对多指标系统进行排序评估的主要方法是加权评估法.比如专家评估方法,综合评分法,层次分析法等.随着多元统计方法的普及与应用,主成分分析方法也成为构造系统排序评估指数的常用方法之一. 设Z1是标准化随机向量X=(X1,…,Xp)′的第一主成分.由主成分的性质可知,Z1与原始标准化变量X1,X2,…,Xp的综合相关程度最强,
即ρ2(Z1,X1)+…+ρ2(Z1,Xp)= λ1达最大,其中λ1为X的相关阵R的最大特征值.如果只选一个综合变量来代表原来所有的原始变量,最佳的选择就是Z1 . 另方面,由于第一主成分Z1对应于数据变异最大的方向,这说明Z1是使数据信息损失最小,精度最高的一维综合变量,因此它可用于构造系统排序评估指数.
小结主成分分析的应用:1、变量的分类2、样品的分类3、样品的排序和评估
您可能关注的文档
- 多元统计分析多元统计分析 (41).ppt
- 多元统计分析多元统计分析 (43).ppt
- 多元统计分析多元统计分析 (44).ppt
- 多元统计分析多元统计分析 (45).ppt
- 多元统计分析多元统计分析 (46).ppt
- 多元统计分析多元统计分析 (47).ppt
- 多元统计分析多元统计分析 (48).ppt
- 复变函数与积分变换 (1).ppt
- 复变函数与积分变换 (2).ppt
- 复变函数与积分变换 (3).ppt
- 中医治疗“肺心病”医案25例.doc
- 中医治疗“泄泻”医案100例.doc
- 5月2日 七年级语文下册“五一”假期基础知识组合练(部编版)(含答案析).docx
- 5卷-七年级语文下学期开学收心检测卷(部编版)(含答案析).docx
- 5月4日 七年级语文下册“五一”假期基础知识组合练(部编版)(原卷版).docx
- 5《国行公祭+为佑世界和平》——课中随堂填-初中语文部编版八年级上册课前课中课后同步试题精编.docx
- 5质量守恒定律应用(7个考点)中考科学二轮、三轮专题集训.docx
- 5卷-七年级语文下学期开学收心检测卷(部编版)(原卷版).docx
- 5专题五(福建中考物理大二轮复习(讲义+练习):专题突破全辑).docx
- 5、微专题:三角函数线的妙用-讲义-高中数学沪教版必修第二册.docx
文档评论(0)