多元统计分析多元统计分析 (38).ppt

多元统计分析多元统计分析 (38).ppt

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
应用多元统计分析 第七章、主成分分析第1讲、主成分的定义 多变量分析(Multivariate Analysis)是处理多变量(多指标)的统计问题。 多个变量之间常存在相关性,人们希望用较少不相关的变量来代替原来较多且相关的变量。 主成分就是要从原变量的各种线性组合中找出能集中反映原变量信息的综合变量。 主成分分析是将多个指标化为少数几个综合指标的一种统计分析方法. 设X=(X1,…,Xp)′是p维随机向量,均值向量E(X)=μ,协差阵D(X)=Σ.考虑它的线性变换:易见:(7.1.2)(7.1.1) 假如我们希望用Z1来代替原来的p个变量X1,…,Xp ,这就要求Z1尽可能多地反映原来p个变量的信息,这里所说的“信息”用什么来表达呢?最经典的方法是用Z1的方差来表达. Var(Z1)越大,表示Z1包含的信息越多.由(7.1.2)式看出,对a1必须有某种限制,否则可使Var(Z1)→∞.常用的限制是:a1'a1 =1. 若存在满足以上约束的a1,使Var(Z1)达最大, Z1就称为第一主成分(或主分量). 如果第一主成分不足以代表原来p个变量的绝大部分信息.考虑X的第二个线性组合Z2 . 为了有效地代表原变量组的信息,Z1已体现(反映)的信息不希望在Z2中出现,用统计术语来讲,就是要求 Cov(Z2,Z1)=a2'Σa1=0. (7.1.3)于是求Z2时,就是在约束a2'a2=1和(7.1.3)下,求a2使Var(Z2)达最大,所求之Z2称为第二主成分,类似地可求得第三主成分,第四主成分,….,第p主成分 . 换言之,若原数据有p个变量,则恰好可得到p个主成分: 1. 每个主成分都是原变量的线性组合; 2. 不同主成分间互不相关(互相正交); 3. 主成分以其方差减少次序排列: 第一主成分具有最大方差, 第二主成分是与第一主成分正交的原变量的线性组合中具有最大方差者, 其余主成分都有类似的性质. 或者说,若原变量包含有一定的信息,则全体主成分包含与原变量相同的信息. 方差反映了变量取值的离散程度,方差大小表示了变量包含信息的多少. 第一主成分包含了尽可能多的信息, 不同的主成分包含的信息互不重复; 第二主成分包含除第一主成分外剩余信息中尽可能多的信息; 其余主成分都有类似的性质. 定义7.1.1 设X=(X1,…,Xp)′为p维随机向量.称 Zi=ai'X 为X的第i 主成分(i=1,2,…,p),如果: ① ai'ai=1 (i=1,2,…,p); ② 当i >1时 ai'Σaj=0 ( j=1,…,i-1); ③ Var(Zi)= Max Var(α'X). α'α=1,α'Σaj =0(j=1,…,i-1)  从代数学观点看主成分就是p个变量的一些特殊的线性组合,而从几何上看这些线性组合正是把X1,…,Xp构成的坐标系旋转产生的新坐标系,新坐标轴使之通过样本变差最大的方向(或者说具有最大的样本方差). 设有n个观测,每个观测有p个变量X1,…,Xp , 它们的综合指标(主成分)记为Z1,…,Zp . 当p=2时原变量为X1, X2.设(X1, X2 )服从二元正态分布,则样品点X(i) =(xi1, xi2 ) (i=1,2,…n)的散布图(见下面图形)在一个椭园内分布着. 10 Z1Z2 若取椭园的长轴为坐标轴Z1,椭园的短轴为Z2,这相当于在平面上作一个坐标变换,即按逆时针方向旋转一个角度θ, 根据旋转变换公式,新老坐标之间有关系: Z1=Cosθ X1+ Sinθ X2 Z2= -Sinθ X1+ Cosθ X2Z1 Z2 是原变量X1和X2 的特殊线性组合. 一般情况,p个变量组成p维空间,n个样品点就是p维空间的n个点.对于p元正态分布变量来说,找主成分的问题就是找p维空间中椭球的主轴问题.

文档评论(0)

职教中心 + 关注
实名认证
内容提供者

学高为师,身正为范!

认证主体余**

1亿VIP精品文档免费下

相关文档

相关课程推荐