第24讲协方差和相关系数.ppt

  1. 1、本文档共28页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
前面我们介绍了随机变量的数学期望和方差,对于多维随机变量,反映分量之间关系的数字特征中,最重要的,就是本讲要讨论的 协方差和相关系数 任意两个随机变量X和Y的协方差,记为Cov(X,Y), 定义为 ⑶ Cov(X1+X2,Y)= Cov(X1,Y) + Cov(X2,Y) ⑴ Cov(X,Y)= Cov(Y,X) 一、协方差 2.简单性质 ⑵ Cov(aX,bY) = ab Cov(X,Y) a,b是常数 Cov(X,Y)=E{[ X-E(X)][Y-E(Y) ]} 1.定义 Cov(X,Y)=E(XY) -E(X)E(Y) 可见,若X与Y独立, Cov(X,Y)= 0 . 3. 计算协方差的一个简单公式 由协方差的定义及期望的性质,可得 Cov(X,Y)=E{[ X-E(X)][Y-E(Y) ]} =E(XY)-E(X)E(Y)-E(Y)E(X)+E(X)E(Y) =E(XY)-E(X)E(Y) 即 若X1,X2, …,Xn两两独立,,上式化为 D(X+Y)= D(X)+D(Y)+ 2Cov(X,Y) 4. 随机变量和的方差与协方差的关系 协方差的大小在一定程度上反映了X和Y相互间的关系,但它还受X与Y本身度量单位的影响. 例如: Cov(kX, kY)=k2Cov(X,Y) 为了克服这一缺点,对协方差进行标准化,这就引入了相关系数 . 二、相关系数 为随机变量X和Y的相关系数 . 定义: 设D(X)>0, D(Y)>0, 称 在不致引起混淆时,记 为 . 相关系数的性质: 证: 由方差的性质和协方差的定义知, 对任意实数b,有 0≤D(Y-bX)= b2D(X)+D(Y)-2b Cov(X,Y ) 令 ,则上式为 D(Y- bX)= 由于方差D(Y)是正的,故必有 1- ≥ 0,所以 | |≤1。 2. X和Y独立时, =0,但其逆不真. 由于当X和Y独立时,Cov(X,Y)= 0. 故 = 0 但由 并不一定能推出X和Y 独立. 请看下例. 例1 设X服从(-1/2, 1/2)内的均匀分布,而 Y=cos X, (请课下自行验证) 因而 =0, 即X和Y不相关 . 但Y与X有严格的函数关系, 即X和Y不独立 . 不难求得, Cov(X,Y)=0, 存在常数a,b(b≠0), 使P{Y=a+bX}=1, (详细证明自看,见教材 .) 即X和Y以概率1线性相关. 考虑以X的线性函数a+bX来近似表示Y, 以均方误差 e =E{[Y-(a+bX)]2} 来衡量以a+bX近似表示Y的好坏程度, e值越小表示 a+bX与Y的近似程度越好. 用微积分中求极值的方法,求出使e 达到最小时的a,b . 相关系数刻划了X和Y间“线性相关”的程度. =E(Y2)+b2E(X2)+a2- 2bE(XY)+2abE(X) - 2aE(Y) e =E{[Y-(a+bX)]2 } 解得 这样求出的最佳逼近为 L(X)=a0+b0X 这样求出的最佳逼近为L(X)=a0+b0X 这一逼近的剩余是 若 =0, Y与X无线性关系; Y与X有严格线性关系; 若 可见, 若0<| |<1, | |的值越接近于1, Y与X的线性相关程度越高; | |的值越接近于0, Y与X的线性相关程度越弱. E[(Y-L(X))2]= D(Y)(1- ) 请看演示 相关系数的直观意义 稍事休息 但对下述情形,独立与不相关等价 若(X,Y)服从二维正态分布,则 X与Y独立 X与Y不相关 前面,我们已经看到: 若X与Y独立,则X与Y不相关, 但由X与Y不相关,不一定能推出X与Y独立. 矩、协方差矩阵 在数学期望一讲中,我们已经介绍了矩和中心矩的概念. 这里再给出混合矩、混合中心矩的概念. 协方差Cov(X,Y)是X和Y的 二阶混合中心矩. 称它为X和Y的k+L阶混合(原点)矩. 若 存在, 称它为X和Y的k+L阶混合中心矩. 设X和Y是随机变量,若 k,L=1,2,… 存在, 可见, 协方差矩阵的定义 将二维随机变量(X1,X2)的四个二阶中心矩 排成矩阵的形式: 称此矩阵为(X1,X2)的协方差矩阵. 这是一个 对称矩阵

您可能关注的文档

文档评论(0)

js1180 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档