probability课件.ppt

下载文档 降价啦

12
0
约8.49千字
约 58页
2017-05-30 发布于河南
举报
版权申诉
保障服务

probability课件.ppt

1、本文档共58页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

probability课件

对于x的同一个值，y的值是随机的是因为除了x会影响y之外，还有很多未知的因素在影响y，因此因变量y受到的影响分为两部分，一部分是由x引起的，另一部分是其它因素引起的。自变量x的影响可以用在给定x时y 的期望值E(y/x)=f(x)来刻画，随机因素的影响综合为一个随机变量e，回归模型表示为 y=f(x)+e，合理的假设是E(e)=0，Var(e)= 最简单的情况就是f(x)为线性函数时，即如果没有其它因素，y是x的线性函数时，回归方程为，称为简单线性回归模型。在实际问题中，会得到自变量的n个观察值，相应得到y的n个观察值。若观测是独立进行的，则有 yi=??0+??1xi+ei 其中ei，i=1,2,?,n 为随机误差，e1,e2,?,en相互独立，服从N(0, )分布。回归分析的主要任务是 1）对系数??0，??1做参数点估计 2）对误差的方差的估计 3）对参数做区间估计和假设检验。 4）对因变量做预测 1）参数估计用最小二乘法，让直线对于所有数据点上的偏差之和最小，即取使得最小的作为参数的估计值，令得其中可以证明方差最小的线性无偏估计，而且与极大似然估计量相同。 2）误差的方差估计是随机变量ei的估计量，称为残差（residual）残差平方和定义为可以证明为的无偏估计。越小，曲线拟合的越好。( ) 3）参数的区间估计和假设检验由以上的估计量，可以证明以下结论：与相互独立, 服从分布 ??1的1-??置信区间为若在95%的置信区间内，不含有0，说明恒大于零或恒小于零，这时x对y的有正效应或负效应。一般的假设检验的结论请同学们自己学习。这里介绍另一种检验方法。决定系数和F统计量对假设H： =0 的双边检验就是对模型有效性的检验。假设的含义是变量x对因变量 y没有影响。除了可以用t统计量的假设检验以外，还可以用决定系数和F统计量. 用“总平方和” 来从总体上度量的变化的大小。可以看到可以分为两部分的和：其中为当时回归函数在点的“预测值”。表示由自变量引起的因变量的变化。残差表示由随机误差引起的因变量的变化。由自变量引起的因变量的总变化可以用回归平方和由随机误差引起的因变量的总变化用残差平方和可以证明SST=SSR+SSE 可以证明可以看出E(SST)由两部分组成，其中为自变量的影响，为误差的影响。当因变量由自变量引起的变化占因变量的总变化量的主要部分时，可以认为模型是有效的。由此定义统计量 0≤ ≤1 称为“决定系数”(coefficient of determination)。当接近于1时，回归平方和占的比重大，说明由自变量引起的变化大，因此自变量的影响大，越接近于1，模型越有效，越接近于0，越无效。设统计量注意到当 =0时，F的值大致为1，当 ≠0 时，F的值倾向大于1，且越大，F越大。因此F可以作为假设H： =0 的检验统计量。可以证明SSR与S