2-1.1回归分析的基本思想及其初步应用(第2课时).doc

2-1.1回归分析的基本思想及其初步应用(第2课时).doc

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2-1.1回归分析的基本思想及其初步应用(第2课时)

1.1回归分析的基本思想及其初步应用(第二课时) 学习目标:1、会建立回归模型,进而学习相关指数(相关系数r 、总偏差平方和、随机误差的效应即残差、残差平方和、回归平方和、相关指数R2、残差分析) 2、会求上述的相关指数: 3、从实际问题发现已有知识不足,激发好奇心、求知欲。培养勇于求知的良好个性品质。 学习重点: 各相关系数、建立回归模型的步骤。 学习难点:相关指数的计算、残差分析。 学习过程: 一、引入:从P81例1提出的问题身高和体重的关系可用线性回归模型:y=bx+a+e (3)来表示,这里a和b为模型的未知参数,e是y与bx+a之间的误差,通常e为随机变量,称为随机误差 ,它的均值E(e)=0,方差D(e)=>0.这里y的值由x和随机误差e共同确定,即x只能解释部分y 的变化. 在统计中,称 x 为 解释变量, y 称为 预报变量. 二、探究新知: (一)基本原理:1.线性回归模型的完整表达式为 在线性回归模型(4)中,随机误差e的方差越小,用bx + a 预报真实值y的精度越高。随机误差是引起预报值与真实值y之间存在误差的原因之一,其大小取决于随机误差的方差。 另一方面,由于公式(1)(2)(课本P80)中为斜率和截距的估计值,它们与真实值班a和b之间也存在误差,这种误差是引起预报值与真实值y之间存在误差的另一原因。 2.思考:产生随机误差的原因是什么? 3.探究:在线性回归模型中,e是用bx+a预报真实值y的随机误差,它是一个不可观测的量,那么应该怎样研究随机误差呢? 在实际应用中,我们用回归方程中的估计_____________,由于随机误差, 所以是e的_____________。 对于样本点(x1,y1),(x2,y2),…,(xn,yn),而言, 它们的随机误差为:这个称为相应于点_________的残差。 4.回归效果的相关指数:(R2表示解释变量对预报变量变化的贡献率,且R2越大,意味着残差平方和越小,即模型的拟合效果越好,反之,模型的拟合效果越差,R2越接近1,表示回归效果越好,说明两变量的线性相关性越强。)对于线性回归模型,相关指数R2与相关系数r之间的关系为R2=r2。 (二)例题讲解: 在研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关,是否可以用线性回归模型来拟合数据。然后通过残差来判断模型拟合的效果,判断原始数据中是否存在可疑数据。 例1.(1)用例1的数据计算以上各相关指数R2= ________________________ (2)作出残差图并分析本例所选用的模型是否合适?(阅读课本P84表3-2以下的内容) 小结:1、用身高预报体重时,需要注意的问题:1、2、3、4、(课本P85~86页) 2 4 5 6 8 30 40 60 50 70 2、建立回归模型的基本步骤:1、2、3、4、5、(课本第86页) 例2 关于与有如右表数据: 为了对、两个变量进行统计分析,现有以下两种线性模型:,,试比较哪一个模型拟合的效果更好. 分析:既可分别求出两种模型下的总偏差平方和、残差平方和、回归平方和,也可分别求出两种模型下的相关指数,然后再进行比较,从而得出结论. (三)、课堂练习: (1).如果在散点图中所有的样本点都在一条直线上,那么解释变量和预报变量之间的相关系数是( ) A)—1 B)0 C)1 D)2 (2).总体偏差平方和为287,残差平方和120,那么解释变量对总效应约贡献了 。 (3).对于两线性相关变量,若算得相关系数r=-0.8,则其相关指数R2= 。 x 3 4 5 6 y 2.5 3 4 4.5 (4). 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据: 请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程; (2)试分析两个变量之间是否有线性相关关系?线性相关关系的情度如何? (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤。试根据②求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数据:3×2.5 + 4×3 + 5×4 + 6×4.5=66.5 ) (四)、小结:1。分清总偏差平方和、残差平方和、回归平方和,初步了解如何评价两个不同模型拟合效果的好坏. 2.两个变量相关系数的绝对值或相关指数R2越接近于1,两个变量的线性相关关系越强,它们的散点图越接近一条直线,这时用线性回归模型拟合这组数据就越好,此时建立的线性回归模型是有意义. (五)、作业:上述课堂练习的第4题及复习。 (六)、反思:

您可能关注的文档

文档评论(0)

cuotian + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档