- 1、本文档共3页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2-1.1回归分析的基本思想及其初步应用(第2课时)
1.1回归分析的基本思想及其初步应用(第二课时)
学习目标:1、会建立回归模型,进而学习相关指数(相关系数r 、总偏差平方和、随机误差的效应即残差、残差平方和、回归平方和、相关指数R2、残差分析)
2、会求上述的相关指数:
3、从实际问题发现已有知识不足,激发好奇心、求知欲。培养勇于求知的良好个性品质。
学习重点: 各相关系数、建立回归模型的步骤。
学习难点:相关指数的计算、残差分析。
学习过程:
一、引入:从P81例1提出的问题身高和体重的关系可用线性回归模型:y=bx+a+e (3)来表示,这里a和b为模型的未知参数,e是y与bx+a之间的误差,通常e为随机变量,称为随机误差 ,它的均值E(e)=0,方差D(e)=>0.这里y的值由x和随机误差e共同确定,即x只能解释部分y 的变化. 在统计中,称 x 为 解释变量, y 称为 预报变量.
二、探究新知:
(一)基本原理:1.线性回归模型的完整表达式为
在线性回归模型(4)中,随机误差e的方差越小,用bx + a 预报真实值y的精度越高。随机误差是引起预报值与真实值y之间存在误差的原因之一,其大小取决于随机误差的方差。
另一方面,由于公式(1)(2)(课本P80)中为斜率和截距的估计值,它们与真实值班a和b之间也存在误差,这种误差是引起预报值与真实值y之间存在误差的另一原因。
2.思考:产生随机误差的原因是什么?
3.探究:在线性回归模型中,e是用bx+a预报真实值y的随机误差,它是一个不可观测的量,那么应该怎样研究随机误差呢?
在实际应用中,我们用回归方程中的估计_____________,由于随机误差,
所以是e的_____________。
对于样本点(x1,y1),(x2,y2),…,(xn,yn),而言,
它们的随机误差为:这个称为相应于点_________的残差。
4.回归效果的相关指数:(R2表示解释变量对预报变量变化的贡献率,且R2越大,意味着残差平方和越小,即模型的拟合效果越好,反之,模型的拟合效果越差,R2越接近1,表示回归效果越好,说明两变量的线性相关性越强。)对于线性回归模型,相关指数R2与相关系数r之间的关系为R2=r2。
(二)例题讲解:
在研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关,是否可以用线性回归模型来拟合数据。然后通过残差来判断模型拟合的效果,判断原始数据中是否存在可疑数据。
例1.(1)用例1的数据计算以上各相关指数R2= ________________________
(2)作出残差图并分析本例所选用的模型是否合适?(阅读课本P84表3-2以下的内容)
小结:1、用身高预报体重时,需要注意的问题:1、2、3、4、(课本P85~86页)
2 4 5 6 8 30 40 60 50 70 2、建立回归模型的基本步骤:1、2、3、4、5、(课本第86页)
例2 关于与有如右表数据:
为了对、两个变量进行统计分析,现有以下两种线性模型:,,试比较哪一个模型拟合的效果更好.
分析:既可分别求出两种模型下的总偏差平方和、残差平方和、回归平方和,也可分别求出两种模型下的相关指数,然后再进行比较,从而得出结论.
(三)、课堂练习:
(1).如果在散点图中所有的样本点都在一条直线上,那么解释变量和预报变量之间的相关系数是( )
A)—1 B)0 C)1 D)2
(2).总体偏差平方和为287,残差平方和120,那么解释变量对总效应约贡献了 。
(3).对于两线性相关变量,若算得相关系数r=-0.8,则其相关指数R2= 。
x 3 4 5 6 y 2.5 3 4 4.5 (4). 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:
请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程;
(2)试分析两个变量之间是否有线性相关关系?线性相关关系的情度如何?
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤。试根据②求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数据:3×2.5 + 4×3 + 5×4 + 6×4.5=66.5 )
(四)、小结:1。分清总偏差平方和、残差平方和、回归平方和,初步了解如何评价两个不同模型拟合效果的好坏.
2.两个变量相关系数的绝对值或相关指数R2越接近于1,两个变量的线性相关关系越强,它们的散点图越接近一条直线,这时用线性回归模型拟合这组数据就越好,此时建立的线性回归模型是有意义.
(五)、作业:上述课堂练习的第4题及复习。
(六)、反思:
您可能关注的文档
- (新课标大纲解读)重点难点核心考点全演练历史篇专题03古代中国主流思想的演变和科技文艺.doc
- (湘教版)必修一1.1《地球的宇宙环境》导学案(含答案).doc
- (考试必备)河南省辉县一中2011届高三12月份考试语文.doc
- (新人教高二化学选修4)2.3《化学平衡》课时同步训练.doc
- (理综)湛江二中09-10学年度高一下学期期末考试.doc
- (第5课时)§2.2频率分布直方图与折线图.doc
- (教)第2章标准展人体UV.doc
- (练习题)第一章社会工作的目标对象及领域.doc
- (试题)管理制度试题(变电运行人员)参考答案4.29.doc
- (药学)药物品不良反应的分类11.doc
- 2024年03月温州市瓯海区事业单位2024年公开招考62名工作人员笔试历年高频考点(难、易错点)附带答案详解.docx
- 2024年03月河北唐山市直属公立医院赴高校选聘113人笔试历年高频考点(难、易错点)附带答案详解.docx
- 2024年03月浙江开放大学招考聘用4人(2024年第二批)笔试历年高频考点(难、易错点)附带答案详解.docx
- 2024年03月浙江理工大学招考聘用5人(2024年第二批)笔试历年高频考点(难、易错点)附带答案详解.docx
- 2024年03月浙江省台州市路桥区事业单位2024年公开招考60名工作人员笔试历年高频考点(难、易错点)附带答案详解.docx
- 2024年03月福建省三明市市直事业单位2024年公开招考100名工作人员笔试历年高频考点(难、易错点)附带答案详解.docx
- 2024年03月黑龙江大庆市爱辉区面向师范类毕业生引进事业单位人才18人笔试历年高频考点(难、易错点)附带答案详解.docx
- 2024年03月温州市瓯海中心区建设中心2024年招考1名编外人员笔试历年高频考点(难、易错点)附带答案详解.docx
- 2024年03月贵州黔南州惠水县中医医院面向校园招考聘用笔试历年高频考点(难、易错点)附带答案详解.docx
- 2024年04月上海市体育运动学校招考聘用笔试历年高频考点(难、易错点)附带答案详解.docx
文档评论(0)