5多元回归中的假设检验和置信区间.ppt

下载文档 降价啦

146
0
约1.38万字
约 60页
2018-02-10 发布于河北
举报
版权申诉
保障服务

5多元回归中的假设检验和置信区间.ppt

1、本文档共60页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

关于拟合优度… 容易陷入最大化R2 和的陷阱，而偏离了真实的目的，从而得到班级规模效应的有偏估计高 R2 (或 ) 意味着回归变量解释了Y的变化高 R2 (或 ) 并非意味不存在遗漏变量偏差高 R2 (或 ) 并非意味得到一个因果效应的无偏估计量 (β1) 高 R2 (或 ) 并非意味加入的变量在统计学上显著——须使用相关假设检验予以判定 7-* 测试分数数据集分析 (教材 7.6节) 确定目标变量:STR 考虑遗漏变量偏差引起的遗漏因果效应即学生是否懂英语；是否有外部学习机会；家庭参与；教师质量（教师薪水是否与地区富裕程度相关）——有一个详细的列表! 7-* 首先尽可能把遗漏变量加入模型，如果实在不能的话，则，将这些与遗漏变量相关的变量作为控制变量放入回归模型。若条件均值独立假设成立合理，则控制变量是有效的。（一旦控制变量加入则u与STR不相关）。这是基础或基准模型的前提。许多遗漏因果变量很难度量，故需要找到控制变量。这些包括PctEL (既是控制变量又是遗漏因果变量) 以及地区富裕程度的度量。 7-* 设定一系列可行的备选模型，其中包含新增的备选变量。因为不确定哪个与收入相关的变量可以很好地控制许多的遗漏变量影响，诸如外部学习机会。因此可以采用不同收入变量的回归作为备选模型设定。被考虑的备选模型仅仅是一个开始，并非最终结论! 评估基础模型与备选模型 (“敏感性检验”) 7-* 测试分数与加利福利社会经济数据… 7-* 关于回归结果的报告许多回归需要出报告。以方程形式写出的回归不便于阅读，取而代之用列表的形式来报告。回归结果列表需要包括：被估计的回归系数标准误拟合优度观察数目如有，需要相关的F统计量其他相关信息下表中可以找到这些信息： 7-* 7-* 总结：多元回归多元回归是在保持其他涉及的变量不变的前提下，估计每一Xi 变化所引起的Y的变化效应若一个变量是可测的，则可通过将该变量加入回归模型中而避免遗漏变量偏差。若存在不可测的遗漏变量，仍可以通过加入控制变量以控制其产生的效应。没有简单的规则用来判定哪些变量应放入回归模型中——需要完善判断力。一个方法是设定基础模型——依赖于推理——之后考察备选模型设定中关键估计量的敏感性。 7-* * 同方差适用F统计量小结 ? 当增加这两个变量后,R2 增加到足够大—即增加这两个变量提升拟合度水平至足够大，则同方差适用F统计量拒绝原假设。若误差同方差，则同方差适用F统计量的大样本分布为 /q. 若误差异方差，则同方差适用F统计量的大样本分布并非 /q. 7-* F分布若4个多元回归的最小二乘假设成立并且： ui 同方差，即var(u|X1,…,Xk)不依赖于X’s u1,…,un 服从正态分布 ? 则同方差适用F统计量服从“Fq,n-k–1” 分布，其中 q =约束条件数且 k = 备择假设下的回归变量数（无约束回归模型的回归变量数） F统计量对于 /q 分布正如tn–1分布对于N(0,1)分布 7-* Fq,n–k–1 分布： F分布函数表很常见；当 n趋于 ∞时, Fq,n-k–1 分布收敛于 /q 分布 Fq,∞ 与 /q 分布一样若 q 并非很大，但 n≥100, 则 Fq,n–k–1 分布与 /q 分布本质上一样许多回归工具软件包（包括STATA）用F分布计算F统计量的p值在很多实证研究中，都会用到F分布 7-* 7-* 总结：同方差适用F统计量以及F分布仅在严格条件下（客观实际情况一般很难满足），这些结论才是合理的一般情况下，应使用稳健异方差F统计量 /q（即Fq,∞）的临界值当n ≥ 100, F分布本质上即是 /q 分布当n较小时, 有时研究人员使用F分布是因为其有较大的临界值，从而更加稳健。 7-* 总结：联合假设检验若其中任一t统计量的临界值超过了1.96，则“一次一个”方法的拒绝率平大于原假设下要求的5%显著水平(该水平超过了期望的显著水平) 对STATA而言，异方差稳健F统计量是内置的（“检验”命令）；一次性检验所有q个约束条件当 n 较大时, F统计量服从 /q (= Fq,∞)分布历史上看，同方差适用F统计量很重要（因而实践中也适用），有助于判断，但若存在异方差，则失效 7-* 涉及多个系数的单个约束检验 (教材 7.3节) Yi = β0 + β1X1i + β2X2i + ui, i = 1,…,n 考虑原假设与备择假设， H0: β1 = β2 备择 H1: β1 ≠