10二值因变量回归.pptx

下载文档 降价啦

69
0
约2.23千字
约 57页
2018-02-10 发布于河北
举报
版权申诉
保障服务

10二值因变量回归.pptx

1、本文档共57页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

二值因变量回归;概要;二值因变量回归: 有何不同？;例: 种族是否为房屋抵押贷款被拒的因素The Boston Fed HMDA Dataset;二值因变量和线性概率模型 (Section 11.1);线性概率模型;线性概率模型;例: 线性概率模型, HMDA data抵押贷款申请被拒绝（Mortgage denial）和还款收入比 (P/I ratio)的散点图;线性概率模型: 在整个 HMDA 数据中的应用;对于固定的P/I ratio，种族对被拒概率的效应是多少? 我们把一个代表种族的二值变量 black 加入回归模型 : 被拒概率的预测: 对于一个P/I ratio = 0.3的黑人申请者: 对于一个 P/I ratio = 0.3 的白人申请者: 被拒概率的差为0.177 ，也即是 17.7 个百分点；在5% 的显著性水平下， black的系数是显著的；如想得到全面的结论，还需要考虑其他的可能以漏掉的变量。 ;线性概率模型小结;Probit 和 Logit 回归(Section 11.2);Probit 回归用标准正态分布的累积分布函数 Φ(z)来建模 Y=1 的概率。令z = β0 + β1X，那么Probit 回归模型的形式为 Pr(Y = 1|X) = Φ(β0 + β1X) 其中 Φ 为标准正态分布的分布函数，z = β0 + β1X 是probit模型的“z-value” or “z-index”. 例如: 假设 β0 = -2, β1= 3, X =0.4, 那么 Pr(Y = 1|X=.4) = Φ(-2 + 3×.4) = Φ(-0.8) ;Pr(z ≤ -0.8) = .2119;Probit 回归;STATA Example: HMDA data;STATA Example: HMDA data;多个自变量的Probit回归模型 ;STATA Example: HMDA data;STATA Example: Predicted probit probabilities;STATA Example, ctd.;Logit 回归 ;Logit 回归模型;STATA Example: HMDA data;在HMDA的例子中，probit 和 logit 模型的预测概率非常接近：;班级讨论实例: ;Hezbollah militants example;预测概率的变化: ;Logit 和Probit 模型的估计和推断(Section 11.3);用非线性最小二乘法估计Probit 模型;Probit模型中，参数的极大似然估计量;极端情况: 没有自变量X的probit MLE;(Y1,Y2)的联合分布: 由 Y1 和 Y2 的独立性可知, Pr(Y1 = y1,Y2 = y2) = Pr(Y1 = y1)× Pr(Y2 = y2) = = (Y1,..,Yn)的联合分布律为: Pr(Y1 = y1,Y2 = y2,…,Yn = yn) = = ;极大似然函数看作是未知参数p的函数: f(p;Y1,…,Yn) = 极大似然估计量（MLE）使得上面的函数取得最大值. 显然,对于对数似然函数 ln[f(p;Y1,…,Yn)]更适合计算 ln[f(p;Y1,…,Yn)] = 通过对p求一阶偏导后并令其等于零可得到极值点: 由上面的方程可知，极大似然估计量满足：; 即是或者换言之，p的MLE正好是样本均值。 ;没有“X”的极大似然估计 (Bernoulli distribution): ;根据极大似然估计的理论可知：至少在大样本的情况之下，是所有的可能的估计量中最有效的（结果强于Gauss-Markov理论）。因此极大似然估计是参数非线性模型的一类主要估计方法。 STATA note:由于是大样本情形，因此用的正态分布近似t-分布，同时使用卡方 (= q×F)去替代F-分布。 ;单变量的 Probit 似然估计;Probit 似然估计: ; 和的标准差可以自动得到；假设检验和参数的区间估计跟以往的模型类似；所有这些可以拓展到多个自变量的情形。 ;probit 和 logit 模型的唯一区别就是使用不同的概率分布函数，在Logit模型中使用的是 logistic分布的累计概率分布函数. 其他的估计步骤和