10二值因变量回归.pptx

  1. 1、本文档共57页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
二值因变量回归;概要;二值因变量回归: 有何不同?;例: 种族是否为房屋抵押贷款被拒的因素 The Boston Fed HMDA Dataset;二值因变量和线性概率模型 (Section 11.1);线性概率模型;线性概率模型;例: 线性概率模型, HMDA data 抵押贷款申请被拒绝(Mortgage denial)和还款收入比 (P/I ratio)的散点图;线性概率模型: 在整个 HMDA 数据中的应用;对于固定的P/I ratio,种族对被拒概率的效应是多少? 我们把一个代表种族的二值变量 black 加入回归模型 : 被拒概率的预测: 对于一个P/I ratio = 0.3的黑人申请者: 对于一个 P/I ratio = 0.3 的白人申请者: 被拒概率的差为0.177 ,也即是 17.7 个百分点; 在5% 的显著性水平下, black的系数是显著的; 如想得到全面的结论,还需要考虑其他的可能以漏掉的变量。 ;线性概率模型小结;Probit 和 Logit 回归(Section 11.2);Probit 回归用标准正态分布的累积分布函数 Φ(z)来建模 Y=1 的概率。 令z = β0 + β1X,那么Probit 回归模型的形式为 Pr(Y = 1|X) = Φ(β0 + β1X) 其中 Φ 为标准正态分布的分布函数,z = β0 + β1X 是probit模型的“z-value” or “z-index”. 例如: 假设 β0 = -2, β1= 3, X =0.4, 那么 Pr(Y = 1|X=.4) = Φ(-2 + 3×.4) = Φ(-0.8) ;Pr(z ≤ -0.8) = .2119; Probit 回归;STATA Example: HMDA data;STATA Example: HMDA data;多个自变量的Probit回归模型 ;STATA Example: HMDA data;STATA Example: Predicted probit probabilities;STATA Example, ctd.;Logit 回归 ;Logit 回归模型;STATA Example: HMDA data;在HMDA的例子中,probit 和 logit 模型的预测概率非常接近:;班级讨论实例: ;Hezbollah militants example;预测概率的变化: ;Logit 和Probit 模型的估计和推断(Section 11.3);用非线性最小二乘法估计Probit 模型;Probit模型中,参数的极大似然估计量;极端情况: 没有自变量X的probit MLE;(Y1,Y2)的联合分布: 由 Y1 和 Y2 的独立性可知, Pr(Y1 = y1,Y2 = y2) = Pr(Y1 = y1)× Pr(Y2 = y2) = = (Y1,..,Yn)的联合分布律为: Pr(Y1 = y1,Y2 = y2,…,Yn = yn) = = ;极大似然函数看作是未知参数p的函数: f(p;Y1,…,Yn) = 极大似然估计量(MLE)使得上面的函数取得最大值. 显然,对于对数似然函数 ln[f(p;Y1,…,Yn)]更适合计算 ln[f(p;Y1,…,Yn)] = 通过对p求一阶偏导后并令其等于零可得到极值点: 由上面的方程可知, 极大似然估计量 满足:; 即是 或者 换言之,p的MLE正好是样本均值。 ;没有“X”的极大似然估计 (Bernoulli distribution): ;根据极大似然估计的理论可知: 至少在大样本的情况之下, 是所有的可能的估计量中最有效的(结果强于Gauss-Markov理论)。因此极大似然估计是参数非线性模型的一类主要估计方法。 STATA note:由于是大样本情形,因此用的正态分布近似t-分布,同时使用 卡方 (= q×F)去替代F-分布。 ;单变量的 Probit 似然估计;Probit 似然估计: ; 和 的标准差可以自动得到; 假设检验和参数的区间估计跟以往的模型类似; 所有这些可以拓展到多个自变量的情形。 ;probit 和 logit 模型的唯一区别就是使用不同的概率分布函数,在Logit模型中使用的是 logistic分布的累计概率分布函数. 其他的估计步骤和

文档评论(0)

guanlirenli + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档