chapter受限因变量模型.docxVIP

  1. 1、本文档共12页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
(8) (8) 第1章 受限因变量模型 这一章讨论响应变量仅仅被部分观测到的情况。引入被部分观测到的潜在随机变量 y*, y*的实际 观测变量为yi。引入二元指示变量 Di,如果a< y*<bi,Di= 1 ;否则,Di = 0。即卩Di表示变量y*是否可 以被观测得到。(a, bi)称为观测区间。如果对于 Di = 1和Di = 0都有实际观测数据,当 Di = 1时, 潜在变量与实际观测变量相等,当 Di = 0时,实际观测变量同样有取值,但不等于潜在变量,这时称 数据被归并(cen sored),即小于ai的数据被归并为ai,而大于bi的数据被归并为bi。用数学符号表示 为: ai,如果 y* ai y y*,如果 ai y* b。 (1) bi,如果 y* bi 如果只有当Di = 1时实际观测变量yi才有观测数据,即:当 Di = 1时,潜在变量与实际观测变量 相等,而当Di = 0时,yi没有观测值,这时称数据被截断(truncated),即小于ai的数据和大于ai的数 据被截断了。因此截断数据与归并数据的区别在于,对于观测区间外的数据,归并数据将将其都归并 为一点,而截断数据没有观测值。 将潜在随机变量y*的基本模型设定为: TOC \o "1-5" \h \z y* i viO ( 2) 其中i为位置参数, 为刻度参数;Vi为独立于Xi的连续随机扰动项,均值为 0,方差为1,其分布函 * 数、密度函数分别为 F、f。在这些假定条件下,yi*的均值为i,方差为2,分布函数为F( ), * \o "Current Document" y + a b 概率密度函数为f( ——)/ (证明请参见附录 1)。ai < yi*< bi等价于ci」一L V 一L di, 那么yi*被观测到的概率为: \o "Current Document" Pr(ai y* b) Pr(D 1) F(dJ F(cJ (3) 下面对截断数据模型和归并数据模型分别进行介绍 截断数据模型 如果样本数据是从总体的一部分抽取得到,我们把这类数据称为截断数据。比如,研究高收入阶 层(月收入x 10000)的消费与收入的关系,所采集的数据只是位于收入总体分布的一个区间里。假 设所有居民的收入服从正态分布,那么高收入阶层的收入只是在 x 10000的区间里观测得到的。下 面介绍截断数据的分布特征和模型估计。 截断数据的分布特征 如前面所述,截断数据只包括 Di = 1情况下的数据。截断分布是指变量高于(低于)某个设定值 的未截断部分的分布。如果变量只有在高于某一门限值 a时才被观测到(x > a),称之为从下面截断 (truncation from below )或者是从左边截断(truncation from left);如果变量只有在低于某一门限值 b 时才被观测到(x < b),称之为从上面截断(truncation from above )或者是从右边截断(truncation from right)。如图所示。 图一截断分布图(上面截断(左图)、下面截断(右图)) 下面分析截断数据的分布函数、密度函数、均值和方差。 1.截断变量的分布函数和密度函数 给定模型(1)及相应的观测概率(2),那么第i个观测变量yi的条件分布函数为(证明请参见 附录2): TOC \o "1-5" \h \z 0, 如果y* q F (y, i)/ F q 丄中 * Fy(yJ i 1 -,如果ai yi 3 (4) F di F G 1, 如果y* bi (注:此处及后面的 aj'b'Ci’di的定义均与前面相同) 密度函数为: 1 f (% J/ 如果 * - -:,如果 ai yi bi fy(yj F di F c, (5) 0, 其他 从截断数据的密度函数(4)式我们可以推出从下面截断或从上面截断的各种不同分布的变量的 密度函数。读者可以参阅下面介绍的几个例子。 例1 截断均匀分布的密度函数和分布函数 如果x*在区间[a, b]上服从均匀分布(uniform distribution ),那么 (6) (6) f(x)「V F(x)门(a x b), 如果在x*= C处截断,即实际观测值 x= x*,如果x* C; x= C,如果x*< Co 这是左截断的例子,即右截断点 =b。根据(5)式,在x = c处截断的随机变量x的截断分布的密 度函数为: (7)f(x*) f(X*) (7) P(Di 1) F(b) F(c) 1 (c a) /(b a) b c 分布函数为: F(x) F (c) (x a) /(b a) (c a)/(b a) x c F (x) Pg 1) 1 (c a)/(b a) b c 例2 截断正态分布的密度函数

文档评论(0)

乐乐 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档