- 1、本文档共12页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
(8)
(8)
第1章 受限因变量模型
这一章讨论响应变量仅仅被部分观测到的情况。引入被部分观测到的潜在随机变量 y*, y*的实际
观测变量为yi。引入二元指示变量 Di,如果a< y*<bi,Di= 1 ;否则,Di = 0。即卩Di表示变量y*是否可 以被观测得到。(a, bi)称为观测区间。如果对于 Di = 1和Di = 0都有实际观测数据,当 Di = 1时,
潜在变量与实际观测变量相等,当 Di = 0时,实际观测变量同样有取值,但不等于潜在变量,这时称
数据被归并(cen sored),即小于ai的数据被归并为ai,而大于bi的数据被归并为bi。用数学符号表示
为:
ai,如果 y* ai
y y*,如果 ai y* b。
(1)
bi,如果 y* bi
如果只有当Di = 1时实际观测变量yi才有观测数据,即:当 Di = 1时,潜在变量与实际观测变量 相等,而当Di = 0时,yi没有观测值,这时称数据被截断(truncated),即小于ai的数据和大于ai的数 据被截断了。因此截断数据与归并数据的区别在于,对于观测区间外的数据,归并数据将将其都归并 为一点,而截断数据没有观测值。
将潜在随机变量y*的基本模型设定为:
TOC \o "1-5" \h \z y* i viO ( 2)
其中i为位置参数, 为刻度参数;Vi为独立于Xi的连续随机扰动项,均值为 0,方差为1,其分布函
*
数、密度函数分别为 F、f。在这些假定条件下,yi*的均值为i,方差为2,分布函数为F( ),
*
\o "Current Document" y + a b
概率密度函数为f( ——)/ (证明请参见附录 1)。ai < yi*< bi等价于ci」一L V 一L di,
那么yi*被观测到的概率为:
\o "Current Document" Pr(ai y* b) Pr(D 1) F(dJ F(cJ (3)
下面对截断数据模型和归并数据模型分别进行介绍
截断数据模型
如果样本数据是从总体的一部分抽取得到,我们把这类数据称为截断数据。比如,研究高收入阶 层(月收入x 10000)的消费与收入的关系,所采集的数据只是位于收入总体分布的一个区间里。假 设所有居民的收入服从正态分布,那么高收入阶层的收入只是在 x 10000的区间里观测得到的。下
面介绍截断数据的分布特征和模型估计。
截断数据的分布特征
如前面所述,截断数据只包括 Di = 1情况下的数据。截断分布是指变量高于(低于)某个设定值
的未截断部分的分布。如果变量只有在高于某一门限值 a时才被观测到(x > a),称之为从下面截断
(truncation from below )或者是从左边截断(truncation from left);如果变量只有在低于某一门限值 b 时才被观测到(x < b),称之为从上面截断(truncation from above )或者是从右边截断(truncation from right)。如图所示。
图一截断分布图(上面截断(左图)、下面截断(右图))
下面分析截断数据的分布函数、密度函数、均值和方差。
1.截断变量的分布函数和密度函数
给定模型(1)及相应的观测概率(2),那么第i个观测变量yi的条件分布函数为(证明请参见 附录2):
TOC \o "1-5" \h \z 0, 如果y* q
F (y, i)/ F q 丄中 *
Fy(yJ i 1 -,如果ai yi 3 (4)
F di F G
1, 如果y* bi
(注:此处及后面的 aj'b'Ci’di的定义均与前面相同)
密度函数为:
1 f (% J/ 如果 * -
-:,如果 ai yi bi
fy(yj F di F c, (5)
0, 其他
从截断数据的密度函数(4)式我们可以推出从下面截断或从上面截断的各种不同分布的变量的
密度函数。读者可以参阅下面介绍的几个例子。
例1 截断均匀分布的密度函数和分布函数
如果x*在区间[a, b]上服从均匀分布(uniform distribution ),那么
(6)
(6)
f(x)「V F(x)门(a x b),
如果在x*= C处截断,即实际观测值 x= x*,如果x* C; x= C,如果x*< Co
这是左截断的例子,即右截断点 =b。根据(5)式,在x = c处截断的随机变量x的截断分布的密
度函数为:
(7)f(x*) f(X*)
(7)
P(Di 1) F(b) F(c) 1 (c a) /(b a) b c
分布函数为:
F(x) F (c) (x a) /(b a) (c a)/(b a) x c F (x)
Pg 1) 1 (c a)/(b a) b c
例2 截断正态分布的密度函数
文档评论(0)