抽样技术(金勇进)PPT.ppt

  1. 1、本文档共33页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

1802年,拉普拉斯想要估计法国的人口数目。他获得了一个遍布全国范围的30commune的样本,截至1802年9月23日总共有2,037615居民。在包括1802年9月23日以前的三年中,215599个新生儿在30个commune。

拉普拉斯认为30个commune的每年注册的新生儿数为215599/3=71866.33.把2037615按照71866.33来分,拉普拉斯估计每年每28.35人里有一个注册新生儿。

具有众多人口的乡镇也就可能有同样众多的注册新生儿,通过用28.35乘以全法国年度新生儿总数来估计得出法国人口总数。

调查中都有辅助信息,抽样框也通常有每个单元额外的信息,这些信息能被用来提高我们的估计精度。;为什么要使用比率估计/回归估计;简单地想要估计一个比率:假定总体由面积不同农业用地构成,yi=i地谷物的产量,xi:i地的面积,B=每亩谷物的平均产量;想要估计一个总体总数,但总体大小N是未知的。但是我们知道,于是可以通过来估计N,由此我们可以使用不同于总数N的方法而是采用辅助变量来进行测量。

要估计渔网中长度长于12cm的鱼的总数,抽取一个鱼的随机样本,估计长度长于12cm的鱼所占的比例,用鱼的总数N乘以这个比例即可得到,但如果N未知不能使用。

能称量渔网中鱼的总重量。鱼的长度与其重量相关。

;调整来自样本的估计量以便它们反映人口统计学的总量。

在一所具有4000名学生的大学提取一个400个学生的简单随机样本,此样本可能包含240个女性,160个男性,且其中被抽中的84名女性和40名男性计划以教学为毕业后的职业。;比率估计量被用来对无回答进行调整

设抽取一个行业的样本:令yi为i行业花费在健康保险上的金额,xi为i行业的雇员数。假定对总体中的每个行业xi均已知。我们希望一个行业花费在健康保险上的金额与雇员数相关。某些行业在调查中可能涉及不到。估计保险费用的总花销时调整无回答的方法之一是用总体数X乘以比率;辅助指标x,其总体均值(总量)已知;【例4.1】对以下假设总体(N=6),用简单随机抽样抽取的样本,比较简单随机抽样比估计及简单估计的性质。;样本

;简单估计是无偏的,而比估计是有偏的。

简单估计量的方差远远大于比估计量的方差,比估计的偏差不大,其均方??差也比简单估计的小得多。

因此对这个总体,比估计比简单估计的效率高。;二、比率估计的性质;比率估计的近似方差;三、比率估计的效率;2.比率估计成为最优线性无偏估计的条件

(1).与的关系是过原点的直线

(2).对这条直线的方差与成比例。

则比率估计是最优线性无偏估计(BLUE)。;【例4.2】某县在对船舶调查月完成的货运量进行调查时,对运管部门登记的船舶台帐进行整理后获得注册船舶2860艘,载重吨位154626吨,从2860艘船舶中抽取了一个的简单随机样本,调查得到样本船舶调查月完成的货运量及其载重吨位如下表(单位:吨),要推算该县船舶调查月完成的货运量。;该县船舶在调查月完成货运量的比率估计为

用简单估计对货运量进行估计;四、分层随机抽样下的比率估计;分别比率估计量要求每一层的样本量都比较大,如果达不到这个要求,则它的偏倚可能比较大,这时使用联合比率估计量。combinedratioestimator;方差的比较;因为;总体回归系数;大样本条件下;?

当较大时,

适用场合?

;无偏;渐近无偏;其中;【例】某市对中央直属单位和市属单位专业技术人员总数进行了分层随机调查,已有98年各层人员总数,135个中央直属单位有75650专业技术人员,1228个市属单位有315612专业技术人员。分别在两层中调查了15、20家单位,调查数据如下,试估计99年全市专业技术人员总数。

;(1)按分别比率估计量估计

(2)按联合比率估计量估计

;(3)按分别回归估计量估计,用样本回归系数估计b

(2)按联合比率估计量估计

;七其他估计;大样本条件下

回归估计优于简单估计和比率估计;样本量小时,回归估计偏差大于比率估计;三种估计量之间的关系

文档评论(0)

yuguanyin2015 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档