《抽样技术》第三章分层随机抽样.ppt

  1. 1、本文档共45页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
《抽样技术》第三章-分层随机抽样 反映了S1,S2, ?,SL之间的差异程度。 若其值大,则Vprop比Vopt明显要大,采用按比例分配在精度上明显要比最优分配差,这时应尽量考虑使用最优分配;反之,若其值小,则说明Vprop与Vopt之间的差距不大,此时可以考虑采用按比例分配。 一般来说, 是未知的,而且需要在抽样之前进行估计,这样就很难给出它的一个较好估计,因此所计算出的最优分配只是近似的,有时甚至是很不准确的。按比例分配的优点是简便易行,便于在现场使用。因此即使增加10~20%的方差,那也是值得的。 反映了 之间的差异程度。 方差消除了: ⑴ 层间均值之间差异的结果; ⑵ 层间标准差之间差异的结果。 三、要求进行大于100%的抽样的分配 最优分配的三个条件: (1) n1+ n2+?+ nL = n; (2) n1, n2, ? , nL皆为自然数; (3) nh≤Nh,h=1, 2, ?, L。 例2 N1=5, N2=5, n =7 第一层:65, 65, 65, 65, 65; 第二层:4, 20, 45, 67, 112。 若n1N1,则最优的修正分配法是 这是假定h≥2时, ; 若又发生了 ,则我们就改变分配方案为 这是假定h≥3时, ; 我们可以继续这样做,直到每个 。这样最后所得的分配可以证明是当给定n以后所能希望得到的最优分配。 如使用修正后的最优分配 ,则 一般地,有 其中 表示对 的各层求和, 是修正后的这些层的总样本容量。 四、考虑费用时,样本容量的最优分配 假定费用函数具有形式 定理6 在具有(1)式线性费用函数的分层随机抽样中,在规定的费用C的条件下,如 则 达到最小值。 定理6导出下面的行动准则。若 ⑴ 这一层单元较多(Nh大); ⑵ 这一层内部变异程度较大(Sh大); ⑶ 这一层抽样比较省钱(ch小)。 则对这一层要抽取一个容量较大的样本。 当c1=?=cL=c时,C=c0+cn,这时定理6就退化为定理5。 《抽样技术》第三章-分层随机抽样 第三章 分层随机抽样 §3.1 概述 §3.2 估计量的性质 §3.3 样本容量在各层的最优分配 §3.4 样本容量的确定 §3.5 求比例的分层抽样 §3.1 概述 例3.1 假定对全市N=30000名高一学生作一次数学统考,有关人士欲采用抽样的方式对全市的平均考分有所了解。确定n=300。 设总体的均值为 ,方差为S2,抽取一个容量为n=300的简单随机样本,得样本均值 , 假设N1=3000,N2=7000,N3=20000,则 从各层中分别抽取样本容量为n1=30, n2=70, n3=200 的简单随机样本,其样本均值分别记为 ,令 则它是 的无偏估计。可计算出 由经验知,应有 ,故 定义 设总体包含N个单元,将总体分成互不重复的L个子总体,每一子总体称为一个层,L个层分别包含N1, ?, NL个单元,N1+?+NL = N。层被确定后,就从每一层抽一个样本,抽样是在各层独立地进行的。各层的样本容量分别用n1, ?, nL表示,n1+?+nL=n。这种抽样方法称为分层抽样或类型抽样或分类抽样。 如果从每层抽取一个简单随机样本,则称为分层随机抽样。 采用分层技术的主要理由 1.需要有总体的某些分类数据,且要具有规定的精确度。 2.为便于行政管理而要求分层。 3.总体的各个不同部分的抽样问题可能显著地不同,即采用各自不同的抽样方法。 4.分层可能提高整个总体指标估计值的精确度。它可以将一个内部差异很大的总体分成一些内部比较相似的子总体。 记号 下标h表示层号,i表示这一层内的单元号。 §3.2 估计量的性质 总体均值 可表示为 定理1 在分层随机抽样中 是总体均值 的无偏估计(st表示分层)。 证明 定理2 在分层随机抽样中,估计量 的方差是 证明 定理2的重要一点是 的方差只取决于各层的层内方差 ,而与层之间的差别无任何关系。层间的差异越大,分层抽样越有效。 推论1 若各层中的抽样比 是可忽略的,就有 推论2 采用按比例

文档评论(0)

blingjingya + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档