统计抽样的基本概念与方法.pptx

  1. 1、本文档共52页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
本资料来源;统计抽样主要研究什么内容,解决什么问题? 统计抽样主要有哪几种方法? 如何确定样本容量?;7.1 统计抽样基本概念; 在抽样之前,应将总体划分为抽样单位。抽样单位既可以是一个简单的个体,也可以是一组个体。 对某一个特殊研究,抽样单位的名册称为抽样框。;调 查 方 法;调 查 误 差; 从一个容量为N的有限总体中抽取得到一个容量为n的简单随机样本,使每一个容量为n的可能样本,都有相同的概率被抽中。;总体均值 总体比率 样本容量的确定; 如果选择大样??(n≥30),则中心极限定理可以保证 的抽样分布近似服从正态概率分布,μ的区间估计为 式中, 为均值的标准差。 1-α称为置信度, 为与之对应的临界值。例如,若置信度为95%,则 。; 当从一个容量为N的有限总体中,抽取一个容量为n的简单随机样本时,均值的标准差的估计值为 此时总体均值的区间估计为 在抽样调查中,当构造置信区间时,通常取μ=2。因此,在使用简单随机样本时,总体均值的近似95%的置信区间的表达式为:;[例7.1]《摄影》是一本推介摄影作品、报道摄影发展状况、介绍摄影器材的杂志,它目前拥有8000个订户。根据一个484个订户的简单随机样本,得出订户的年平均收入为30500元,标准差为7040元。因此,所有订户的年平均收入的无偏估计为     元。 因此,这本杂志订户的年平均收入的近似95%的置信区间为 即(29880,31120)。; 上述过程也可用于对诸如总体总量或总体比率等其他总体参数的区间估计。对点估计的抽样分布近似服从正态概率分布的所有情形,其近似95%的置信区间为 例如,在《摄影》的抽样调查中,点估计量的标准误差的估计值为     ,允许误差为2×310元=620元。; 总体比率p是总体中具有某些感兴趣特征的个体的比重。 [例7.2]在市场调查研究中,人们想了解喜欢某一品牌的消费者比重。样本比率 是总体比率的无偏点估计。总体比率的标准差的估计值为 因此, 总体比率的近似95%的置信区间的表达式如下: ; 例如,在大宇国际咨询公司的抽样调查中,大宇国际咨询公司也想估计在它服务范围内的500所学校中,使用天然气作为取暖燃料的学校比率。如果在抽出的50所学校中,有35所学校使用天然气作为取暖燃料,则总体500所学校中使用天然气比率的点估计值 。比率的标准差的估计值为 因此, 总体比率的近似95%置信区间为 即(0.5758,0.8242 )。;;两步抽样;[例7.3]某大学有5000名毕业生,我们想构造宽度在1000元之内的近似95%的置信区间。 对这样规定的置信区间,B=500。在确定n之前,需要估计 。 假设根据去年所做的同样研究,得知s=3000元。我们可以用这个值来估计 。根据B=500、 s=3000 及N=5000,则样本容量为; 在估计总体比率时,选择样本容量的公式,与估计总体均值的公式类似。我们只需要将估计总体均值的公式中 替换为 ,即 使用上式时,我们必须规定允许误差B和给出 的一个估计值。如果没有合适的估计值,我们可以使用 代替,这样将保证近似置信区间的允许误差比希望的要小的多。;将总体划分H组; 如果各层内的差异比层间的差异小,则分层简单随机样本可得到更大的精度(总体参数的区间估计将更窄)。 各层的划分应依据样本设计者的判断。 根据应用,总体可按部门、地区、年龄、产品类型、销售水平等分层。;[例7.4]某大学管理学院想对今年的毕业生进行一次调查,以便了解他们开始工作时的年薪。; 在分层抽样中,总体均值的无偏估计是各层样本均值的加权平均数,所用权数为总体在各层的比重。用 表示总体均值的点估计,其定义如下: 式中:H--层数; --第h层的样本均值; Nh--第h层的单位数;N--总体单位数; 对分层简单随机样本,计算平均值的标准差的估计公式为; 某大学管理学院的180名毕业生的样本调查结果 ; 各专业(层)的样本均值分别为: 因此,总体均值的点估计为; 抽样调查中估计均值的标准差所需要的部分计算结果 ; 上表中 因此, 总体的近似95%的置信区间为 即(29074,29626)。 ; 对分层简单随机抽样,总体比率p的无偏估计是各层比率的加权平均数,所用权数为总体在各层的比重。总体比率的点估计定义如下: 式中:H--层数; --第h层的样本比率; Nh―第h层的单位数;N―总体单位数;

文档评论(0)

文单招、专升本试卷定制 + 关注
官方认证
服务提供商

专注于研究生产单招、专升本试卷,可定制

版权声明书
用户编号:8005017062000015
认证主体莲池区远卓互联网技术工作室
IP属地河北
统一社会信用代码/组织机构代码
92130606MA0G1JGM00

1亿VIP精品文档

相关文档