SPSS的单样本非参数检验问题.doc

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
SPSS的单样本非参数检验问题

SPSS的单样本非参数检验问题 徐京伟 (学号200900703030) 摘要:SPSS单样本非参数检验是对单个总体的分布形态等进行推断的方法,其中包括卡方检验、二项分布检验、K-S检验以及变量随机性检验等方法. 关键词:单样本;非参数;检验 1 卡方(Chi-square)检验 1.1 统计学上的定义和计算公式 定义:总体分布的卡方检验适用于配合度检验,是根据样本数据的实际频数推断总体分布与期望分布或理论分布是否有显著差异.它的零假设H0:样本来自的总体分布形态和期望分布或某一理论分布没有显著差异. 总体分布的卡方检验原理:如果从一个随机变量X中随机抽取若干个观察样本,这些观察样本落在X的k个互不相交的子集中的观察频数服从一个多项分布,这个多项分布当k处于无穷时,就近似服从X的总体分布. 因此,假设样本来自的总体服从某个期望分布或理论分布,同时获得样本数据各子集的实际观察频数,并依据下面的公式计算Q统计量,作出推断: Q= 其中Q表示观察频数,E表示期望频数或理论频数. 可见Q值越大,表示观察频数和理论频数越不接近;Q值越小,说明观察频数和理论频数越接近.SPSS将自动计算Q统计量,由于Q统计量服从k-1个自由度的分布,因此SPSS将根据分布表给出Q统计量所对应的相伴概率值. 如果相伴概率小于或等于用户的显著水平,则应拒绝零假设H0,认为样本来自的总体分布形态和期望分布或理论分布存在显著差异;如果相伴概率值大于显著水平,则不能拒绝零假设H0,认为样本来自的总体分布形态和期望分布或理论分布不存在显著差异. 因此,总体分布的卡方检验是一种吻合性检验,比较适用于一个因素的多项分类数据分析.总体分布的卡方检验的数据是实际收集到的样本数据,而非频数数据. 1.2 SPSS中实现过程 例题 某地一周内各日患忧郁症的人数分布如表7-1所示,请检验一周内各日人们忧郁数是否满足1:1:2:2:1:1:1. 表1 某地一周内各日患忧郁症的人数分布 周日 患者数 1 31 2 38 3 70 4 80 5 29 6 34 7 31 SPSS总体分布的卡方检验的基本操作步骤如下: 选择菜单: 【Analyze】【Nonparametric Tests】【Chi-Square】. 选定待检验的变量到【Test Variable List】框中. 在【Expected Range】框选项中确定参与分析的观测值范围,其中,【Get from data】表示所有观测数据都参与分析;【Use specified range】表示只有在该取值范围的观测数据才参与分析. 在【Expected Range】框中给出各个理论值.其中,【All categories equal】表示所有子集的聘书都相同,即期望分布为均匀分布;【Values】框后可依次输入值,并可按Add,Change,Remove按钮对这些值进行增加、修改和删除. 至此,SPSS将自动计算卡方统计量、概率P-值和其他相关结果,并显示在输出窗口中. 1.3 结果和讨论 本例输出结果中有两个表格,其中第一个表格如下. 表2 患忧郁症的人数卡方检验结果(一) 观测频数N 期望频数N 差值 1 31 33.7 -2.7 2 38 33.7 4.3 3 70 67.3 2.7 4 80 67.3 12.7 5 29 33.7 -4.7 6 34 33.7 -9.7 7 31 33.7 -2.7 Total 303 表2表明:303个观测数据中,某地一周内各日患忧郁症的人数分别为31,38,70,80,29,34,31;按照理论分布,某地一周内各日患忧郁症人数的期望频数为33.7,33.7,67.3,67.3,33.7,33.7,33.7;实际观测频数和期望频数的差分别为-2.7,4.3,2.7,12.7,-4.7,-9.7,-2.7. (2)输出的结果文件中第二个表格如下. 表3 患忧郁症的人数卡方检验结果(二) 周日 卡方统计量 6.891 方差 6 P-值 0.331 表3是计算的卡方统计量以及对应的概率P-值.如果显著性水平是0.05,由于概率p-值大于,表示实际分布与理论分布无显著差异,即一周内各日人们忧郁数满足1:1:2:2:1:1:1. 2 二项分布检验 2.1 统计学上的定义和计算公式 现实生活中有很多数据的取值只有两类,如医学中的生与死、患病的有与无、性别中的男性和女性、产品的合格与不合格等.从这种二分类总体中抽取的所有可能结果,要么是对立分类中的这一类,要么是另一类,其频数分布称为二项分布.调用SPSS中的二项分布检验(Binomial)可对样本资料进行二项分布分析. SPSS二项分布检验就是根据收集到的样本数据,推断总体分

文档评论(0)

zhuwenmeijiale + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:7065136142000003

1亿VIP精品文档

相关文档