SAS系统和数据分析符号检验和Wilcoxon符号秩检验.doc

SAS系统和数据分析符号检验和Wilcoxon符号秩检验.doc

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二十七课符号检验和Wilcoxon符号秩 检验 在统计推断和假设检验中,传统的检验统计量都叫做参数检验,因为它们都依赖于确定 的概率分布,这个分布带有一组自由的参数。参数检验被认为是依赖于分布假定的。通常情 况下,我们对数据进行分析时,总是假定误差项服从正态分布,这是人们易于接受的事实, 因为正态分布的原始出发点就是来自于误差分布,至于当样本相当大时,数据的正态近似, 这是由于大样本理论所保证的。但有些资料不一定满足上述要求,或不能测量具体数值,其 观察结果往往只有程度上的区别,如颜色的深浅、反应的强弱等,此时就不适用参数检验的 方法,而只能用非参数统计方法( non-parametric statistical analysis )来处理。这种方法对数据 来自的总体不作任何假设或仅作极少的假设,因此在实用中颇有价值,适用面很广。 一、 单样本的符号检验 符号检验(sign test)是一种最简单的非参数检验方法。它是根据正、负号的个数来假设 检验。首先需要将原始观察值按设定的规则,转换成正、负号,然后计数正、负号的个数作 出检验。该检验可用于样本中位数和总体中位数的比较,数据的升降趋势的检验,特别适用 于总体分布不服从正态分布或分布不明的配对资料, 有时当配对比较的结果只能定性的表示, 如试验前后比较结果为颜色从深变浅、程度从强变弱,成绩从一般变优秀,即不能获得具体 数字,也可用符号检验,例如用正号表示颜色从深变浅,用负号表示颜色从浅变深。 用于配对资料时,符号检验的计算步骤为:首先定义成对数据指定正号或负号的规则, 然后计数正号的个数 s •及负号的个数 s—,由于在具体比较配对资料时,可能存在配对资料 的前后没有变化,或等于假设中的中位数,此时仅需要将这些观察值从资料中剔除,当然样 本大小n也随之减少,故修正样本大小n = S S 一。当样本n较小时,应使用二项分布确切 概率计算法,当样本 n较大时,常利用二项分布的正态近似。 1.小样本时的二项分布概率计算 当n岂20时,S •或S 一的检验P值由精确计算尺度二项分布的卷积获得。 在比较配对资 料试验前后有否变化,或增加或减小的假设检验时,如果我们定义试验后比试验前增加为正 号,反之为负号,那么对于原假设:试验前后无变化来说, 正号的个数S •和负号的个数S 一可 能性应当相等,即正号出现的概率 p=0.5,于是S •与S一均服从二项分布 B(n,0.5),对于太 大的S木目应太小的S _,或者太大的S 一相应太小的S,都将拒绝接受原假设; 对于原假设: 试验后比试验前有增加来说,正号的个数 s •大于负号的个数的可能性应该大,即正号出 现的概率p 0.5,对于太小的S •相应太大的S —,将拒绝接受原假设;对于原假设:试验 后比试验前减小来说,正号的个数 s •小于等于负号的个数 S 一的可能性应该大,即正号出现 的概率p 0.5,对于太大的S •相应太小的S—,将拒绝接受原假设。 例27.1有一种提高学生某种素质的训练,有人说它是无效的,有人说它是有效的,那么 真实情况究竟应该是怎样的呢?随机地选取 15名学生作为试验样本,在训练开始前做了一次 测验,每个学生的素质按优、良、中、及格、差打分,经过三个月训练后,再做一次测试对 每个学生打分。数据如表 27.1所示。我们将素质提高用正号表示,反之用负号表示,没有变 化用0表示。显著性水平取 0.1。 表27.1 训练前后的素质比较 学生编号 训练之前 训练之后 差异符号 1 中 优 + 2 及格 良 + 3 良 中 一 4 差 中 + 5 良 良 0 6 中 优 + 7 差 及格 + 8 良 优 + 9 中 差 一 10 差 中 + 11 中 优 + 12 及格 良 + 13 中 及格 一 14 中 优 + 15 差 中 + 从表27.1中15名学生训练前后的差异分析可得出:有 14名学生有差异,其中 S =11, S—=3。1名学生无差异(学生编号为 5),应该从分析中去掉,所以 n =15-仁14。假设检验 为: H。: p乞0.5即训练之后学生素质没有提高。 H1 : p 0.5即训练之后学生素质有提高。 由于试验的结果只有两种可能,正号或负号,对每一个学生试验出现正号的假定概率为 p=0.5,负号为1- p=0.5,这样整个试验的概率是相同的,并且每一个试验是相互独立的。 因此在n =14次独立的试验中,正号出现的次数服从二项分布 B(14,0.5),如表27.2所示。 表27.2 二项分布的概率和累计概率 n=14,p=0.5 正号出现的次数 正号出现的概率 累计概率 0 0.0001 0.0001 1 0.0009 0.0009 2 0.0056 0.0065 3 0.0222 0.0287 4

文档评论(0)

kunpeng1241 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档