第二章 计量资料统计描述(集中离散)研究生.ppt

第二章 计量资料统计描述(集中离散)研究生.ppt

  1. 1、本文档共64页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二章 计量资料统计描述(集中离散)研究生

* 离均差与离均差和: 为了克服全距、四分位数间距的缺点,人们考虑到用每个变量值与均数之间的差别来反映离散的程度,所以提出了离均差的概念,其数学表达式为 离均差可正可负,但是数学上可以证明 离均差与离均差和 * 离均差平方和与离均差平方和的平均值: 为了避免离均差和等于0的情况,人们考虑将离均差取平方后求其和,于是有了离均差平方和,其数学表达式为 前者称为SS总体,后者称为SS样本;但是SS不但和变异大小有关,还和观察值的个数有关,SS随观察例数增多而增大。为了解决这个问题,人们又引入了离均差平方和的平均值,其数学表达式为 离均差平方和与均方 * 3 .1方差 离均差平方和的平均值(MS),又可称为方差variance 它是反映数据离散程度的最常用的指标 在计算方差过程中利用到每个变量值,所以它表达的离散趋势信息比极差、四分位数间距更精确 但是由于在计算方差时用到算术均数,所以方差也只能用于反映对称或近似对称分布资料的离散趋势 * 总体方差通常用希腊字母s2 (sigma)表示,记作: 但是在实际研究中,通常只观察来自总体中的一个样本,所以总体均数是未知的;此时用样本均数作为总体均数的估计值,相应的方差称为样本方差,其公式为: ? ? 式中的 n-1 又称为自由度 总体方差与样本方差 * 自由度degree of freedom, df:一组数据中可以自由取值的数据的个数 当样本数据的个数为 n 时,若样本均值?x 确定后,只有n-1个数据可以自由取值,其中必有一个数据则不能自由取值 例如,样本有3个数值,即x1=2,x2=4,x3=9,则 ?x = 5。当 ?x = 5 确定后,如果x1=6,x2=7,那么x3则必然取2,而不能取其他值 样本方差用自由度去除,其原因可从多方面解释,从实际应用角度看,在抽样估计中,当用样本方差S2去估计总体方差σ2时,它是σ2的无偏估计值 * 3.2标准差,standard deviation 因方差的度量单位是原度量单位的平方,故将方差开方,恢复成原度量单位,得总体标准差σ。 标准差大,表示观察值的变异度大; 标准差小,表示观察值的变异度小 。 * 样本标准差(s): * 标准差的计算 直接法 加权法 * 1985年通过十省调查得知,农村刚满周岁的女童体重均数为8.42kg,标准差为0.98kg;身高均数为72.4cm,标准差为3.0cm,试问身高与体重何者变异情况较大? 要反映变异程度本例题中宜采用标准差;从标准差的数值看来,身高变异程度大于体重 是否合理? 身高的单位是cm,而体重的单位是kg,能否认为3cm0.98kg? 变异度间的比较问题 * * 4.变异系数 变异系数coefficient of variation:标准差与其相应的均值之比 它反映数据相对离散程度,没有量纲 消除了数据水平高低和计量单位的影响,用于不同性质数据或均数相差较大时,离散程度的比较 * 某地7岁男孩身高的均数为123.10cm,标准差为4.71 cm;体重的均数为22.29kg,标准差为2.26kg。试比较身高、体重何者变异度大。 身高 体重 由此可见,7岁男孩体重的变异度大于身高的变异度或者说身高比体重稳定。 * 举例:试分析下组资料变异程度的变化趋势 附表 某地不同年龄儿童身高(cm)的变异度 分析: 1.儿童身高的标准差随着年龄的增大而增大。 2.但不同年龄儿童身高的均数相差较大,也在随着年龄的增大而增大。 3.从变异系数的角度,6岁以下儿童随年龄增加其身高的变异度逐渐减小。 * * 频数分布表、图 分组划计 原始资料 分布 类型 数值变量统计描述小结 算术均数与标准差 对数转换 几何均数与对数值 标准差的反对数 中位数与四分位数间距 不对称 对称 * 集中趋势 离散趋势 应用场合 算术均数 方差、标准差 适用于对称分布,特别是正态分布 几何均数 正偏态分布资料或对数正态分布资料 中位数 极差及 百分位数 四分位数间距 变异系数 适用于任何分布资料,特别是偏态分布、分布不明、分布末端无确定值 适用于均数相差悬殊或度量衡单位不同的资料 * * 表 90名某传染性疾病患者的潜伏期(天) 天数 12~ 24~ 36~ 48~ 60~ 72~ 84~ 96~ 108~ 人数 4 10 16 24 15 9 6 4 2

文档评论(0)

sandaolingcrh + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档