《管理统计学》马庆国著_课件7[精选].ppt

  1. 1、本文档共41页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
《管理统计学》马庆国著_课件7[精选]

例:人均收入 X 与人均食品消费支出 Y 的散点图的关系如图。 三、逐步回归 回归系数的 F 检验 检验回归系数 ?j 是否显著性异于 0 , 除了 T 检验外, 还有针对回归系数 (而不是针对总体回归效果)的F检验. 假设Ho: ?j = 0; 备择假设H1: ?j ? 0 (即 Ho 不成立). 可以证明, 服从 ?2(1) 分布, 且与 (也服 从 ?2 (n-k)分布)相互独立. 若再记: , 则有 Fj = (n-k)Vj / Q 服从F ( 1, n-k) 分布. 把 Fj 的显著性概率 p 与置信度水平 ? 比较, 就可以判断一个变量 xj 是否应当成为自变量: P 0.05 , 接受Ho , ?j与 0 没有显著性差异, xj不应成自变量. P ? 0.05 , 拒绝Ho , ?j与 0 有显著性差异, xj 应成自变量. 2. 偏解释变差 (偏回归平方和) 在一个回归方程中, 当把 xj 从自变量的队伍中删除以后, 我们可以得到一组新的回归系数的估计值: 从而得到 Y 的新的计算值: 注意: 下标不包含 j . 如果用小写的 y , x 表示中心化的数据, 就有 这时||? *||2是新的(在自变量中不含xj的)已解释变差( 新的回归平方和 ). 可以肯定地说, 在自变量中删除一个变量之后, 已解释变差只可能变小(在被删除的解释变量多少有一点解释作用的情况下, 已解释变差变小), 或者已解释变差不变(在被删除的解释变量没有一点解释作用的情况下, 已解释变差不变), 即||? ||2 ? ||? *||2. 于是, ||? ||2 - ||? *||2 就是 xj 对已解释变差 (回归平方和) 的贡献, 因此, 称 ||? ||2 - ||? *||2 为 xj的偏解释变差(偏回归平方和). 可以证明, , 也就是说, Vj就是 xj 的偏解释变差(偏回归平方和). 从残差 (或未解释变差的)角度来考虑: 在自变量中删除一个变量之后, 未解释变差只可能变大 ( 或者不变 ). 若记, ||e*||2是从自变量中删除变量 xj 之后的未解释变差,那么就有 ||e||2 ? ||e*||2. 可以证明, ||e*||2 - ||e||2 =Vj . 而 也就是说, 在删除变量 xj 之后的未解释变差的增加量, 刚好等于已解释变差的减少量, 刚好等于 xj 的偏解 释变差 ( 偏回归平方和 ). 以上数量关系的几何解释如下: y 偏解释变差的几何解释 从图中, 显示 x2 是从自变量中删除的变量, ? 是中心化数据 y 对所有自变量 (x2, ···, xk )回归的已解释变差(回归平方和),由勾股定理, 得||? ||2 - ||? *||2 = ||e(2) ||2 。 ||e(2) ||2 就是已解释变差的减少部分, 也就是变量 x2 的偏解释变差V2. x2 x3, ···, xk e* e(2) ? e 第十章 线性回归分析 变量之间的关系有两种: 确定型的函数关系 不确定型的函数关系 这里主要研究不确定型的函数关系,如收入与受教育程度之间的关系,等等问题。 但它们之间存在明显的相互关系(称为相关关系),又是不确定的。 回归分析是研究随机变量之间相关关系的统计方法。其研究一个被解释变量(因变量)与一个或多个解释变量(自变量)之间的统计关系。 1.一元线性回归是研究一个自变量与一个因变量的统计关系。 一. 一元线性回归 人均收入X 人均食品支出 Y 这两个变量之间的不确定关系,可以用下式表示: 式中,人均食品消费支出Y 是被解释变量, 人均收入 X 是解释变量,?1, ?2是待估计参数;u 是随机干扰项, 且与 X 无关, 它反映了 Y 被 X 解释的不确定性。 如果随机干扰项 u 的均值为 0, 对上式求条件均值,有 反映出从“平均”角度看,是确定性关系。 例:地区的多孩率与人均国民收入的散点图如下: 人均收入X 多孩率 Y 这两个变量之间的不确定关系,大致可以用下式表示: 设 Z =Ln X ,可将上式线性关系为: 线性回归的任务:就是用恰当的方法,估计出参数 ?1, ?2 ,并且使估计出来的参数具有良好的统计特征,所以,回归问题从某种视角看,视同参数估计问题。 如果把X,Y的样本观测值代到线性回归方程中,就得到 i =1,2, …,n, n为样本容量. 从重复抽样的角度看, Xi,Y

文档评论(0)

jsntrgzxy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档