部分协变量缺失下的线性回归分析和应用.doc

部分协变量缺失下的线性回归分析和应用.doc

  1. 1、本文档共35页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
. PAGE . . . . . . . 毕业论文 题 目 部分协变量缺失下的线性回归分析及其应用 学 院 基础科学学院 专业班级 110802 学 号姓 名 吴佳桐 指导教师 袁晓惠 二〇一五年六月四日 . . . 中 文 摘 要 在目前的各个领域的研究调查中,由于受到各种已知或者未知因素的影响,经常会导致缺失数据出现的情况。而由于缺失数据的存在,不但会增加研究者分析数据的难度,而且会造成分析结果的偏差,从而降低研究者统计计算工作的效率。因此考虑如何消除或者尽可能的减少这些缺失数据的影响就变的越来越重要了。文章首先介绍了回归模型及其基本概念并介绍了使用方法;然后介绍了国内外对缺失数据的研究现状,并简单介绍了数据缺失机制的三种形式,指出解决数据缺失的一般性方法。并在接下来的文章中介绍了在协变量缺失下的线性回归模型,最后是利用R程序对数据进行实证分析。为了有效地解决缺失数据带来的问题,本文使用了其中三种方法对缺失数据集做了相应的处理。首先使用的是剔除法即将含有缺失数据列直接删除;第二种方法是对数据集做逆概率加权;第三种方法是使用回归补值法,对缺失数据集进行填补,从而形成一个完整的数据集,然后对填补后的数据集进行相应的统计分析。 本文研究的重点是部分析变量缺失下的回归分析,对不同的样本量做数值模拟,研究在两种缺失程度的数据(15%、30%的随机缺失)通过对比,针对本文的数据研究发现逆概率加权法更好。 关键词 线性回归 缺失值 缺失机制 填补方法 Title Linear regression analysis with missing covariates and its application Abstract In the present investigation of various fields, because of the influence of various known or unknown factors, it often leads to the missing data. Because of the existence of missing data, it not only increases the difficulty of the researchers to analyze the data, but also can lead to the deviation of the results of the analysis, which can reduce the efficiency of the study. So it becomes more and more important to consider how to eliminate or minimize the impact of these missing data. At first, the paper introduces the regression model and the basic concept and describes the methodology used; then introduces the research status at home and abroad for the missing data, and introduces three forms of the missing data mechanism, it is pointed out that to solve the general methods of missing data. In the next article, the linear regression model is introduced, and the data is analyzed by R program. In order to solve the problem caused by the missing data, three methods are used to deal with the missing data sets. The first use of elimination will contain missing data directly to a column removed; the second method is

文档评论(0)

文档分享 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档