- 1、本文档共41页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2009_SAS备课笔记_回归分析
回归分析-简单线性回归、多元线性回归
比较:方差分析是处理试验数据的一类统计方法。这类统计方法的特点是所考察的指标(因变量)Y是测量得到的数值变量(连续变量),而影响指标的因子(自变量)水平是试验者安排的几个不同值(称这种因子为分类变量或离散变量)。试验的目的是找出影响指标的主要因子及水平。
在实际问题中,还经常遇到这样一些数据,它们不是有意安排的试验得到的数据,而是对生产过程测量记录下来的数据。对它们进行分析,目的是想找出对我们所关心的指标(因变量)Y有影响为因素(也称自变量或回归变量),并建立用预报Y的经验公式。
对于现实世界,不仅要知其然,而且要知其所以然。顾客对商品和服务的反映对于商家是至关重要的,但是仅仅有满意顾客的比例是不够的,商家希望了解什么是影响顾客观点的因素,以及这些因素是如何起作用的。类似地,医疗卫生部门不能仅仅知道某流行病的发病率,而且想知道什么变量影响发病率,如何影响发病率的。发现变量之间的统计关系,并且用此规律来帮助我们进行决策才是统计实践的最终目的。
一般来说,统计可以根据目前所拥有的信息(数据)来建立人们所关心的变量和其他有关变量的关系。这种关系一般称为模型(model)。假如用Y表示感兴趣的变量,用X表示其他可能与Y有关的变量(x也可能是若干变量组成的向量)。则所需要的是建立一个函数关系Y=f(X)。这里Y称为因变量或响应变量(dependent variable, response variable),而X称为自变量,也称为解释变量或协变量(independent variable,explanatory variable, covariate)。建立这种关系的过程就叫做回归(regression)。
一旦建立了回归模型,除了对各种变量的关系有了进一步的定量理解之外,还可以利用该模型(函数或关系式)通过自变量对因变量做预测(prediction)。这里所说的预测,是用已知的自变量的值通过模型对未知的因变量值进行估计,它并不一定涉及先后的概念,更不必要有因果关系。
回归分析是统计分析的一项重要内容,它可以帮助我们找出变量之间的数量关系。例如,影响企业盈利情况的因素可能包括企业的资产负债率、银行的利率水平、所在国的GDP增长率。对一些企业进行调查之后,我们可以获得企业的盈利情况、资产负债率、利率水平、GDP增长率的数据。使用回归分析就可以得出由资产负债率、银行的利率水平、所在国的GDP增长率三个变量表示的企业盈利水平。作得到了回归结果后,就可以对企业的经营作出一些有用的决策。
SAS/STAT中提供的关于回归的过程很多,包括REG(回归)过程、RSREG(二次响应面回归)过程、ORTHOREG(病态数据回归)过程、NLIN(非线性回归)过程、TRAANSREG(变换同归)过程、CALIS(线性结构方程和路径分析)过程、GLM(一般线性回归)过程、GENMOD(广义线性回归)过程等等。
一、回归分析知识点
1. 一元线性回归分析
这里所指的单变量,是针对自变量个数而言的,在不特别说明的情况下,应变量均为单个变量。单变量线性回归为回归分析中最为简单的情形,也是其它类型回归分析的基础。
【例题1】 某医生为了探讨缺碘地区母婴TSH水平的关系,应用免疫放射分析测定了160名孕妇(15-17周)及分娩时脐带血TSH水平(mU/L),现随机抽取10对数据,见下表,分娩时脐带血TSH水平(mU/L)受母血TSH水平的影响,试进行回归分析。(数据编号:data7_01)
10名孕妇及其分娩时脐带血TSH水平
母血TSH
1.21
1.30
1.39
1.42
1.47
1.56
1.68
1.72
1.98
2.10
脐带血TSH
3.90
4.50
4.20
4.83
4.16
4.93
4.32
4.99
4.70
5.20
此例资料中,脐带血TSH水平随母血TSH水平的变化而变化,前者应被看作为应变量,用y表示,后者为自变量,用x表示。编制如下程序。
【SAS程序】
data sasuser.data7_01;
input x y@@;
datalines;
1.21 3.90 1.30 4.50 1.39 4.20 1.42 4.83 1.47 4.16
1.56 4.93 1.68 4.32 1.72 4.99 1.98 4.70 2.10 5.20
;
proc reg;
model y=x;
run;
虽然reg过程选项、语句复杂,但我们经常用到的一般比较简单,此例即为最简单的情形,达到了reg过程程序代码的最低限度。提交上述程序,结果如下。
?
?结果第一部分为模型的方差分析结果。第二部分给出模型的有关重要统计量,如R2(R-Squa
您可能关注的文档
- MarriageinChina中国婚姻的发展.ppt
- MATLAB基础性实验报告5KN.doc
- MATLAB的距离保护仿真.ppt
- MATLAB系统仿真试题复习资料有答案.doc
- MATLAB结课大作业.doc
- matlab语音识别系统源代码最新版.doc
- MBTI职业性格测试题有答案.doc
- MeasurestoEliminateInternationalTerrorism消除国际.doc
- msk的调制解调MATLAB源代码.docx
- netfpga最新介绍学习资料.ppt
- 2024年国网北京市电力公司招聘高校毕业生考试(第一批)公开引进高层次人才和急需紧缺人才笔试参考题库(共500题)答案详解版.docx
- 2024年太原青创招考聘用太原市杏花岭区综合应急大队工作人员公开引进高层次人才和急需紧缺人才笔试参考题库(共500题)答案详解版.docx
- 2024年四川省安州区事业单位招聘55人历年公开引进高层次人才和急需紧缺人才笔试参考题库(共500题)答案详解版.docx
- 2024年天津市农机发展服务中心招考事业单位工作人员公开引进高层次人才和急需紧缺人才笔试参考题库(共500题)答案详解版.docx
- 2024年安徽亳州蒙城县招募特聘动物防疫专员18人历年公开引进高层次人才和急需紧缺人才笔试参考题库(共500题)答案详解版.docx
- 2024年夏福建上杭县事业单位招考拟录人选五公开引进高层次人才和急需紧缺人才笔试参考题库(共500题)答案详解版.docx
- 2024年国网英大国际控股集团限公司招聘约4人历年公开引进高层次人才和急需紧缺人才笔试参考题库(共500题)答案详解版.docx
- 2024年安徽安庆桐城团市委选调工作人员1人历年公开引进高层次人才和急需紧缺人才笔试参考题库(共500题)答案详解版.docx
- 2024年宁波市象山县黄避岙乡人民政府招考编制外人员公开引进高层次人才和急需紧缺人才笔试参考题库(共500题)答案详解版.docx
- 2024年安徽合肥肥西县供销社招聘基层单位工作人员12人公开引进高层次人才和急需紧缺人才笔试参考题库(共500题)答案详解版.docx
文档评论(0)