- 1、本文档共9页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
可编辑版
PAGE
Word完美格式
基于鞋码影响身高的预测模型
姓名:XXX
班级:XXXX
学号:XXXXX
Word完美格式
摘 要
在已知一个人的鞋码的情况下,想要大概估算出一个人的身高,本文采用SPSS软件先对采集的数据进行相关性分析,体重和身高正相关,鞋码与身高存在极强的正相关性。接着采用偏相关分析,发现体重对身高的影响大大降低,接着对数据进行曲线估计,得出鞋码与身高为线性关系,对该模型进行检验发现拟合性很好,从而在已知寇老师的鞋码情况下,可以知道他的身高为 .
关键词: 偏相关分析 SPSS 曲线估计 身高
1 问题重述
已知寇老师所穿的鞋子码数是42码,利用统计学的知识,估计寇老师的身高,并分析身高与哪些因素相关,相关性如何?再建立统计模型。
2 问题分析
在已知寇老师鞋码的情况下,要我们求出寇老师的身高,则需要收集大量鞋码与身高的数据来对这两者进行分析,考虑到影响身高的因素,我们也将体重这一因素调查出来,利用已学的SPSS软件知识对这三者之间的关系进行分析,是否符合线性回归方程,进而利用鞋码得出寇老师的身高,如若不然,应采用非线性回归分析。在此基础上还应该对已建立的模型进行检验,减小误差,得出身高其他影响因素的关系。
3 模型假设
1. 假设收集的数据真实可靠;
2. 假设收集的数据不存在人为干扰;
3. 假设本次收集的数据是随机的;
4 定义与符号说明
鞋码
身高
相关系数
表示方程的回归系数
5 模型的建立与求解
数据预处理
表一:描述统计量
N
全距
极小值
极大值
均值
标准差
方差
身高
50
33
147
180
169.30
7.158
51.235
体重
50
32
41
73
56.74
8.550
73.094
鞋码
50
8
35
43
40.28
2.090
4.369
有效的 N (列表状态)
50
本次一共收集了50个人的身高鞋码数据,对鞋码、身高、体重的数据的极大值、极小值、均值、标准差、方差进行统计,发现身高大部分分布在169.3cm左右 ,体重则在56.74kg左右,鞋码大部分分布在40.28左右。
5.1 鞋码、身高、体重相关与独立性
对鞋码、身高、体重的数据的相关与独立性进行定量分析,利用对3个基本指标的相关数据进行相关分析,若随机变量X、Y的联合分布是二维正态分布,和分别为n次独立观测值,相关系数r的公式为:
其中,,利用SPSS分析得到表二:
表二:相关性分析
身高
体重
鞋码
Kendall 的 tau_b
身高
相关系数
1.000
.515**
.659**
体重
相关系数
.515**
1.000
.528**
鞋码
相关系数
.659**
.528**
1.000
Spearman 的 rho
身高
相关系数
1.000
.674**
.776**
体重
相关系数
.674**
1.000
.641**
鞋码
相关系数
.776**
.641**
1.000
Pearson 相关性
身高
相关系数
1
.705**
.856**
体重
相关系数
.705**
1
.686**
鞋码
相关系数
.856**
.686**
1
根据相关系数的检验标准,由表二可以观察得出身高和鞋码两者高度相关,体重和鞋码两者中度相关,体重和身高之间正相关。但是无法确定它们之间是否存在伪相关性,则需要剔除其他变量的影响,在只有三种数据的情况下,我们采用偏相关系数来反映变量间真实的相关性,所以偏相关分析见表三:
表三:偏相关分析
控制变量
身高
体重
鞋码
身高
相关性
1.000
.313
显著性(双侧)
.
.029
df
0
47
体重
相关性
.313
1.000
显著性(双侧)
.029
.
df
47
0
控制变量
身高
鞋码
体重
身高
相关性
1.000
.722
显著性(双侧)
.
.000
df
0
47
鞋码
相关性
.722
1.000
显著性(双侧)
.000
.
df
47
0
由表三输出结果可知,在考虑了鞋码的影响之后,身高和体重的相关系数下降,大大低于两变量相关分析中的相关系数,所以鞋码和身高存在某种线性关系。
5.1.1身高与鞋码的相关性
由表三数据可知,建立一元线性回归模型:
上式中表示方程的回归系数,为鞋码,为身高,利用SPSS对数据进行线性拟合,得到的结果见表四。
表四:模型汇总和参数估计值
方程
模型汇总
参数估计值
R 方
F
df1
df2
Sig.
常数
b1
b2
b3
线性
.733
132.006
1
48
.00
文档评论(0)