统计田佩让统计探索性数据分析.pptxVIP

  1. 1、本文档共28页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

演讲者:xxx1_统计2101田佩让统计探索性数据分析(1)

-2目录CONTENTS1、研究背景概述1二、研究方法2三、数据预处理31、主成分分析5六、结论与建议6使用的R语言代码7四、相关性分析4

1_统计2101田佩让统计探索性数据分析(1)04河北工程大学01

基于不同APP的品牌覆盖率和联网方式占比分析03(指导教师:张艳萍)02田佩让

1、研究背景概述Part1

1、研究背景概述1研究背景:随着科技的快速发展和智能设备的普及,越来越多的品牌推出了各种各样的智能设备,例如智能手机、智能电视、智能家居等。不同的品牌在不同的市场上拥有不同的覆盖率和联网方式占比,这对于企业战略决策、市场竞争以及产品开发具有重要意义2本研究旨在通过对不同品牌的覆盖率和联网方式占比进行分析,探讨不同品牌在智能设备市场上的地位和竞争情况,为企业提供参考和决策支持3本研究将采集市场数据和统计信息,包括各品牌智能设备的销售数据、用户调查数据等4通过数据分析和统计方法,对不同品牌的覆盖率和联网方式占比进行比较和分析5分析不同品牌在智能手机市场、智能电视市场、智能家居市场等领域的覆盖率情况,了解各品牌在市场中的地位和竞争力

1、研究背景概述比较不同品牌的联网方式占比,包括Wi-Fi、2G/3G/4G等,探讨不同品牌在联网技术上的优势和趋势1234+通过该研究可以为企业制定市场策略提供参考,帮助企业了解自身在市场中的地位和竞争对手的优势分析市场趋势和用户需求,预测未来智能设备市场的发展方向和潜在机会同时,对于消费者来说,也可提供选择智能设备时的参考依据,促进市场竞争和产品创新

二、研究方法Part2

二、研究方法图1研究思路框架图

三、数据预处理Part3

三、数据预处理本文研究不同APP的品牌覆盖率和联网方式的数据主要来自于数据库

三、数据预处理2022/8/190:0029.582022/7/80:0029.772022/6/180:0029.182022/6/50:0028.94(一)缺失值填补收集数据后发现缺少移动设备:Android:华为:日的数据,考虑到本文中自变量的相关性较高,所以采用线性回归法对缺失值进行填补,填补结果如表2所示。0

三、数据预处理(二)异常值检验考虑到异常值对于整体分析过程的影响,因此采用箱线图进行检验。箱线图是利用数据中的五个统计量:最小值、第一四分位数、中位数、第三四分位数与最大值来描述数据的一种方法,它也可以简明扼要的看出数据的分布以及异常值点从图2中可以看出数据中不存在异常值,无需进行异常值的处理

三、数据预处理(三)数据标准化处理数据标准化的处理方法有Z-Score值标准化、最小最大值标准化、归一化标准化等方法,针对经济类数据,本文采用常用的Z-Score标准化方法,对原始数据进行标准化处理1-Score值标准化方法计算公式

四、相关性分析Part4

四、相关性分析在进行回归分析之前,首先对各变量进行相关性分析,相关性分析目的在于先检验一下众多的自变量和因变量之间是否存在相关性,如果相关分析时各自变量跟因变量之间没有相关性,就没有必要再做回归分析相关关系是一种非确定性的关系,相关系数是研究变量之间线性相关程度的量。由于研究对象的不同,相关系数有如下几种定义方式

四、相关性分析简单相关系数:又叫相关系数或线性相关系数,一般用字母r表示,用来度量两个变量间的线性关系定义式其中,Cov(X,Y)为X与Y的协方差,Var[X]为X的方差,Var[Y]为Y的方差复相关系数:又叫多重相关系数。复相关是指因变量与多个自变量之间的相关关系

四、相关性分析以下是各个品牌覆盖率之间的相关系数矩阵表相关系数矩阵表显示,不同品牌之间的覆盖率存在一定的相关性,其中OPPO、vivo、荣耀三个品牌之间的相关系数较高,都超过了0.9,而小米与其他品牌之间的相关系数相对较低我们还可以得到如下图3的相关系数图则根据相关系数矩阵表和相关系数图可知每个变量之间都有很大的相关性,则下面可以进行主成分分析

1、主成分分析Part5

1、主成分分析我们进行相关性检验后,我们得知每个变量之间的相关性都很强,则我们进行主成分分析。我们首先确定主成份个数,得到主成分载荷主成分载荷[[0-0[0-0[0-0[-0.04077970[-00]

1、主成分分析y=0.24866x+14.88936

六、结论与建议Part6

六、结论与建议(一)结论品牌覆盖率分析:通过统计不同App的品牌覆盖率,可以了解用户在流量平台上

文档评论(0)

专业+专注 + 关注
实名认证
文档贡献者

专业分享高质量文档!你有什么需求可以关注联系本姑娘哦

版权声明书
用户编号:8106110135000016

1亿VIP精品文档

相关文档