商务统计学(第5版)PPT翻译版 Ch02.pptxVIP

  1. 1、本文档共22页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

第2章描述性统计本章将探讨描述性统计的基本概念和方法,包括数据的收集、组织、集中趋势和离散程度的度量、偏态和峰度,以及相关分析等内容。通过学习这些基础知识,为后续进一步的数据分析打下坚实的基础。byJerryTurnersnull

2.1导言在进行数据分析工作时,我们需要先了解并掌握一些基本的描述性统计概念。本节将简要介绍描述性统计的基本内容,包括数据的收集和组织、集中趋势和离散程度的度量等,为后续的更深入分析奠定基础。

2.2数据的收集总体与样本:在进行数据分析时,需要先确定分析对象是整个总体还是抽取的样本。这将影响到后续的分析方法和结果解释。数据类型:数据分为定性数据和定量数据两大类,根据数据特点采用不同的分析方法。数据来源:数据可以通过自行收集或从现有渠道获取,对数据的质量和可靠性要有全面了解。

2.2.1总体与样本总体所有待研究的对象的集合,是我们真正关心和分析的对象。但通常由于时间、成本或其他资源的限制,很难对总体进行全面调查。样本从总体中随机抽取的部分元素,通过对样本的研究,可以得到关于总体的信息。合理抽取和分析样本对于总体研究非常关键。总体参数与样本统计量总体参数是描述总体特征的数值,而样本统计量是根据样本计算得到的数值。我们通常根据样本统计量来估计总体参数。样本代表性确保样本能够充分代表总体是数据分析的前提。样本设计、抽样方法等都会影响到样本的代表性。

2.2.2数据的类型数据可分为定性数据和定量数据两大类。定性数据是一些无法量化的特征描述,如性别、职业等;定量数据则是可以用数字表示的测量值,如身高、成绩等。定性数据通常采用频数分布等方法进行分析,而定量数据则可以计算集中趋势和离散程度等指标。此外,还有一些有序数据,如5级评分等,它们介于定性和定量之间,既有特征描述又可以排序。

2.2.3数据的来源数据来源可以是通过自行收集获得,如调查问卷、实验观测等。这种方式可以按照研究需求定制数据结构和质量。也可以从现有渠道获取数据,如政府统计、行业报告、第三方数据平台等。这种方式数据获取更便捷,但需评估数据的可靠性。无论数据来自何处,我们都要全面了解数据的质量和特性,包括数据的定义、采集方法、样本代表性等,才能合理使用和解释数据。

2.3数据的组织在进行数据分析之前,我们需要首先对数据进行整理和组织。这包括绘制频数分布图、直方图和茎叶图等,以直观地展示数据的特征和分布。这些基础的数据可视化技术为后续的深入分析奠定基础。

2.3.1频数分布频数分布是一种基本的数据可视化方法,用于描述定性和定量数据的分布情况。它通过统计各个取值的出现次数,形成一个列表或柱状图,清晰展示数据的分布特征。这为后续进一步分析数据提供了关键基础。

2.3.2直方图直方图是一种常用的数据可视化工具,它可以直观地展示定量数据的分布情况。通过绘制柱状图,可以清楚地看到数据在不同数值区间的频数分布,有助于发现数据的集中趋势和离散程度。

2.3.3茎叶图茎叶图是一种直观有趣的数据可视化方法,能够展现定量数据的分布情况。它通过将数据按数值大小排列并分组,以"茎"和"叶"的形式展现在图上,突出了数据的集中趋势和离散程度。茎叶图图形简单易懂,是一种很好的数据初步探索工具。

集中趋势的度量在数据分析中,我们常需要衡量数据的集中趋势,以总结数据的一般特点。常用的集中趋势指标包括算术平均数、中位数和众数,它们从不同角度反映了数据的中心位置。

2.4.1算术平均数算术平均数是数据集中趋势的最常用度量,它反映了数据的平均水平。计算方法是将所有数值相加,然后除以数据个数。平均数能够描述数据的整体特征,但也容易受到极端值的影响。

2.4.2中位数中位数是数据集中趋势的另一个重要指标。与算术平均数不同,中位数不受极端值的影响,能更好地反映数据的中心位置。计算方法是将数据按大小排序,然后找到位于中间的数值。中位数可以更好地描述偏态严重的数据分布。

2.4.3众数众数是数据集中趋势的第三个重要指标。与算术平均数和中位数不同,众数反映了数据集中的主要值,即出现频次最高的那个数据。众数可以帮助我们识别数据分布的主要特征,对于分析具有离散型特征的数据尤其有帮助。

离散程度的度量除了集中趋势度量外,我们还需要评估数据的离散程度,即数据点围绕中心的离散或分散情况。常用的离散程度指标包括方差、标准差和变异系数,它们从不同角度反映了数据的离散水平。

2.5.1方差方差是描述数据离散程度的重要指标。它反映了数据点与平均数之间的平方差的平均值,表示数据点围绕平均数的离散程度。方差越大,说明数据越离散;方差越小,则数据越集中。方差是统计分析中常用的集中趋势和离散程度的度量。

2.5.2标准差标准差是一种更为直观的离散程度度量指标。它通过计算数据点与平均值的平均偏差,来反映

文档评论(0)

166****9220 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档