是通过图表或数学方法,对已有数据资料进行整理、分析,把数据的分布状态、数字特征和随机变量之间关系进行估计和描述呈现的方法描述统计主要分为集中趋势分析、离中趋势分析和相关分析三个部分。
01 集中趋势分析
集中趋势分析依赖的是平均数、中数、众数这一些统计指标来表示数据的集中趋势。以一个班级的考试成绩数据举例:班级成绩的平均分是多少?中位数是那个分数?出现最多的分数是哪个分数?是正偏分布还是负偏分布?
02 离中趋势分析
离中趋势分析主要依赖全距(最大值减最小值)、四分位差、平均差、方差(协方差:用来度量两个随机变量关系的统计量)、标准差这几个统计指标来研究数据的离中趋势。同样以成绩来举例,我们想知道两个教学班的语文成绩中,哪个班级内的成绩分布更分散,就可以用两个班级的四分位差或百分点来比较;想知道哪个学生的成绩更为稳定,我们就可以用标准差和方差来衡量。
03 相关分析
相关分析探讨数据之间是否具有关联性。这种关系既包括两个数据之间的单一相关关系——比如年龄与身高之间的关系,也包括多个数据之间的多重相关关系——如年龄、抑郁症发生率、身高、工作收入之间的关系。