频数分布直方图是一种用于展示数据分布的图表,它将数据分成若干个区间,并统计每个区间内的数据频数(或频率)。频数分布直方图通常用于展示连续性数据的分布情况。
在创建频数分布直方图时,首先需要确定数据的区间间隔大小,并将数据分成若干个区间。然后,在图表中绘制每个区间的矩形条,其高度表示该区间内的数据频数(或频率),宽度表示该区间的间隔大小。条形之间通常没有间隔,以强调各个区间之间的连续性。
通过频数分布直方图,可以清晰地了解数据的分布情况。例如,如果大多数数据落在某个区间内,那么该区间的矩形条将更高,反之则矩形条较低。此外,通过观察矩形条的分布情况,可以判断数据的偏态性(正态分布、偏态分布等)。
频数分布直方图是通过长方形的高代表对应组的频数(因为组距是一个常数,为了画图和看图方便,通常直接用高表示频数),这样的统计图称为频数分布直方图。
其作用是:
1.清楚显示各组频数分布情况;
2.易于显示各组之间频数的差别。
作直方图的步骤:
1.集中和记录数据,求出其最大值和最小值。数据的数量应在100个以上,在数量不多的情况下,至少也应在50个以上;
2.将数据分成若干组,并做好记号,分组的数量在5-12之间较为适宜;
3.计算组距的宽度。用组数去除最大值和最小值之差,求出组距的宽度;
4.计算各组的界限位。各组的界限位可以从第一组开始依次计算,第一组的下界为组中值减去组距的一半,第一组的上界为其下界值加上组距。第二组的下界限位为第一组的上界限值,第二组的下界限值加上组距,就是第二组的上界限位,依此类推;
5.统计各组数据出现频数,作频数分布表;
6.作直方图。以组距为底长,以频数为高,作各组的矩形图。 根据最大数据与最小数据的差值,决定组距的大小,组距和组数的确定没有固定的标准,一般数据越多,分成的组数就越多,当数据不超过50个,可以分5~7组;当数据在50~100之间时,一般分5~17组。