理论教育 数据分组与频数统计

数据分组与频数统计

时间:2023-06-09 理论教育 版权反馈
【摘要】:数据分组是根据统计研究的任务,按照一定的标志,将统计总体区分为多个性质相同的组。数据分组的方法有按照属性标志分组和按照变量标志分组。通过对每组频数的统计,可以看出数据的大体分布情况。现对销售数据进行分组。以下操作将各个区间的频数统计结果分别存放在F2:F5单元格区域。在Excel2013中,利用FREQUENCY函数可以统计组距式分组的频数。图1-6-4分组区的初始数据图1-6-5频数和频率统计结果

数据分组与频数统计

数据分组是根据统计研究的任务,按照一定的标志,将统计总体区分为多个性质相同的组。简单地说,数据分组就是把总体中性质相同的数据归并在一起,把性质不同的数据区分开来。数据分组的方法有按照属性标志分组和按照变量标志分组。按照属性标志分组根据属性取值的不同分为若干个分组;按照变量标志分组根据变量的值划分为多个区间组。

数组分组的基础上,统计出各个分组的数据个数为该组的频数,各分组的频数之和等于数据的总个数。通过对每组频数的统计,可以看出数据的大体分布情况。例如,已知一批学生参加某门课程考试的成绩,要了解该课程的考试质量,可以将成绩级别划分为90分以上、80~89分、70~79分、60~69分以及60分以下共5个分数段,统计每个分数段的学生人数,从而大致看出学生成绩的分布情况。

1.利用COUNTIF函数进行频数统计

在Excel2013中,利用条件计数函数COUNTIF函数来计算满足一定条件的数据个数,通过构造一个包含COUNTIF函数的公式,可以计算出各个区间的频数。有关COUNTIF函数的详述,参见第4章的相关内容。

例6-1 调查某商场的商品销售数据,抽取出各月份的空调销售量,如图1-6-1所示。现对销售数据进行分组。并统计各组的月份个数。

分析:本例中,空调销售量最低的是45,最高的是310,不同月份的销售量相差较大,可见其变化幅度之大。所以应将性质相似的数据分为同一组,考虑将销售量划分为四个区间:0~100,100~200,200~300,300~400,每个区间包含区间的上限值,不包含下限值,对销售量按照这四个区间进行分组。以下操作将各个区间的频数统计结果分别存放在F2:F5单元格区域。

图1-6-1 空调销售量

具体操作步骤如下。

(1)计算销售量在0~100区间的频数(即月份个数)。在F2单元格输入公式“=COUNTIF(B2:B13,"<=100")”,按“Enter”键。

(2)计算销售量在100~200区间的频数。在F3单元格输入公式“=COUNTIF(B2:B13,"<=200")-COUNTIF(B2:B13,"<=100")”,按“Enter”键。

(3)计算销售量在200~300区间的频数。在F4单元格输入公式“=COUNTIF(B2:B13,"<=300")-COUNTIF(B2:B13,"<=200")”,按“Enter”键。

(4)计算销售量在300~400区间的频数。在F5单元格输入公式“=COUNTIF(B2:B13,"<=400")-COUNTIF(B2:B13,"<=300")”,按“Enter”键。

完成以上操作后,得到各个区间段的频数统计结果,如图1-6-2所示。

(www.daowen.com)

图1-6-2 频数统计结果

2.利用FREQUENCY函数进行频数统计

另一种频数统计方法是组距式分组的频数统计。组距式分组是将变量按照一定的数量或质量关系划分为多个区间段,并把一个区间段的所有变量值归为一组,形成组距式变量数列。区间段的距离就是组距。根据分组时所有组距的大小关系,组距式分组通常分为等距分组和不等距分组。等距分组就是分组标志在各组中都有相同的组距;不等距分组是分组标志在各组中的组距不完全相同。

在Excel2013中,利用FREQUENCY函数可以统计组距式分组的频数。FREQUENCY函数的语法为“FREQUENCY(Data_array,Bins_array)”。其中,参数Data_array指定要分组的原始数据所在的区域引用,参数Bins_array指定区间数组或对区间的引用。

例6-2 随机抽取2017级50个学生期末考试的高等数学成绩,如图1-6-3所示,对该课程成绩的总体水平进行频数统计。

具体操作步骤如下。

(1)确定组数和组上限值。根据大学中常见的分数等级划分规则,将高等数学成绩分为五个等级:90分以上、80~89分、70~79分、60~69分和60分以下,分别表示优秀、良好、中等、及格和不及格共五个评分等级。因此,确定组数为5,组上限分别为100、89、79、69、59。在Sheet1工作表的A14:D20单元格区域输入图1-6-4所示的分组区的内容。

(2)计算各分数段的人数,存放到C16:C20单元格区域。选中C16:C20单元格区域,在编辑栏输入公式“=FREQUENCY(A2:E11,A16:A20)”,然后按“Ctrl+Shift+Enter”组合键,即可得到各组的频数,即各分数段的人数,参见图1-6-5所示的C列结果。

图1-6-3 高等数学成绩

(3)计算各组的频率。频率=频数/总人数。在D16单元格输入公式“=C16/50”,按“Enter”键后,从D16单元格向下复制公式至D20单元格,参见如图1-6-5所示的D列结果。

图1-6-4 分组区的初始数据

图1-6-5 频数和频率统计结果

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈