2.1 总体、个体、变量与数据

2.1 总体、个体、变量与数据

1.总体

所研究对象的全体称为总体(或母体),如生产线上生产的零件。研究中,我们往往会关心总体的某些特征(指标或变量),如关心零件的尺寸、重量等特征。如果总体有两个以上的指标,那么可以对这些指标逐个进行研究,也可以将其作为指标向量来进行研究。反映总体特征的指标(变量)实际上是一维或者多维随机变量,如高速路上某定点的平均车速、风速、温度。

从无限次随机放回抽样的角度来看,表征一个有限总体特征的变量(指标)也可以视为随机变量。因此,从这个角度来说,反映总体特征的随机变量的取值的全体也称为总体或母体(其实就是样本空间)。总体分布指反映总体特征的随机变量的概率分布。从无限次等机会抽样的角度来看,有限总体的概率分布就是有限总体中不同个体的比率(频率)分布。

2.个体(或成分)

个体为组成总体的元素。按个体数目是否有限,个体可分为有限总体和无限总体。

3.变量(或指标)

变量是指反映总体或个体的特征的量。在统计学上,变量还可以依据其变量值特征分为定量变量和定性变量。

①定量变量也称数值变量。用定量的方法对观察单位进行测量得到的资料被称作数值变量,亦称计量资料,一般有度量单位。定量变量包括离散型变量和连续型变量。定量变量也就是通常所说的连续量,如长度、重量、产量、人口、速度和温度等,它们是由测量或计数、统计所得到的量,这些变量具有数值特征。

②定性变量也称分类变量。首先将观察数据的观察指标按性质、类别进行分组,然后对各组数据单位进行计数。分类包括无序分类和有序分类。这些量不是真有数量上的变化,而是只有性质上的差异。这些量还可以分为两种:一种是有序变量,它没有数量关系,只有次序关系,如某种产品分为一等品、二等品、三等品等,矿石的质量分为贫矿和富矿等;另一种是名义变量,这种变量既无等级关系,也无数量关系,如天气(阴、晴)、性别(男、女)、职业(工人、农民、教师等)和产品的型号等。

4.变量(或指标)值或数据

在研究一个总体时,所要研究的每个特征(指标或变量),在每个个体上都有一个反映该特征的具体描述(数字、文字),这些特征的具体描述被称为指标值(变量值)或数据。