1.3 数理统计学的研究步骤
用数理统计方法去解决一个实际问题时,一般有如下几个环节:选择和建立数学模型,收集数据,整理数据,进行统计推断、预测和决策。这些环节是不能截然分开的,也不一定按上述次序进行,有时是互相交错进行的。
①选择和建立模型。在数理统计学中,模型是指关于所研究总体的某种假定,一般是给总体分布规定一定的类型。选择和建立模型要依据概率的知识、所研究问题的专业知识、以往的经验以及从总体中抽取的样本数据。
②收集数据。收集数据有全面观测、抽样观测和试验获取3种方式。全面观测又称普查,即对总体中每个样本都加以观测,测定所需要的指标。抽样观测又称抽查,是指从总体中抽取一部分样本,测定其有关的指标值。这方面的研究内容构成数理统计的一个分支学科,叫抽样调查。试验获取中的试验要有代表性,并要使所得数据便于分析,这里面所包含的数学问题构成了数理统计学的又一分支学科,即试验设计的内容。
③整理数据。整理数据的目的是把包含在数据中的有用信息提取出来。其一种形式是制订适当的图表,如散点图,以反映隐含在数据中的粗略规律或一般趋势;另一种形式是计算若干数字特征,如样本均值、样本方差等简单描述性统计量,以刻画样本某些方面的性质。
④进行统计推断。统计推断指根据总体模型以及由总体中抽出的样本,做出有关总体分布的论断。数据的收集和整理是进行统计推断的必要准备,统计推断是数理统计学的主要任务。
⑤进行统计预测。统计预测的对象是随机变量在未来某个时刻所取的值,或设想在某种条件下对该变量进行观测时将取的值,如预测某运动目标在时刻t的测距误差、通信系统和自控系统在t时刻后某种噪声和干扰的次数等。
⑥进行统计决策。进行统计决策是指依据所做的统计推断或统计预测,并考虑到行动的后果(以经济损失的形式表示)制订一种行动方案。其目的是使损失尽可能小,或使收益尽可能大。例如,一个传感器网络要决定布放辅助定位的锚节点的数量,经过对前期研究数据的分析,在预测定位精度达到a的情况下需至少布放b 个锚节点,假定每布放一个锚节点需花费c 元,而定位精度减少一个量级则损失d 元,要据此做出关于布放锚节点数量的决策。