一、效度的含义

2025年11月28日

版权

一、效度的含义

效度是指实证测量在多大程度上反映了概念的真实含义^[4]，也就是是否真的测量出了我们想要测量的内容。如我们希望通过某些问题测量一个人是否有同情心，那么这些问题能够测量出“同情心”的程度，就是效度。比如，询问“您是否曾经帮助弱势群体”，或者“您是否为需要帮助的人捐过款”，会比问“您是否和人打过架”更能测出一个人具有“同情心”的程度。

对效度的测量标准有很多种：第一种是表面效度。表面效度是以测量标准与我们的共识或日常的判断是否一致来判断的。如“为需要帮助的人捐款”与我们平时所认为的“具有同情心”是一致的，而“殴打老人”或“抢小朋友的零花钱”则明显不是具有同情心的表现。第二种是实用效度。由于有些概念是已经在学术界形成共识的，所以对这些概念的测量必须符合学术共识。如“失业率”在经济学上有非常明确的计算标准，那么对于这个指标的测量也必须符合经济学对这一概念的定义。第三种是内容效度，用来衡量测量是否包含了概念的所有方面。因为有很多概念都包含了多个方面，如“公民对政府的信任”实际上包含了公民对政府机关的信任、对公务员的信任、对政治体制的信任等。又如“歧视”，可以包含性别歧视、种族歧视、地区歧视等。如果对“歧视”这个概念的测量只包含了对性别歧视的测量，那么内容效度就不够高，因为其他和“歧视”有关的内容没有被测量，这个测量是不够全面的。第四种是建构效度，其构建的基础是根据某种理论体系建立的变量之间的逻辑关系。我们在SPSS中用因子分析的方法检验的就是建构效度，即检验我们所设计的测量工具（如量表）是否能有效体现研究者自己建构出来的理论体系。除了以上4种标准外，还有标准关联效度等。

我们还需要注意区分内部效度和外部效度，内部效度就是前面所说的，用于检验测量工具能否正确解释想要解释的变量或概念。而外部效度则是指研究结果的可推广性，也就是这种测量工具所获得的研究发现，是否可以被推广到更大的范围内进行解释。如实验室实验这种研究方法，我们就认为它存在外部效度低的情况，因为在实验室这种受到严格控制的环境下得到的结论，未必能够用于解释更广阔的真实世界。