2.1.3　入院和住院日适宜性评价工具

2025年10月13日

版权

2.1.3　入院和住院日适宜性评价工具

在系统的适宜性评价工具开发之前，对入院和住院日的适宜性评价主要工具是入院率和平均住院日、术前住院日等。然而正如绪论中所述，这些指标一般只能反映某些异常状况与一般状况的偏差，但当一般状况已经包括不适宜入院／住院日时，使用平均指标来评价则会产生较大的误差。因此，研究者根据其研究目的、对象等的不同开发了不同的适宜性评价工具。

根据这些评价工具评价适用范围的不同，一般可以分为与诊断相关（diagnosis-related）的工具和与诊断无关（diagnosis-independent）的工具两种。前者仅适用于一种或几种疾病或手术，而后者的适用范围则更为灵活。按照评价成本来分，又可以分为固定指标的工具和灵活指标的工具。前者往往是通过一系列明确的指标来界定适宜入院／住院日，满足某个或某些指标的入院／住院日则认为它属于适宜入院／住院日；后者则主要依靠专家小组的意见来对适宜性进行判断。虽然前者成本较低，但却在灵活性上不如专家法，而专家评价法的缺点除了成本较高以外，有研究指出，在一些模棱两可或在某些专家倾向于“偷懒”的情况下，评价结果容易向多数人偏移。此外，专家法的独立性也较低，不同专业的专家对适宜性的评价往往差异较大［68］。

根据国外相关文献，常用的适宜性评价工具有以下几种，它们的评价成本和适用范围对比情况如图2-2所示。

pagenumber_ebook=32,pagenumber_book=21

图2-2　适宜性评价工具对比

AEP：AEP是适宜性评价工具中最广为使用的一种。在42个所选研究中，37篇选择了AEP作为评价工具。AEP分为两部分，第一部分是入院评价标准，第二部分是住院日评价标准。每部分均包含一系列的客观指标，这些指标分别对适宜入院／住院日的患者状况、医疗服务强度或护理／生命支持服务进行了描述，如果满足这些指标中的一个条件，则可认为该入院／住院日是适宜的。除了客观指标部分，考虑到卫生服务的复杂性和特异性，开发者还在AEP中囊括了一个主观指标，即“凌驾选项”（override option）。该选项指的是当某入院或住院日无法到达评价指标中任一条，但评价者仍然认为该患者需要住院服务时，或者当评价对象符合评价标准中的一条或多条，但评价者认为该患者无须住院服务时，则可用主观判断“凌驾”于适宜性标准之上，对其适宜性进行判定。由于AEP使用方便且与诊断无关，其信度和效度也在多个国家进行了考察并用于入院／住院日的适宜性评价。

延迟工具（the delay tool）：延迟工具是由9个模块共166个条目组成，每个模块都包含一系列导致医疗服务延迟执行的原因［43］。延迟工具的特点是其搜索的信息比较集中，评价的内容有限，即只搜集存在服务延迟的资料。根据相关实证文献的调查结果，使用延迟工具评价一份病案仅需要6分钟［43］，而另有研究表示使用AEP对住院日进行评价，每份病案平均需要约10分钟［82］。延迟工具一般仅用于指明不适宜住院日产生的原因，但并不描述适宜住院日的服务内容，因此，该工具常用于搭配其他适宜性评价工具一同使用。

RAND／UCLA适宜性评价方法（RAND／UCLA appropriateness method，RAM）：20世纪80年代，一家独立的美国研究机构兰德公司（RAND）和加利福尼亚大学洛杉矶分校（University of California，Los Angeles，UCLA）共同开发了RAM的第一个版本，用于判断住院服务中存在的过度医疗（overtreatment）和不充分医疗（under-treatment）。该公司所开发的适宜性评价标准要求专家小组对某些条目进行多次评分，以专家的意见加权结果作为判定依据［83］。由于该方法高度依赖专家意见，成本较高，在入院／住院适宜性评价方面，RAM仅适用于几个外科常见手术（如冠脉造影、心脏搭桥、胆囊或子宫切除等）［2］。

服务强度-疾病严重性-出院适宜性评价工具（intensity-severitydischarge-appropriateness，ISD-A）：由Inter Qual Inc.开发的ISD-A评价体系将整个住院体系分为入院、住院和出院3个阶段，并分别对它们进行评价［84］。该工具通过对疾病的严重性（severity of illness）和服务强度（intensity of service）来评价入院和住院日的适宜性。只有在入院24小时内同时满足疾病严重性和服务强度中至少一条，其入院才能被判定为适宜；在某住院日满足严重性或服务强度中任一条，则该住院日被判定为适宜。当严重性和强度中没有适用条目时，则开始使用ISD-A的出院评估部分，对继续住院的适宜性进行评价。

其他研究工具如标准化医疗评价工具（standardized medreview instrument，SMI）、管理式医疗适宜性评价方案（managed care appropriateness protocol，MCAP）等［85］，运用范围不广，在本节暂不进行详细讨论。

由于适宜性评价工具的开发往往需要长期的临床调研和大量的人力、物力，以上所列举的评价工具均由高收入的发达国家所开发，且绝大多数研究都是在经济较发达地区展开的［86］。这些工具为资源有限的国家／地区提供了良好的评价方案蓝本和实践基础，但是由于卫生体制、经济水平、社会文化等方面的不同，其他国家在使用这些适宜性评价工具之前，一般先会对其进行本地化，并对其信度和效度进行考察，如AEP就有意大利的医院适用的评价方案（protocollo revisione utilizzo ospedale，PRUO）、荷兰（D-AEP）、韩国（K-AEP）等多个改良版本以适应其应用地区的具体医疗实践［2，44，56，74］。对适宜性评价工具的信度和效度评价研究现状将在本书第3章做简要介绍。

2.1.3 入院和住院日适宜性评价工具

2.1.3　入院和住院日适宜性评价工具