医师绩效评价方法研究现状

(五)医师绩效评价方法研究现状

作为医师管理理论中的一项重要研究内容,医师绩效评价中的评价问题的支持方法也受到学界和业界的广泛关注。纵观现有文献不难发现,评价指标的遴选与评价方法的选择这两部分是医师绩效评价的核心环节。然而,较之评价指标体系研究,评价方法的研究较为不足,同时这也为管理科学领域学者提供了很好的研究背景和素材。

1.医师绩效评价方法

Ahsan 等[51]应用Delphi 和AHP 发展了一种医师绩效评价方法,并在案例验证中发现多准则决策方法能够方便医疗绩效分析的实施,尤其对公立医疗系统更为有效。方海燕等[17]针对指标存在不确定的特点,应用证据推理(DS)算法,建立了医师绩效评价模型,有效地融合了定量和定性信息,对医生绩效进行了综合评估。付孟艳等[39]指出医生的绩效评估需同时考虑经济效益和社会效益,又鉴于社会效益往往属于定性指标,通常由人的主观感知来评估,很难用准确值来量化,提出了一种三角模糊TOPSIS 医师绩效评价方法。黄山等[52]运用层次分析法确定指标体系的权重,以便对各项评价指标在总体评价中的作用进行区别对待,确保整个评价体系的科学性。Otay 等[53]集成三角直觉模糊(TIF-)AHP 与DEA 提出一种用于医院绩效评价的多专家模糊方法,该方法综合测度DEA 框架是由7 项输入和6 项输出指标构成的评价系统。Rahman 等[54]考虑到二手数据的不确定性和贫信息,应用修正的GM(1,1)灰色预测模型和线性回归模型提出的依据二手数据的医师绩效预测方法。该方法的绩效预测变量利用KPI 模型在文献统计汇聚指标的基础上提炼出病床周转率BTO、病床占用率BOR、平均住院天数ALOS、在院死亡率HDR 和在院感染率HIR 等5 项KPI指标,最后通过5 个月案例数据验证了模型的可靠性和有效性。此外,国内对医师绩效评价的研究方法较为广泛,目前使用频率最高的是德尔菲法,其他诸如数据包络分析、TOPSIS 等新方法的引入也为医师绩效评价带来了新的思考[13]

2.BSC 量化评价方法研究

鉴于绩效评价主要用于目标达成情况和鉴别改进空间,BSC 逐渐成了一种通用的绩效评价方法。然而Grigoroudis[55]指出在过去的数十年中尽管BSC 已被大量商业组织日益采纳,但涉及非营利组织(教育或医疗机构)的BSC 研究还十分有限,并在BSC 框架下提出了一套由维度(视角)、战略目标和KPI(指标)3 个层次构成的公立医院的绩效评价系统。该系统除财务绩效指标外,重点分析了组织提供的服务质量、内外部客户的满意度、自我改进以及外界环境变化的适应和应变能力等非财务绩效指标。Patel 等[56]提出越来越多公立医院开始关注长期绩效且开始利用BSC 作为绩效管理框架,BSC 维度间体现出类似树的果实(财务测度)相关与叶(顾客)、枝干(过程)与根(学习与成长)间的因果逻辑关系。Catuogno 等[9]基于BSC,通过综述、设计和实施三阶段发展了一套面向公立医院的多维绩效测度系统,以强调多利益攸关群体不同需求的复杂性和医院的医疗与科学研究双重目的。有别其他医疗BSC,该绩效测度系统由财务、科研过程、医护过程和相关群体满意度4 大维度构成和25 项KPI 具体支撑,该项成果描述了如何应用BSC 研究适合公立医院具体需求的系统。与此同时,部分学者提出为了便于解释绩效测度结果对绩效改进的导向,需要直观明确地表明其指标的优劣。Youngblood 等[57]提出一种由发展计分卡、量化指标、发展模型和模型评价4 环节构成的BSC 测度发展方法体系,其中发展计分卡由识别目标、遴选指标和精简指标集3 部分组成,量化指标包括确定指标取值范围、确认指标最佳与最劣情况和选定效用函数3 部分。发展模型由确定指标权重、确定指标间相关性、发展指标集结函数以及解析指标间补偿性问题等6 部分组成,模型评价则包括了制造和比较不同的情景等4 块内容,该方法体系对后继量化BSC 方法的研究产生了重要作用和深远影响。还有一些学者注意到通过维度间或指标间不同的妥协情况反映不同的情景和势态,以便对各医师的绩效进行全景的观察和了解,因此BSC 框架中指标间的补偿性也逐渐成为学术界达成共识的开放性问题。Collins 等[57]介绍了一种评价BSC 中绩效指标间补偿的量化技术,指出使命和目的可能会随着势态和环境的变化而调整;并且,他们强调,BSC 是一种测度未来绩效的先导型指标而测度过去绩效的滞后型指标,如果实施恰当它将辅助组织明了目前的绩效在未来将通向何处。Ferreira 等[58]则讨论了以指标间补偿著称的MACBETH 为多准则决策方法与BSC 集成,得出应用MCDM补偿性功能刻画BSC 指标间的补偿对保障BSC 的实施和应用起到了关键作用。

接下来,综合上述医疗绩效评价框架、指标体系和绩效评价方法研究现状分析,可以归纳出医师绩效评价方法需满足以下要求和特点:

(1)维度间、指标间的补偿性:事实上,但凡涉及复杂多指标评价问题时,指标间补偿性(Compensate/trade-off/compromise)是绕不开且又深层次的问题,尤其在多准则决策过程中对指标补偿性的考虑又会对决策结果的准确性产生重要的影响,甚至会使最优方案的选择出现偏差。以医师绩效评价中的财务指标和公益指标为例,公立医院不可能以追求财务的最大化而牺牲公立医院公益性,需要协调和平衡二者之间的关系。尽管医师绩效维度、指标间的补偿性逐渐引起了学者的广泛关注,且已历经数十年的探索和攻关,但至今仍未能很好解决[59~61]

(2)指标间的因果关系分析:目前,在综合评价与多属性决策研究领域内,解决指标间相关性的主要途径均是采用诸如ANP,DEMATEL,ISM 等处理变量间相关或非独立情形的技术,但上述方法多数是通过主观影响的判断对复杂系统进行相关性分析。值得注意的是,最近该领域提出的CRITIC 作为一种客观权重确定方法,可以通过测度指标具备的信息量和相关系数进行权重确定,能够考虑到测度指标间具备的相关性也能够客观的得出结论,已在众多评价中得到了成功应用。本文尝试通过CRITIC 赋权方法来综合确定指标的权重,构建考虑指标之间相互影响特点的赋权方法。

(3)明晰优劣体现奖罚:无论绩效评价,还是医德考核等研究均已强调应体现出激励和约束的功能,更甚有学者断言“绩效考核不奖惩等于零”。此外,能明确地发现优劣,增强医德评价的直观性,使他们了解自己的优缺点,持续改进。绩效评价的目的是实现绩效分配公平公正,这就要求医院对超过预期水平的医师给予奖励,以表示正向激励医师保持好的工作行为,对于达不到预期的,则给予惩罚,反向告诫医师尽量消除不好的工作表现。然而,现有的评价方案无法体现对医师的奖惩性,且对于奖励或者惩罚的阈值也没有明显的界定和划分,评价的结果无法区分考评对象的差异性,也无法凸显考评工作的导向性。因而如若某些医师在诊疗过程中出现问题,也难以回溯问题出在哪些方面,更不可能提出针对性的改善措施,因此明晰优劣体现奖罚必要且迫切。

(4)多情景(势态)分析:随着实际问题复杂程度的增加,单一固定的决策模型已经不能满足复杂多变的现实情况。尤其在公立医院医师绩效评价过程中,可能由于评价主体、评价对象以及评价环境的多变性,而导致如果仅仅使用固定的参考点可能会影响最终评价结果的准确性。因而,为解决上述问题而衍生了可调、可变参考点这一多情景分析工具,并且该思想已经逐渐融入到了多种多准则决策方法之中。因为当参考解空间超出方案空间时有利于对潜在决策问题的深入探索,故而在参考点的设置过程中求解该参考值优/劣于传统多的正/负理想(最大)值的程度是十分必要的[56]

在参考点的设置过程中,参考解也并不总是唯一的和不变的。当决策者处于不确定的决策环境时,他会倾向于用多个参考解表达自己对决策方案的愿望[57]。这意味着如果决策环境产生变化,决策者的关注重心将随之变化,即决策参考点随决策环境变化而呈现动态特征,这也凸显出参考点的可调整性或者动态性。同时,前人的理论研究也侧面证实了参考点的可调整或动态性质。因此有必要对其进行深入研究,然而回顾现已形成的综合评价方法体系和多属性决策方法,尚未有一类方法能够满足上述要求。

3.奖惩型综合评价方法研究

(1)参照点设置的研究:涉及参照点的方法研究中呈现出乐于以平均或极端作为参考点的特点,未对如何具体设置做进一步交代,而侧重如何具体明确设置参照点的研究中缺乏对其相应的背景解释。Hu 等[62]延续战略管理中的绩效边界处风险偏好变化,提出了一种集成了存活点、成功点和标准参照点为一体的三参照点风险偏好模型。Luque 等[63]建议可通过中立、统计、投票三种方式定义期望(aspiration)与保留(reservation)水平,这是该类研究中为数不多的谈及参照点如何确定的文章。Ruiz 等[64]针对每一指标决策者建立多个参考水平,并且最终结果可以按照所在水平的位置进行解释。根据这些,采用不同参考水平允许人们能够对每项指标鉴别出最好的和最坏的,并且也为了提供方案到相对可持续目标的相对距离的评价。Giorno等[65]给出了6 种类型的标杆(基准):内部标杆、外部标杆、竞争标杆、非竞争标杆、绩效标杆和实际标杆。而事实上,跳出决策理论,体现着诸多与参照点相似思想和作用的概念,诸如基准/标杆(benchmarking)、标靶(target)、标准(standard)、锚点(anchor)、底线(baseline)等,上述概念均在各自的领域发挥着重要作用。

(2)关于价值函数的相关研究:达成标度函数是一个实数形式的价值函数,它结合了原始的指标函数和决策者的偏好。其中根据展望理论,价值是结果与参考点间差异的主观感受。其中最具代表性的为Ogryczak 三段线性指标达成函数,该模型利用愿望(aspiration)与保留(reservation)水平实现指标性能值以线性比率形式分段转化,从而实现指标性能值的价值化。Todeschini 等[66]将源于锦标赛选手排序的强弱率(PWR)模型延拓至多准则评价问题,提出了一种能够避免零除问题的加权PWR 和一种基于TOPSIS 贴近度思想的强弱比例得分。Mehlawat 等[67]利用比较两个三角模糊数的偏好强度函数定义了某一准则下的方案优于/劣于其余方案的精确优/劣得分指标,并采用贴近度形式集结优/劣得分形成排序方案的完全性能得分的模糊群多准则方法。随后,诸多学者希望清晰地分别关注指标性能高于或低于标靶的情况,研究得与失价值间的非对称和非线性关系,倡导结合实际情景在机制中加入惩罚与奖励因素。Liao 等[68]利用目标规划(GP)思想给出低于(under-)与超出(over-)达成度函数。Kumar 等[69]利用最优、最劣极端值和愿望水平构造了先增后减的两段式价值函数,其中展望理论得以广泛推广和应用,正是在于刻画收益和损失心理变化的非线性参数以及收益和损失非对称的聚合得以确定。彭飞等[70]归纳了展望理论中的参考点收益的分段线性加幂率价值函数与分段线性加指数价值函数后,提出了分段对数价值函数。Hu等[71]提出一种综合利用最优值与均值辅以先对数后指数作用的4 种指标类型的价值函数。杜丹丽等[72]定义了由最大、最小和无奖惩点转化的线性奖励、无奖惩、惩罚的价值函数,其中无奖惩点由最大与最小值的平均决定,奖惩间的聚合为奖惩守恒的互补(对称)规则。Voet 等[73]提出了一种解决递阶层次型指标体系的兼顾补偿性与重要性权重的评价方法,该方法将单项指标价值化为不可接受值、合理值和理想值三部分组成,进而提出了由最坏得分、最优得分和加权平均得分通过线性补偿形式聚合的方案价值函数,其中聚合规则细化为完全补偿、线性补偿和非补偿三种,该方法恰当地体现了奖优罚劣的思想。

(3)指标间补偿问题:补偿参数的选择依赖于问题类型和评价意图,具体包括大中取小(maximin)、大中取大(maximax)、最小化最大后悔(minimax regret)、等可能(equal likelihood)、Zimmermann 伽马算子及Uninorm 算子等[74]。蔡文等[75]提出的优度评价方法涵盖了“非满足不可的条件”的概念,在某种程度上解决了属性间的不完全补偿性的问题。Voet等[73]采用完全妥协、线性妥协以及无妥协3 种指标间的补偿方式应对分段的加权平均得分、最优得分与最劣得分间的聚合,发现多指标间整合也并非简单在完全补偿与不补偿间的调和,而还应深层次的考虑多指标共同作用的协同效应。著名学者苏为华等[76]通过对几何平均法、调和平均法和平方平均法的深入研究,指出指标间相互补偿现象普遍存在,但是补偿数量与变动数量的多少与指标间的差异程度大小有关。通过实证研究,徐新华等[77]发现调和平均法和几何平均法均存在指标间的超额互补,而广泛应用的TOPSIS 和VIKOR 法则存在指标间的欠额互补;同时,他也强调这一结果是在特定数据和特定方法下获取的,如若指标或数据被更换,互补结果则可能发生改变[77]

由上述分析可知,无论从绩效评价角度还是综合评价方法本身来说,从优劣角度研究评价方法成为该领域的一个新突破口,探索考虑指标优劣的评价方法具有普适性的价值。而针对每一指标同时考虑优势和劣势,其判断的参照解在现实中并非恒定不变。如前所述,价值函数呈现出非连续(分段状)或非线性,优劣间指标同样呈非对称(互补)特征,多指标间整合也并非简单在完全补偿与不补偿间的调和,而还应深层次的考虑多指标共同作用的协同效应。在实际评价中,将指标互补性和均衡性相联系,可明确评价方法的指标互补性特征,对于之后评价者据此选择适用的评价方法是十分重要的。并且,这种维度间或指标间不同的妥协情况背后反映的是不同决策情景和势态下决策者的不同决策倾向,在评价对象远离其均衡态时,超额互补表征着评价方法对指标间的非均衡态进行奖励,凸显了“鼓励搞突出、抓重点”的评价原则;欠额互补刻画出评价方法对指标间的非均衡态要求惩罚,强调了“鼓励均衡发展”的评价原则;等额互补表示评价方法对指标间非均衡态不奖不罚,体现了“取长补短式”的评价原则。

(4)指标间相关性研究:在公立医院医师绩效的评价考核过程中,作为现实中存在的客观复杂问题,必然存在指标间相互影响、相互呼应的问题,并且在众多学者应用BSC 框架进行的评价研究中,也对指标间存在的相关性有所指出。指标间的相关性研究也一直是多准则决策领域内的热点问题之一。测度指标间是否独立将会在决策矩阵建立之初就能够对后续决策逻辑产生影响,且针对实际问题分析来看,指标间具备错综复杂的关系正是符合实际决策问题的,在现实的复杂系统决策时,几乎不存在完美的独立指标,正是由于实际问题的多变性和复杂性,导致指标之间相互影响,进而对备选方案产生多种直接或间接的影响。

针对这种指标间的相关性问题,许多学者分别提出的了多种解决途径,其中ANP 作为复杂网络分析最为典型的分析工具之一,一直以来受到学术及社会各界的广泛关注。其在考核指标相关性而建立的决策矩阵,为后续的相关性分析,权重确定都奠定了基础。同样的DEMATEL、ISM、相关系数法以及认知图谱等复杂系统分析模型,都在算法的逻辑过程中融入了指标相关性的概念。DEMATEL 与ANP 的初始决策矩阵均为专家主观评价得出,但是由于没有客观数据的支撑一直是众多学者致力于解决的热点问题,同样相关系数法只考虑了指标间的相关性,没有同时兼顾指标间还可能同时存在的差异性会对结果产生的影响。针对上述问题,CRITIC 客观权重确定法是通过指标之间的辨别力与指标间的冲突性来表征指标的重要程度。首先,指标辨别力指的是在同一指标下,针对不同评价对象其评价值的取值差异程度,如果,该指标在不同评价对象评价中取值差异程度越大,说明该指标的辨别力越好;与之相对的是,指标在不同评价对象下取值差异越小,则说明该指标的辨别程度越差。一般情况下,用该指标的标准差来衡量指标辨别力的好坏。其次,指标冲突性指的是指标之间的相关程度,指标之间的正相关程度越大,则说明指标的冲突性越小;与此相对,指标之间负相关程度越大,则指标的冲突性越大。相关系数可以很好地测度冲突性的大小与方向。故而,CRITIC 因其卓越的优势成为众多客观权重确定模型受到了广泛的认可,并且对于公立医院医师绩效评估具有较强的实际适用性。