三、对策建议

三、对策建议

从理论极限上看,应更好地利用司法人工智能挖掘和计算法官在绩效考评中的信息,而不应指望其能够促进法院管理理念、机构设置改革、具体制度建设的根本性变革。正好相反,管理理念的科学化、机构改革的去行政化、考评制度的可视化恰恰是司法人工智能在法官绩效考评中发挥自身优势的外部条件。这是因为,它更多的是为法官绩效考评体系提供标准化的基础,而无法真正触及法官内心的(基于社会职责)“使命召唤”(calling),也无法替代法官的主体能动性。[13]

从现实基线来看,尽管2008年的《案件质量评估工作指导意见》第22条就已强调评估指标的数据采集、整理、传输和指数编制由计算机自动完成和实时更新,避免和减少人为因素对评估的干扰,但智能化的水平并未有实质意义的提升。故应针对上述具体问题,努力做到以下几个方面:

第一,全面细化颗粒度。就笔者想到的而言,目前能够做的主要方面有:以某个案件或某类案件为视角展开指标体系,从而强化多种多层次数据和实体的对应关系;以服务当事人、社会公众的几大平台建设为依托,对职业道德、专业水平、工作能力、审判作风、公众满意度等以往难以量化考评的内容进行数据汇聚,并分析提炼出可能的细分指标维度(颗粒度),如公众满意度既包括案件自身正确与否、对今后类案的指导意义、对制度创新的助推(如作为司法解释直接来源的案例)和对社会治理创新的贡献(如网约车平台义务、责任的司法认定对平台治理的完善)等不同层面。

第二,深入挖掘关联度。颗粒度细化的同时也是关联度的显现。一方面,要深入发掘各具体指标之间的内在关联,为指标权数合理赋值提供基本依据。例如,调解撤诉率的设置不能偏离一定的阈值,否则将会产生“以判压调、虚假调解”等副作用。在操作层面,可以运用司法人工智能测量某法院或某个庭室范围内某类或某几类案由中调解率的平均水平及区间分布,发现案由和调解率之间的关联度;测度已知的虚假调解或“以判压调”案件中,法官的调解意愿、业务能力、当事人情况等,发现虚假调解、“以判压调”究竟与调解率的过高设置有何种程度的关联;测度不同案由的平均审判时长,合理确定不同案由的绩效考评的赋值等。另一方面,这种关联度挖掘还要延伸到与考评相关的其他环节。例如,法官结案数计值不能仅按照案件个数来“简单粗暴”地计算,而是要有平均审判时长、审判资源耗费等具体维度的分析和考量,这应在分案中有所体现,以保证起点公平。

第三,提升数据清洗技术。对于冗余数据,要善于根据经验进行逻辑分析,以清洗过滤出高质量的数据。兹以案件和法官社会评价为例加以阐释。一方面,此类因素多元复杂,既包括案件本身公正与否,也包括类案指导意义、制度助推、社会治理等方面,从而需要按照不同颗粒度进行结构化的梳理。另一方面,社会评价还具有非实时生成性的特点,有时需要经历一个较为漫长的过程才能“盖棺定论”,从而与当下的即时宣传、推介等并不总是一致的[14],同样地,裁判规则对社会制度创新的助推效果究竟如何,也只能通过事后相当长时间的验证,而非简单直观地根据是否入选“年度优秀裁判案例”等标准即可作出准确的判断。故而应当避免片面地以赠送锦旗数、当事人好评度、对外宣传量、是否入选优秀年度案例等指标考评案件社会效果,而是要丰富指标维度并对其层层分解、条分缕析;充分研判不同案件的不同侧重指标,有针对性地赋以不同的权重[15];适当拉长社会效果的测度周期,以保证其客观公正;多关注和提取富含有效信息量的数据,如相比胜诉方,败诉方对法官作出的正面评价可能更真实也更有价值。