一、课题总体任务
(一)项目简介
项目《职务犯罪智能评估、预防关键技术研究》(项目编号:2017YFC0804000)由北京师范大学牵头,为国家重点研发计划重点专项项目。
项目包括四个子课题:课题一,犯罪社会关系网络分析技术研究;课题二,反腐案例特征发现与腐败案件发展态势预判研究;课题三,反腐信息评估与举报线索研判技术研究;课题四,反腐防控决策模型与评估系统研究。喻国明教授主持课题四《反腐防控决策模型与评估系统研究》,主要研究建立“反腐传播对策体系”新范式。
(二)研究总体目标
本课题围绕海量信息条件下制约纪检监察机关侦查、打击、预防腐败犯罪的办案效率的共性关键瓶颈技术问题,通过针对腐败犯罪线索智能甄别、犯罪目标对象识别、腐败案件发展态势推演与预判、腐败案件防控决策及评估等方面进行基础理论研究、共性技术攻关、系统集成开发和应用示范,到项目结题时,初步形成符合我国国情并与国际接轨的腐败风险评估与预防指标体系,在犯罪线索评估研判、犯罪对象智能识别、重点案件模拟推演、腐败案件防控决策与评估等方面取得重要成果,使我国打击和预防腐败的技术支撑更为坚实,在腐败惩治领域侦查、预警和防控相关关键技术水平上有明显提升。
(三)研究具体目标
第一,针对网络空间中海量多源异构腐败案件举报线索的碎片化、社会化、即时性等特点,本课题研究跨媒体多源异构反腐信息网络数据动态智能收集、犯罪防控知识库的构建、举报线索深层语义检测和真伪评估等技术和方法,研制开发覆盖国内外主要反腐信源的腐败案件线索发现与评估辅助决策系统,实现海量腐败案件信息与举报线索的智能梳理和甄别,为纪检机关进行高效案件线索综合分析研判提供有力的技术保障。
第二,以贿赂犯罪为主的职务犯罪社会关系网络具有多层级、动态时变、结构复杂等特性,相关线索数据具有多源、异构、动态、噪声多、时序性强等特性。本课题拟突破一般平面网络,立体建模动态演化的职务犯罪社会关系网络,结合线索网络,以多粒度学习框架和大数据智能计算思想为指导,构建职务犯罪社会关系量化体系,提取职务犯罪社会关系网络特征,研究职务犯罪社会关系网络建模、分析和挖掘方法,揭示职务犯罪社会关系网络的运行机制和演化规律,提出犯罪目标智能识别模型和多粒度证据链模型,研发职务犯罪社会关系网络的多粒度分析方法与软件原型系统、贿赂犯罪互联网数据取证原型系统和贿赂犯罪社会关系网络多粒度可视化原型系统,为职务犯罪辅助预防和侦察提供理论与技术支撑,解决以贿赂犯罪为主的职务犯罪“社会关系链发现和涉案目标对象智能识别”关键技术瓶颈问题。(https://www.daowen.com)
第三,围绕腐败案件调查侦办的实战需求,本课题研究海量多模态反腐案例特征自动发现和学习的方法,构建基于社会关系、证据链条和举报信息融合的案件推理模型,突破腐败案件可视化模拟推演技术,研制开发多维多模腐败案件模拟推演系统,实现对当前案件的模拟推演,提供侦查方向、减少不必要的侦查行动、节约侦查成本,显著提升纪检机关腐败案件查办效率和质量。
第四,本课题基于检察机关行贿档案系统,构建反腐防控决策模型,研究现阶段我国腐败犯罪的事实特征与发生机理,结合我国反腐败的政策及法律规定,借鉴国际社会反腐败经验,提出我国腐败犯罪的风险评估与主动防控的对策措施体系,并在有关单位推广应用,促进国家、社会腐败犯罪预防和治理能力的提升。
(四)项目主要研究内容
纪检监察机关不断完善民意调查、信息监测等机制,建立健全信件、电话、网络、短信“四位一体”的综合举报平台,充分发挥新媒体等信息平台作用,使反腐案件线索来源获得极大丰富,另外,大数据为反腐案件的侦破提供了有力支持。但举报信息的可信性、腐败案件的可预测性、犯罪预防的可控性等方面处于一种数据无序状态,主要体现在反腐信息举报线索甄别的复杂性、贿赂犯罪对象社会关系链的隐蔽性、腐败案件发展态势的不确定性,历史案例信息尚未得到深层次应用。为更好地发挥大数据与人工智能技术在反腐实战中的作用,结合项目指南中的要求,本项目拟通过“研究基于多源信息的职务犯罪社会关系网络分析技术”以解决犯罪社会关系链及目标对象识别问题,“研究海量多样反腐案例的特征发现和分析方法”,以解决腐败案件发展态势推演与预判问题,“研究反腐信息动态智能抓取、自动甄别评估技术”以解决举报线索自动甄别问题,“研发基于行贿档案信息的反腐防控决策模型”以解决腐败案件防控决策及评估问题。针对此四项关键技术的瓶颈问题,本项目拟开展的主要研究包括以下几方面。
【子课题一】职务犯罪社会关系网络分析技术研究。本课题围绕贿赂犯罪主体,利用电信、金融、财务、社交媒体等多源数据,针对职务犯罪社会关系网络具备动态、连续、立体的特点,利用多粒度、多层级的职务犯罪社会网络特征,对节点逐级展开构建细化关系子网,再结合职务犯罪社会网络特征中的时序分量建立演化序列,构建动态演化的职务犯罪多粒度社会关系网络,支持全方位犯罪主体社会关系查询与分析。本课题结合职务犯罪多粒度社会关系网络的数值特征和拓扑特征,综合运用深度神经网络、强化学习、单例学习、超限学习和集成学习,研究犯罪节点、链条和集簇的识别方法,构建目标对象识别的辅助决策模型,为职务犯罪侦查、预防提供相关技术支撑。
【子课题二】反腐案例特征发现与腐败案件发展态势预判研究。本课题通过对纪检监察机关历史案件的非结构化文本进行语义分析,从海量多样反腐案例中挖掘深层次语义特征,基于特定犯罪行为通常由特定行为和事件序列构成的假设,采用集成多维分析方法和序列模式挖掘技术,针对不同腐败案件类别分别进行特征序列模式挖掘,并构建可变维度犯罪嫌疑行为序列特征库。本课题研究具备时序特性的职务犯罪社会关系网络、举报线索网络的拓扑演化规律,分析不同粒度层次上犯罪线索链、社会关系链及犯罪证据链之间的拓扑结构与相互作用机制,实现融合线索链、社会关系链及犯罪证据链的案件“推理网络”,并采用基于群体智能的网络路径规划算法,在推理网络和线索网络上进行快速寻径,进行要案的时空推演,建立腐败案件发展态势预测和模拟推演模型,实现对腐败案件的发展趋势预测以及可视化模拟推演,为职务犯罪侦查、预防提供技术支撑。
【子课题三】反腐信息评估与举报线索研判技术研究。本课题围绕反腐线索主体,利用控申部门的多源异构举报线索数据、行贿犯罪档案数据以及案例库中的线索内容数据,构建反腐语义知识库,为反腐线索的收集以及举报线索的综合研判和辅助决策提供先验知识。本课题采用实时混合索引技术对海量数据进行实时检测,自动探测和识别网络信息中的反腐举报信息,动态抓取特定领域、人群的举报线索信息,全方位补充完善相关线索信息。本课题利用深度学习技术和计算语言模型,研究多模式模糊匹配过滤和动态自学习过滤方法,实现多源异构举报线索的真实性、置信度智能评估,以及反腐信息自动甄别。本课题通过反腐线索智能化整合,实现多源异构举报线索的综合研判和辅助决策。
【子课题四】反腐防控决策模型与评估系统研究。本课题研究构建具有通用型和量化特性的反腐防控理论模型,适应纪检、监察、检察等不同业务类型的反腐防控决策,并结合职务犯罪的特征模型及知识库,形成贿赂犯罪风险的量化分析模型。本课题基于行贿档案,结合电子卷宗、案件信息、案例数据等多源信息,通过行贿犯罪行为聚类与趋势分析、行贿犯罪手段识别、行贿主客体分析,构建反腐防控决策模型。本课题研发行贿档案综合管理与评估系统,辅助贿赂犯罪预防策略精准制定。
(五)研究的三个共性问题
首先,揭示腐败案件中多源线索在线特征发现与研判机理。针对多维度多模态腐败案件中多源线索的碎片化、低质等特性,本课题拟采用深度学习、在线挖掘与协同学习等方法对案件的语义信息进行多维度关联建模,实现案件潜层特征的自动发现。在此基础上,本课题通过腐败案件中时序的关联特征,挖掘案件演化的时间特性,构建融合时序特征的线索网络模型,进而构建融合时序特征的腐败案件发展态势推演模型。
其次,探索职务犯罪社会网络与线索网络交互融合规律。本课题基于传播学和社会学的社会网络分析原理,研究举报人与被举报人之间社会关系挖掘方法,发现潜在的社会关系链,并通过研究社会网络的动力学特性,研究职务犯罪社交网络的结构共性特性。在此基础上,本课题研究基于概率图模型的社交网络与线索网络交互融合方法,实现关系链与线索链的互相印证和融合,从而实现针对腐败案件举报线索研判及目标对象识别的辅助决策模型。
最后,构建面向职务犯罪防控的辅助决策与评估交互模型。反腐的关键在于犯罪预防,在建立系统的、完整的、动态的行贿档案信息系统基础上,本课题通过构建融合交互行为和不同职务犯罪等属性的情景感知模型,提出基于群体智能的社会、线索网络路径规划算法;通过设计基于上下文和焦点视图的路径可视化方法,实现在社会网络和线索网络上进行快速寻径;利用元学习理论,研究需求适配的模型与作用机理,解决寻径的动态优化问题,研究基于置信度评估理论的评估模型。