3.1.3 核心平台非功能架构设计

3.1.3 核心平台非功能架构设计

3.1.3.1 安全性架构设计

1.安全防护体系建设

安全防护体系依照电力监控系统安全防护规定,以“安全分区、网络专用、横向隔离、纵向认证”为总体原则,抵御黑客、病毒、恶意代码等各种形式的恶意破坏和攻击,实现大数据创新服务平台的安全态势感知,保障清洁能源大数据创新服务平台的安全稳定运行。安全体系建设主要参考如下法律法规和行业标准:

(1)《中华人民共和国网络安全法》。

(2)《中华人民共和国计算机信息系统安全保护条例》(国务院令第147号)。

(3)《计算机信息网络国际联网安全保护管理办法》(公安部令第33号)

(4)《信息安全等级保护管理办法》(公通字 〔2007〕43号)。

(5)《计算机信息系统安全保护等级划分准则》(GB 17859—1999)。

(6)《计算机病毒防治管理办法》(公安部令第51号)。

(7)《电力监控系统安全防护规定》(发改委第14号令)。

(8)《关于加强工业控制系统信息安全管理的通知》(工信部协 〔2011〕451号)。

按照信息安全等级保护管理办法以及国网数据安全管理相关标准,建立清洁能源行业数据安全等级划分方法,并制定各安全等级的数据安全防护机制和策略。

安全防护体系主要由总体安全策略、安全防护技术和安全防护管理三部分组成。安全防护体系如图3-20所示。

(1)总体安全策略。面向清洁能源大数据应用需求建立总体安全策略,如基于身份的安全策略、基于角色的安全策略、基于规则的安全策略等,保障系统能够抵御黑客、病毒、恶意代码等各种形式的恶意破坏和攻击,实现大数据创新服务平台的安全态势感知,保障清洁能源大数据创新服务平台的安全稳定运行。

图3-20 安全防护体系

(2)安全防护技术。

1)物理安全:从安全技术设施和安全技术措施两方面对信息系统涉及的主机房、辅助机房和办公环境等进行物理安全设计。

2)通信网络安全:对信息系统涉及的通信网络,包括骨干网络、城域网络和其他通信网络 (租用线路)等进行安全设计。

3)区域边界安全:对信息系统所涉及的区域网络边界进行安全设计,涉及所需采用的安全技术机制或安全技术措施。

4)主机系统安全:对信息系统涉及的服务器和工作站进行系统安全设计。

5)应用系统安全:对信息系统涉及的应用系统软件 (含应用/中间件平台)进行安全设计。

6)数据安全:对信息系统涉及的数据及算法模型进行安全设计。

(3)安全防护管理。面向系统运维及应用人员,建立完整的安全防护管理制度与手段保障体系,包括组织与人员保证、安全管理制度、安全技术规范、安全培训、安全考核、技术监督等。

2.安全防护体系技术架构

安全防护体系技术架构图如图3-21所示。

安全防护体系技术架构主要功能层次如下:

(1)数据接入层。本层对于在接入路径中进行上传输的数据实施保护,如可以通过TCP-over-SSL来保证数据流和控制流通道的安全性,主要功能包括信道加密、接入认证、证书管理。

图3-21 安全防护体系技术架构图

(2)数据保护层。本层对于存储在系统中的数据,包括计算过程中产生的临时文件、日志文件、元数据、秘钥本身,通过数据加解密的方式提供数据保护,主要功能包括加密、秘钥管理、掩码。

(3)数据全生命周期管理层。本层针对信息系统的业务数据安全和系统服务连续性进行设计。定义数据的产生、存储、备份、恢复等密钥管理生命周期,主要功能包括本地备份、异地灾备、销毁。

(4)审计层。大数据分析管理平台的审计主要是数据和服务被访问痕迹的追踪。审计主要是通过对访问痕迹的追踪来判断用户对于数据的操作和服务的访问是否合规,主要功能包括数据访问痕迹、服务访问痕迹、数据泄露发现。

(5)访问控制层。访问控制是用户被赋予的对各数据、资源和服务访问的级别,没有相应级别的用户不可以访问数据或者服务,主要功能包括文件级访问控制、资源级访问控制、数据表级访问控制、数据列级访问控制。

(6)外控安全边界层。本层保证只有合法的用户才能登录和管理系统,当用户登录平台后需要划分不同的角色,每种角色只能进行相关的数据管理和系统管理操作,主要功能包括用户认证、网络隔离。

3.安全防护体系架构

基于人工智能技术的安全态势感知平台,提供多维智能威胁识别引擎,动态感知域间、域内的全面安全状态,实现设施、承载数据、人以及操作安全要素的提炼和动态评估,实现对网络关键风险的预测和响应。安全防护体系架构图如图3-22所示。

图3-22 安全防护体系架构图

安全态势分析平台主要功能设计如下:

(1)攻击识别,包括识别攻击行为、识别威胁、识别服务器群敏感操作、基于语义的后门深度识别。

(2)威胁分析,主要包括黑客指纹和画像、攻击过程还原和回放、事件分析、攻击溯源、基于主动和被动漏洞的检测分析。

(3)事件监管,主要包括云平台安全监管、漏洞管理和事件响应跟踪。

3.1.3.2 可扩展性架构设计

平台可扩展性主要包括存储可扩展性、计算可扩展性、服务可扩展性、算法模型可扩展性、应用可扩展性。

(1)存储可扩展性:平台存储层采用集群部署,基于平台的统一存储管理能力,可动态为集群添加机器,以增加系统存储容量。

(2)计算可扩展性:平台存储层采用集群部署,基于平台的统一计算引擎,可动态为集群添加机器,以提升系统计算能力。

(3)服务可扩展性:平台采用微服务架构,各类存储、计算分析、管理等功能以服务的形式进行部署、管理、提供,确保平台高可扩展,服务能力可按需扩展。

(4)算法模型可扩展性:平台提供算法库、模型库统一管理,随着清洁能源创新服务生态的不断发展,算法模型可按需动态添加到平台中统一管理中。

(5)应用可扩展性:一方面,基于运营机制,服务提供方可在应用市集发布应用,实现应用规模扩大;另一方面,应用运行支撑环境底层采用云计算平台提供计算虚拟化、存储虚拟化、网络虚拟化能力,视集中应用的能力可按需扩展。

3.1.3.3 可靠性架构设计

平台部署整体采用微服务架构、集群部署等技术手段,以提高平台可靠性。基于微服务架构,可将各类存储、计算分析、管理等功能以服务的形式进行部署、管理、提供,服务互为备份,避免单点失效,提供服务高可靠性;基于集群部署,可使各类存储、计算分析、管理等功能在集群各机器上冗余部署,实现负载均衡、统一服务,一个节点失效时任务传递给其他节点,确保平台高可靠性。

同时,为确保平台的高可靠性,采用多重可靠冗余保障技术,主要有应用级冗余、设备级冗余、链路级冗余等。

(1)应用级冗余:主要包含应用系统高可用备份方式部署模式,当应用系统主服务器出现问题时可自动切换到应用系统备用服务器以保证应用系统稳定运行。

(2)设备级冗余:包含服务器、交换机以及路由器等热备冗余。

(3)链路级冗余:主要包含两条电力调度通信通道,两条通道互为备份,当其中一条通道出现问题时可由网络设备判断自动切换至另一条通道,保证通信链路畅通。

3.1.4 部署架构设计

3.1.4.1 网络通道整体架构

网络通道整体建设方案,基于“双平面+分层+分区”的原则开展。网络通道整体架构图如图3-23所示。

(1)双平面设计:场站端至大数据中心采用双路纵向贯通,形成场站端至大数据中心生产业务一平面和二平面两套独立的互备系统,实现数据双设备采集,双路传输,双路汇聚处理,确保数据采集和传输的可靠性。

(2)分层设计:场站至大数据中心分级接入,综合光缆资源、传输网拓扑、现有设备情况及运维管理要求,选择清洁能源汇聚站点新建光传输及网络设备形成汇聚节点,再通过共用的专线链路上联至大数据中心,提升传输通道利用率。

(3)分区设计:根据业务重要性和特性设立安全Ⅰ区、安全Ⅱ区、安全Ⅲ区及互联网区,并在各区域间采取有效的安全隔离措施,确保场站实时生产业务接入Ⅰ区,非实时生产业务接入Ⅱ区,管理业务接入Ⅲ区,满足 《电力二次系统安全防护管理规定》(电监会5号令)。

图3-23 网络通道整体架构图

汇聚层架构图如图3-24所示。综合光缆资源、传输资源、现有设备情况及运维管理要求,选择地调1~地调n 作为汇聚层节点,建设双平面及汇聚所需的光传输、网络设备,通过CPOS板卡的互联实现各个站点的汇聚,再通过共用的专线链路上联至大数据中心。

3.1.4.2 安全Ⅰ区、 Ⅱ区部署架构

安全Ⅰ区、Ⅱ区内服务器组按照功能分为前置服务器集群、数据转发服务器集群、监控服务器集群、管理服务器、数据代理服务器集群与功率预测服务器集群。安全Ⅰ区、Ⅱ区的负载均衡设备可以为服务器提供物理设备的负载服务与服务应用的负载服务,使用虚拟化、高可用性的动态资源分配、虚拟机迁移、容错等技术,最大程度保证虚拟化设备、系统的可靠与稳定,物理机和虚拟机两种技术结合实现安全Ⅰ区、Ⅱ区内服务器集群的安全、稳定与高可用性。

网络链路采用双平面设计,保证通信链路与网络设备的冗余,最大限度预防由网络设备故障引发的通信链路中断问题。安全Ⅰ区、Ⅱ区部署架构图如图3-25所示。

图3-24 汇聚层架构图

图3-25 安全Ⅰ区、 Ⅱ区部署架构图

安全Ⅱ区与其他区数据流关系图如图3-26所示。安全Ⅱ区的主要功能是部署功率预测数据服务来解决安全Ⅰ区、安全Ⅲ区、调度预测数据上报平台的数据交换问题。该服务主要包括气象站数据转发、超短期上报、短期上报、日志管理、正向数据代理、反向数据代理等。

正向数据代理功能提供从安全Ⅱ区到安全Ⅲ区的数据单向转发服务。通过正向隔离把安全Ⅰ区、安全Ⅱ区的数据转发至安全Ⅲ区。

反向数据代理功能提供从安全Ⅲ区到安全Ⅱ区的数据单向转发服务。通过反向隔离把安全Ⅲ区的数据转发到安全Ⅱ区。

图3-26 安全Ⅱ区与其他区数据流关系图

气象站数据转发主要是把气象站的数据通过正向隔离装置发送给安全Ⅲ区以供集中功率预测使用;超短期上报是把反向数据代理获取的超短期功率预测结果定期上报给调度;短期上报是把反向数据代理获取的短期功率预测结果定期上报给调度;日志管理收集并记录上报情况及调度收到的反馈信息,并把这些记录通过正向数据代理传回集中功率预测服务,供集中功率预测服务的上报状态显示和上报率计算。

3.1.4.3 安全Ⅲ区部署架构

安全Ⅲ区内服务器区的功能有数据接收与收集、数据流处理、分布式存储分析、应用服务、应用运行管理、应用运行环境、运营管理、集中式存储集群、超算集群。安全Ⅲ区通过正向隔离接收安全Ⅱ区传输过来的各类异构数据,实现一体化存储;通过强隔离接收安全Ⅳ区传送过来的互联网数据,并提供数据一体化查询与分析、集中式存储、高性能计算等服务。大数据平台部分采用物理服务器,运营平台部分采用虚拟化技术。安全Ⅲ区部署架构图如图3-27所示。

3.1.4.4 互联网区部署架构

互联网区内服务器组按照功能分为气象数据下载服务器组、强隔离设备代理服务器组、应用服务器组。互联网区的主要功能是下载气象数据,并且通过强隔离代理服务器转发至强隔离设备,然后传输至功率预测服务器区。互联网区接收安全Ⅲ区大数据平台的运算数据,通过应用服务器对外网用户提供移动应用展示。互联网区服务器组同样使用虚拟化技术与负载均衡设备相结合的方式,实现互联网内服务组的安全、稳定与高可用性。互联网区部署架构图如图3-28所示。

3.1.4.5 分区域部署架构

分区域部署架构图如图3-29所示。

分区域部署架构采用“1+N”的模式,即1个中心平台+N 个区域分中心,其中中心平台集中存储各区域分中心上传的数据,区域分中心存储从场站端/服务现场端上传的数据。

图3-27 安全Ⅲ区部署架构图

图3-28 互联网区部署架构图

图3-29 分区域部署架构图

通过建设数据交换和集成平台,实现中心平台与区域分中心的数据集成,根据业务合规和时效性要求部署应用服务,提供全量同步上传数据、控制本地执行等功能。

3.1.4.6 分功能部署架构

根据平台运行需求,分功能部署架构图如图3-30所示。

生产环境、准生产/测试环境部署在安全Ⅲ区,探索环境部署在互联网区,主要设计如下:

(1)生产环境,面向终端用户的系统环境,负责部署生产应用、模型结果发布。

(2)准生产/测试环境,面向开发人员的准生产/测试环境,负责生产数据应用测试、准模型评价验证。

(3)探索环境,面向分析人员的探索环境,负责脱敏数据应用测试、模型评价比对、模型更新测试。

生产环境、准生产/测试环境、探索环境,三个功能环境通过平台之间的标准接口实现应用部署、数据流之间的流转,主要设计如下:

图3-30 分功能部署架构图

(1)应用部署。应用部署是在探索环境开发的公测探索应用,通过模型评比规则、评比结果公示、优胜模型导入等孵化流程,进入准生产/测试环境,形成准生产测试应用。之后,通过模型管理制度、准模型导入等模型成熟度评估,进入生产环境,形成生产应用。

(2)数据流。生产环境作为数据流源头,提供电源数据、电网数据、负荷数据,测试人员可通过抽取工具将数据子集抽取到准生产/测试环境形成测试数据。同时,可基于数据管理制度应用数据脱密工具形成公开数据发布到探索环境,以供应用开发人员使用。