2.5.2 理论依据

2.5.2 理论依据

1.智能集控数据采集需要统一标准并具有高可靠性和高稳定性

各清洁能源场站采集的数据复杂多样,必须建立统一的数据采集标准以规范采集范围、约束采集方式,实现不同协议类型数据的转换,统一支持多种程序接口如Modbus、OPC、103规约、104规约等电力系统标准接口。智能集控数据采集还应具有高可靠性和高稳定性;数据传输过程中必须考虑数据缓存机制,确定数据缓存策略及时间,保证数据的连续性和准确性。

2.智能集控数据需要高精度、实时、全量采集和全在线访问

智能集控管理设备的生命周期通常长达数年乃至数十年,为了从这些设备产生的数据中寻找规律,往往需要对较长时间跨度的数据进行分析,这就要求机器全生命周期内的数据都能被在线访问。

同时,与消费互联网领域相比,清洁能源智能集控领域对数据分析的要求往往更讲求精细化,例如高速旋转设备的故障诊断需要深入分析多达每秒千次的采样数据,要求无损全时采集数据。在大数据时代到来前,由于成本高的原因,进行机器全生命周期数据全时无损采集和全在线访问基本没有可能,往往只能在有限时间段内进行粗采样粒度的数据分析,造成许多应用无法实现。大数据时代的低硬件成本系统技术,使得机器数据无损全时全在线采集成为可能,这将极大释放应用创新的潜力。

3.智能集控设备管理需要考虑数据在物理世界的内在关联和工作机理

机器的工作往往遵循既定领域的自然原理,例如风电机组的工作和空气动力学有关,并受控制逻辑影响。机器和机器之间还可能有确定的关联,例如电网中设备之间的连接关系。设备大数据分析应用需要将数据和机器的工作机理、内在联系有机结合在一起,同时还要考虑机器工作的地理、天气等周边环境信息。

4.智能集控大数据分析和处理需要满足时效性要求

为了更好地通过数据来获取信息、制订策略,许多机器大数据应用都有时效性要求,如对设备故障的感知以及对预警预测的发现,而这些时效要求对于分析应用的效率提出了挑战。

5.智能集控资产全周期管理流程需要做到标准化

研究建立智能集控资产全周期管理模型,必须先梳理设备全生命周期管理业务,建立资产全周期统一的管理标准、流程及评估体系,在标准与体系的基础上建立平台化的资产全周期管理模型。不同实体通过平台的统一权限管理实现场站设备及物资、生产运行、检修计划、监督及安全管理的标准化及信息化管理。目前,很多清洁能源企业纷纷建立集中化生产运维监控平台。以大数据集控中心为支撑的运维模式的建立,大幅减少了场站现场的人员配置,增强公司的管控能力,整体经营效益得到明显提高,同时也极大地提升了并网发电效率,提高了区域电网的安全稳定运行水平。

数据在存入大数据平台后,往往会面临着对数据分析的实时性要求。大数据平台提供的各种查询接口效率参差不齐,其根本原因是每种查询引擎 (例如Hive、Impala、Hbase等)都是在功能完整性 (例如对SQL92的支持程度)和查询效果 (例如响应时间、资源消耗)之间进行取舍,并没有一种适合所有场景的大数据查询引擎存在。应用开发人员需要根据特定需求来选取合适的查询引擎,并且进行精心的查询优化 (例如分表、分区等),才能满足应用的需求。另外,行业应用对于机器数据的查询有很多特殊的需求,比如针对设备传感器产生的时间序列指标,有时需要查询一个模糊时间点 (数据库里面不一定有该时间点的对应记录)周围的数据,这类带有工业语义的查询,往往也要求应用开发人员能够熟悉底层查询引擎细节,才能高效实现。