理论教育 故障诊断和健康管理技术优化方案

故障诊断和健康管理技术优化方案

时间:2023-06-24 理论教育 版权反馈
【摘要】:其主要完成平台状态监控及子系统之间交联故障的诊断、健康管理与冗余降级处置。

故障诊断和健康管理技术优化方案

1.子系统/部件测试性设计

部件的在线状态监控与故障诊断需要用部件进行测试性设计来实现。电子部件测试性设计以BIT为主要方式。电子部件依据不同的使用时机,规划了3种BIT:上电BIT、周期BIT、维护BIT。上电BIT是当系统接通电源时启动执行规定检测程序的一种BIT。当给系统通电时,上电BIT即开始工作,它无须操作人员的介入。周期BIT是以规定时间间隔周期地进行测试的BIT,是需要借助微处理器或计算机以及相应的软件进行故障判断和隔离的BIT方式。周期BIT在系统运行的整个过程中都工作,从系统上电的时刻开始直到电源关闭之前都将运行。周期BIT不干扰系统功能的运行,也无须外部的介入。维护BIT是在系统完成任务后执行维修检查测试的BIT。它通过显控终端的维修界面启动针对某子系统或部件的维护测试,也可通过外部测试设备启动一系列子系统测试。维护BIT给维护人员提供更多与故障有关的详细信息,并帮助查找故障和进行系统调整。

对于具有嵌入式微处理器的一般子系统电子部件,上电BIT一般应完成以下步骤:处理器测试、FLASH(或NVRAM)存储器测试、SDRAM存储器测试、中断功能测试、看门狗报警测试、看门狗正常测试、定时器定时功能测试、超时中断测试、串行口测试、模拟输入和数字输入测试。若上电BIT未通过,则有部件机箱或电路板上的指示灯指示故障。

子系统/部件以节点形式通过FC网络和FlexRay总线互联,这种架构有利于对电子部件进行LRU级的故障隔离。在网络或总线的信息架构下,要求每个挂接的电子部件进行BIT设计,周期BIT的主要内容是FC/FlexRay节点通信状态和工作状态监测,通过总线网络上传BIT结果,由平台级的状态监测和故障诊断程序对各个BIT结果进行关联性分析,最终确定故障部件。

2.综合处理机测试性设计

由于电子部件复杂程度、重要程度和工作特点各不相同,BIT设计的复杂度和内容也有所不同,两台核心机是整车功能实现的信息中枢,又一般在湿热、盐雾、冲击、振动、强电磁干扰等恶劣环境中,应比一般子系统的电子控制部件测试性设计的覆盖度更全面,因而也更复杂。

智能平台管理接口(Intelligent Platform Management Interface,IPMI)是由Intel、HP、Dell、NEC四家公司联合制定的一套跨平台管理和监控服务器工作状态的接口规范。IPMI规范是一个开放的免费标准,通过IPMI规范可以有效地检测计算机内部的物理特征,如各部件的温度、电压、风扇工作状态等。

IPMI规范的核心是一个专用芯片/控制器BMC(Baseboard Management Controller),与BMC相关联的是一组无源存储器,包括SDR(Sensor Data Record)、SEL(System Event Log)、FRU(Field Replaceable Unit)。其中,SDR中存储了系统中所有传感器的信息(包括传感器的位置、类型、门限值等);SEL用于存储系统事件日志(采集到的CPU状态信息、风扇转速信息、温度信息等信息);FRU存储了主板上各个系统组件的信息(设备序列号、部件号、型号、资产标签等)。所有的SDR、SEL及FRU信息也可存储在一片EEPROM芯片中。

IPMI规范提供了IPMB(Intelligent Platform Management Bus,智能平台管理总线)接口。IPMB基于I2C总线标准实现,用于实现主板上不同组件之间的通信。在工作时,所有的IPMI功能都是通过IPMI总线向BMC发送命令来完成的,命令使用IPMI规范中规定的指令,BMC接收并在SEL中记录事件消息,维护描述系统中传感器情况的SDR。BMC通过与主板上的不同传感器通信来监视主板系统的物理参数,并在某些参数超出其预置阈值时发出警报和日志事件。BMC从不同的传感器收集信息,存到本地的SEL作为系统事件日志,便于以后查询。综合处理机采用IPMI实现的BIT系统,能够实时采集信息处理模块、信号处理模块、图像处理模块及存储模块上核心组件的温度、电压信息,并转换为标准的消息格式发送给相应的控制器和管理软件,诊断并存储故障状况,这些信息同时会被发送到综合处理机的故障诊断与健康管理软件模块。综合处理机其他服务构件还会对CPU负载率、内存占用率、以太网端口状态等信息进行监测,通过FC网络发送给乘员终端显示,最终实现综合处理机的实时状态监控和故障诊断。

基于IPMI架构的综合处理机BIT原理框图如图7-8所示。

(www.daowen.com)

图7-8 基于IPMI架构的综合处理机BIT原理框图

状态监控单元是综合处理机模块内部状态监控、板卡控制的核心,选用STM32F051芯片。状态监控单元具备2路UART、2路I2C总线接口。其中,UART 1直接连接综合处理机模块的核心处理器,用于与处理器直接交互信息(如系统运行状态等);UART 2连接到板卡外部作为测试总线用于板卡内部功能测试通道;I2C 1用于连接板内I2C设备(如温度传感器、电源管理单元等),可以定时获取板卡内部各类信息(如温度、电压、电流等);I2C 2被连接到板外与其他板卡I2C组成测试维护总线。

电源管理单元提供板卡内部供电状态监控和供电控制功能。电源管理单元可以获取底板提供的各路电源的电压、电流信息,并在必要时可以通过I2C总线获取指令,针对某一路或几路电源进行关断、打开控制,用于在板卡内部出现故障时进行故障隔离和任务迁移。

3.平台层级诊断设计

平台级的在线状态监控与故障诊断需要平台级的测试性设计来实现,由车辆核心机内运行的故障诊断和健康管理软件模块实现。其主要完成平台状态监控及子系统之间交联故障的诊断、健康管理与冗余降级处置。故障诊断方法为基于规则的诊断推理和基于模型的诊断推理,通过建立子系统的测试性模型,获得故障模式和测试之间的相关性矩阵,作为诊断规则进行故障诊断依据。其包括以下功能:

(1)各车辆子系统工作状态与综合机电系统配电状态的交联故障诊断。

(2)推进系统下属各子系统之间的交联故障诊断。

(3)基于多个总线节点心跳监测的总线故障诊断。

(4)车辆工作参数监控;车辆参数一般包括行驶距离、车速、发动机摩托小时、发动机转速、驱动电机输出功率、弹药量、燃料平均消耗量、蓄电池荷电容量、环境气温、空气颗粒物监控信息、油液监控信息、变速器打滑、制动器磨损监控、地形探测、振动监控等。

(5)基于CPU负载率、内存占用率、以太网端口状态等信息监测的核心机健康管理与冗余降低处置策略。

(6)推进系统跛行模式、乘员舱系统降级模式(席位迁移)、综合机电系统省电模式、无人炮塔武器系统应急模式、综合防护系统应急模式。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈