详情

RESS:基于数据驱动贝叶斯网络的具体场景下货运铁路事故致因分析

Release Time:2023-12-29 Read:302

前言

近日,北京交通大学先进轨道自主运行全国重点实验室贾利民教授、马小平副教授等的研究成果,发表于SCI一区Top期刊《Reliability Engineering and System Safety》(IF=8.1)。论文题目为“Causative analysis of freight railway accident in specific scenes using a data-driven Bayesian network”即基于数据驱动贝叶斯网络的具体场景下货运铁路事故致因分析。工管所张志鹏副教授参与,第一作者为北京交通大学陈熙元。

DOI:DOI:http://doi.org/10.1016/j.ress.2023.109781

研究概述

 

01研究目的

货运铁路作为典型复杂大系统,其事故场景具有复杂性和多样性,本研究的主要目的在于对比分析不同场景下的事故致因分布,挖掘各具体复杂场景下的主要事故致因并计算其风险。

02研究方法

提出了一种数据驱动的贝叶斯网络(DDBN),该网络以代表事故场景元素、事故致因和事故后果的随机变量为节点,以节点之间的条件依赖关系为边,用于辨识复杂多样的事故场景中最重要的事故致因。首先,考虑到数据的连续和离散状态,提出了一种无监督-监督的方法来定义DDBN中节点的状态;其次,设计了一种贪婪算法来挖掘节点间的因果关系序列,并据此确定DDBN中边的方向;然后,提出了一种NB-K2-MLE方法从数据中学习DDBN的网络结构和参数;最后,构建了基于DDBN的风险计算函数,用于计算各个具体场景下不同类型潜在事故致因的风险。

03研究结果

在基于真实的事故数据的实证分析中,DDBN的推理正确率达到87.92%,精确度和召回率均超过70%。更重要的是,研究结果表明,事故致因的分布会随着场景的具体化而集中,宏观层面的主要事故致因并不能完全适用于具体场景下的事故预防。

04研究意义

本研究所构建的DDBN可为在复杂多样的具体场景下确定主要事故致因和制定有针对性的事故预防策略提供数据支持。

 

01、引言

 

货运铁路在国民经济中发挥着重要作用。货运铁路事故的发生容易造成巨大的财产损失、人员伤亡和环境破坏。了解事故致因有助于制定有针对性的事故预防策略。

以往的事故致因研究多集中于宏观层面,缺乏对具体事故场景下的事故致因分析。在宏观层面上,事故致因的分布和主要事故致因是相对固定的。但在微观层面上,事故致因的分布和各事故致因的重要性随着事故场景的变化而动态变化。在不同的场景下,同一类型事故的主要原因可能有很大差异,应采取不同的事故预防策略。例如,事故致因“轨道积雪”的重要性在冬季高于夏季,夏季绝不会采取轨道除雪等事故预防措施。考虑到实际生产过程中的安全风险管理往往面向特定的场景,从微观层面识别具体场景中的主要事故致因,对于制定针对性的预防措施,提高货运铁路的安全性具有与从宏观层面分析事故致因同等重要的意义。

分析具体场景中的事故致因面临两个挑战:第一,货运铁路作为一个典型的复杂的系统,事故场景复杂多样。复杂性是由于货运铁路事故的场景要素众多,而各个场景要素之间并不是相互独立的,而是有着复杂的相互作用关系(如天气条件会影响事故场景中的温度)。场景的复杂性进一步导致其多样性。由于众多场景元素中的每一个都至少有两种可能的状态(例如天气条件可能是晴天或雨天),当各场景要素取不同的状态时,可以组合出大量的潜在事故场景。第二,事故致因类型众多,包括设施设备故障、人为错误、环境因素等,且事故致因与事故场景中各要素间存在复杂的关联关系。

作为网络模型和概率论的结合,贝叶斯网络(BN)为系统性分析事故场景和事故致因提供了一种有效的建模框架。首先,与统计回归和传统的安全工程方法相比,BN和网络模型一样,已被证明在描述事故致因和结果的复杂组合方面具有显著优势。其次,与传统的网络模型相比,BN具有独特而重要的优势:当BN中某些节点的状态信息被获得时,BN可以通过前向传播和后向推理更新其他节点状态的概率分布。考虑到事故致因的分布具有动态性,且随事故场景的不同而不同,BN更适合于基于各种场景元素推断事故致因的分布和风险,因为它提供了一种严格的概率动态更新和推理机制。

BN的构建方法可以分为基于专家的和基于数据的两大类。基于专家的方法可以提供专家独有的深入间接,例如确定数据中没有反映的因素。然而,由于BN在传统网络模型的基础上融入了概率论,在构建BN时需要设置大量的网络参数。经计算,本研究所构建的DDBN共有58,170个可解释的参数。在这种情况下,基于专家的贝叶斯网络构建存在两个问题:首先,仅仅依靠专家来确定数万个参数的值会导致计算负担过重,这是难以承受的。其次,基于专家经验的评分信息可能是主观、模糊,甚至是不准确的,因为专家很难在微观层面上以概率形式清楚地提供多个参数。

由于基于专家的方法的局限性,人工智能和机器学习领域的许多研究已经为从数据中学习BN提供了K2、Tan等方法,并得到了广泛的应用。然而,现有方法在节点状态确定、节点排序、关键节点和特征节点间关联关系挖掘等方面仍然存在一些问题,并不适用于本研究。

为此,本文提出了一种数据驱动的贝叶斯网络构建方法,克服了基于专家的方法和现有的基于数据的方法的局限性。在此基础上,建立了面向货运铁路事故的数据驱动贝叶斯网络(DDBN),用于研究复杂多样的具体场景下事故致因的分布及各事故致因的风险。

 

02、数据

 

选用了2011-2020年美国联邦铁路局(FRA)铁路设备事故数据库(REA)中记录的货运铁路事故数据,构建了一个包含15, 935个事件数据的数据集。如图1所示,其中包括9475起脱轨事故、1540起碰撞事故、1092起道口事故、356起火灾/爆炸事故和3472起其他事故。

基于卡方检验,选取REA数据库中记录的17个对事故致因分布有显著影响的场景变量来刻画货运铁路事故场景。如表1所示,这些场景变量被分为四类:时空环境条件(En)、轨道状况(Tk)、列车状况(Tn)和信号控制方法(Sc)。

如表2所示,FRA将所有事故致因分为5个大类和30个子类,包括轨道、路基和建筑物,信号和通信,机车车辆故障,人为因素和其他类型事故致因。

03、方法论


3.1节点状态定义

为了建立一个数据驱动的货运铁路事故网络模型,第一步是将网络中每个节点的状态离散化为几个独立的类别。与连续数据相比,离散化状态更接近于知识层的表达,更易于理解。合理的状态定义可以大大提高算法的效率和抗噪能力,它还可以使模型结果更加稳定。一个关键问题是如何找到一种符合数据特征和客观逻辑的状态定义方法,以避免离散化带来的信息丢失。

有监督方法通常在这方面取得更好的结果。但在单个事故数据样本中,各节点的状态大多是单一的、固定的,缺乏统计意义,这导致直接采用监督离散化方法很难达到理想的效果。为此,本文创新性地提出了一种无监督-有监督相结合的方法。首先,使用无监督的方法将节点状态离散为多个小区间,用于挖掘数据特征。然后根据数据特征采用有监督的方法进行区间合并,以保留信息。

3.2节点因果排序

因果排序的确定为挖掘节点间的关联关系提供了确定因果方向的依据。正确的因果排序是铁路货运事故网络模型学习的重要输入,是正确的网络结构的基础。然而,完全基于观测数据确定因果关系的方法目前还不成熟。现有的数据驱动方法容易将数据相关性误判为因果性,由此产生的较大因果误差会严重影响模型学习的效率和结果的正确性。

为此,创新性地提出了两步因果排序方法。首先对节点进行分类,并基于系统安全事故因果链确定不同类型节点之间的因果排序。然后,设计了一种贪婪算法来挖掘相同类型节点之间的因果排序。

3.3DDBN的结构和参数学习

提出了一种数据驱动的NB-K2-MLE方法,用于学习货运铁路事故的DDBN。该方法能够在全面保留关键节点关系的基础上,充分挖掘关键节点以外的其他节点之间的关系,弥补了现有数据驱动方法的不足。该方法包括四个步骤。首先,将网络中的节点定义为关键节点和其他节点。其次,挖掘关键节点与其他节点之间的关系,构建NB模型。然后,学习关键节点以外的节点之间的关系,并将其添加到NB模型中,以构建场景驱动的货运铁路事故BN的结构。最后,从数据中学习所构造的BN的参数。构建出的DDBN如图2所示。

3.4风险计算函数

事故风险通常是指事故发生的可能性和后果的组合。所构造的DDBN可以推断出不同原因导致的事故发生的相对概率,以及该场景下事故造成不同等级经济损失、人员受伤和人员死亡的概率。

基于此,提出了一种基于DDBN的事故风险量化函数,直接量化事故后果和事故风险。其中,事故后果可以用事故损失来衡量,包括事故造成的经济损失、受伤人数和死亡人数。

 

04、计算结果

 

4.1DDBN的有效性验证 


如图3所示,基于三大公理对构建出的DDBN的有效性进行验证。结果表明,构建出的DDBN符合三大公理,具备有效性。

4.2具体场景下主要事故致因推理

使用2021年FRA-REA数据库记录的1435起真实货运铁路事故数据进行实证分析。当任意两起事故的事故类型和关键场景要素的状态相同时,将这两起事故归为一类,代表它们具有相似的事故场景。基于上述方法,将1435条事故数据分为512类,对应512类事故场景。

在实证分析中,132个事故场景中发生过3起以上的事故,这些事故场景被定义为高风险场景。在所有高风险场景中发生的事故总数达到983起,约占总数据的70%。基于构建的DDBN,对132个高风险事故场景中的事故致因分布进行推理,将占比最高的n个事故致因(n为真实事故数据中主要事故致因的个数)判断为对应场景下的主要事故致因,其他事故致因被判断为非主要事故致因。将模型推理出各场景下的主要事故致因与实际事故数据中的主要事故致因进行比较,验证DDBN的推断准确性。

结果表明,所构建的DDBN推理正确率达到87.92%,精确率和召回率均超过70%。DDBN在发生m起以上事故的事故场景中推理的精确率如图4所示。其中,DDBN在30起以上事故现场的推理准确率达到78.37%。

4.3典型具体场景下事故致因风险分析

本节以脱轨事故为例,计算并比较了宏观层面和具体场景下脱轨事故的致因分布和各致因的风险。

如图5所示,基于DDBN推理出脱轨事故宏观层面的事故致因分布,并基于3.4节提出的风险量化函数计算出各致因的风险。可以观察到,在宏观层面上,轨道等基础设施故障(T)、人为因素(H)是脱轨事故的主要原因,T2、T1、H3、H7、H5、T3导致脱轨事故发生的占比较大,而T2、T1、M1、H3导致脱轨事故发生的风险较高。

从2021年FRA记录货运铁路脱轨事故数据中,选取了4个货运铁路脱轨事故的典型具体场景。

具体来说,首先基于表示轨道类型的三个场景元素对脱轨事故进行分类,,选择事故次数最多的两个货运列车脱轨场景作为Scene 1和Scene 2。

Scene 1: Tk1=4 (Class 4 Track), Tk2=1 (Main track), Tk3=1 (Continuous welded rail track), Tn1=1 (Freight train).

Scene 2: Tk1=1 (Excepted or Class 1 Track), Tk2=2 (Yard track), Tk3=0 (discontinuous welded rail track), Tn1=1 (Freight train).

在Scene1的基础上,进一步将列车类型、环境等场景元素引入到具体场景的构建中,得到Scene 3和Scene 4。其中,Scene 3是通过引入季节、温度和天气条件等表示环境的场景元素而获得的,而Scene 4是通过引入列车速度和载重等表示列车状况的场景元素而获得的。

Scene 3: Tk1=4 (Class 4 Track), Tk2=1 (Main track), Tk3=1 (Continuous welded rail track), Tn1=1 (Freight train), En1=4 (Winter), En4=1 (Temperature less than 10℉), En5=4 (Snow).

Scene 4: Tk1=4 (Class 4 Track), Tk2=1 (Main track), Tk3=1 (Continuous welded rail track), Tn1=1 (Freight train), Tn2=4 (Speed 34 to 51mph), Tn3=4 (Load 8440 to 16,883 tons).

对四个典型具体场景下主要事故致因和风险分布进行了推理和计算,如图6所示。

可以观察到,在Scene 1中,E5和E6导致事故的比例最高,分别达到33.12%和19.75%。M1造成事故的占比排在第3位,但风险最高。在Scene 2中,T2引发事故的占比最高,接近20%,其次是T1、H7、T3、H5、H3,占比在10%左右。

在Scene 1的基础上,Scene 3中M1造成事故的占比明显上升,与E5造成事故的占比接近,均超过30%。此外,E5引起的事故占比达到21.25%,T2引起的事故占比达到2.16%,其他原因引起的事故占比均小于1%。在Scene 4中,E5引起事故的占比显著上升至72.06%,其次是E6引起事故的占比,达到14.35%。虽然M1造成事故的占比仅为2%,但风险值略高于E6。

05、讨论

 

在计算结果中,基于三个公理证明了所构造的DDBN是有效的。在基于实际货运铁路事故数据的实证分析中,DDBN的推理准确率达到87.92%,精确率和召回率均超过70%,这在进一步证明DDBN有效性的基础上,表明DDBN能够准确地推理出各种具体场景下的主要事故致因。

此外,图4显示,被模拟的事故场景中曾实际发生过的事故越多(训练数据样本越多),DDBN的推理精度就越高,这也符合实际应用中更加关注风险较高的事故场景的需求。事实上,这种现象主要是由于在构建BN时使用了数据驱动的方法。数据驱动的方法允许根据新的事故数据调整和优化DDBN中的参数,从而提高了DDBN的推理精度。考虑到货运铁路事故的特征不是固定不变的,而是随着政策的出台和设施设备的更新而变化的,采用数据驱动的方法构建的DDBN可以随着训练数据的更新而定期更新,比基于专家的方法更能适应事故特征的变化。

从风险分析结果可以观察到,宏观层面的主要事故致因并不完全适用于具体场景。例如,以前的研究表明,轨道几何缺陷(T1)和断轨(T2)是货运铁路脱轨事故的主要原因,这在宏观层面上是完全正确的。但在一些具体场景中(例如Scene 4),T1和T2造成的脱轨事故的总占比不到1%。

此外,脱轨事故的主要致因在不同的具体场景可能会完全不同。例如,在Scene 1中,E是事故的主要原因,E5和E6造成事故的占比之和达到了52.86%。然而,在Scene 2中,事故的主要致因变成了T和H,E5和E6造成的事故的占比之和不到2%。

另一个值得注意的现象是,事故场景越具体和细化,事故致因的分布越集中。Scene 0中事故致因占比的方差为0.0017。在Scene 1和Scene 2中,方差值分别为0.005和0.003。在Scene 3和Scene 4中,方差值分别为0.009和0.02。可以观察到,在宏观层面,脱轨事故的可能原因数量很多,但在微观层面的具体场景中,值得特别关注的事故致因可能只有少数几个。

因此,本研究可以为具体场景下制定有针对性的事故预防策略提供数据支持。例如,在Scene 1和Scene 4中,应该增加机车和车辆关键部件(如车轴、径向轴承和车轮)的维护或更换频率。在Scene 2中,增加对轨道、道岔等轨道设施设备的检查次数,在道岔切换等关键环节采用双重或人机双重检查等冗余设计,减少人为失误造成的事故。在Scene 3中,要有针对性地部署监测降雪的传感器,并及时组织轨道除雪。

但需要注意的是,这项研究主要目的在于分析具体场景下各种事故致因的概率和风险,而不是比较不同场景之间的风险大小。因此,这项研究本质上属于风险分析,而不是风险评估。在今后的工作中,各具体场景中发生的事故数量将被纳入模型,以确定风险是否处于需要采取对策的水平。

在推理精度方面,考虑到事故发生的小概率性和随机性,对事故的准确推理及预测一直十分困难。事实上,以往很多与事故相关的预测方法缺乏对预测精度的关注,或只显示有限的预测结果。由于本研究更关注事故场景要素与事故致因与风险间的关联关系,本研究所构建的模型必须具备良好的可解释性,以帮助理解各种场景元素对事故致因分布的影响。但在推理精度方面,一些深度学习方法可能更具优势,这也是我们未来的研究方向。

 

06、结论

 

本研究主要分析了由多个场景要素组成的复杂多样的具体事故场景中事故致因的分布和风险。提出了一种数据驱动的贝叶斯网络构建方法,以支持具体场景下的事故致因和风险分析。

研究结果表明,宏观层面的主要事故致因并不完全适用于微观层面的具体场景。事故致因的分布会随着场景的具体化而越来越集中,同一类型事故的主要致因在不同的具体场景中可能完全不同。所构建的DDBN能够在多种复杂的具体场景下实现准确的事故因果推理,对真实的事故数据的推理准确率达到87. 92%。

DDBN的推理结果可以为具体场景下制定有针对性的事故预防策略提供数据支持。此外,与基于专家的方法相比,采用数据驱动方法构建的贝叶斯网络能够随着训练数据的更新而有规律地调整和优化参数,从而实现更高的推理精度,更好地适应货运铁路系统特征的变化。

在今后的工作中,将考虑不同场景中发生的事故数量,以确定事故致因的风险是否处于需要采取对策的水平。此外,将探索基于深度学习的方法,以进一步提高推理的准确性。


Copyright 20120 (c) 西捷国际工程咨询有限公司 All Rights Reserved. 技术支持:天顺网络