[0009] 针对供水管网暗漏恶化趋势不可逆转特点,本发明提出一种基于动态过程的管网暗漏识别方法,旨在识别供水管网中潜在的暗漏区域,以便及时发现具体暗漏点。
[0010] 为实现以上目的,本发明采取以下步骤:
[0011] 步骤1、求解供水管网压力监测点敏感度矩阵
[0012] (1)压力灵敏度矩阵
[0013] 采用EPANET为供水管网建立水力模型,给节点n添加一个射流器系数的形式模拟漏损,可得监测点i压力的变化值ΔHi和节点n自身压力变化值ΔHn,从而求得监测点的灵敏度系数λni,即可从数学角度量化节点之间由于漏损造成的压力变化,如式(1):
[0014]
[0015] 据此,可计算得到所有压力监测点的灵敏度系数矩阵为:
[0016]
[0017] 其中,管网节点总数为N,压力监测点总数为I,第N行代表节点N出现漏损时,对管网所有压力监测点的影响系数向量。
[0018] (2)极差标准化
[0019] 对压力灵敏度矩阵M采取极差标准化处理,得到矩阵M′:
[0020]
[0021] 其中,lNI′的求解如下,
[0022]
[0023] 上式中,max‑min代表列向量lkI中的最大值与最小值之差。经过极差标准化之后矩阵M′中任一元素取值范围在[0,1]之间。
[0024] 步骤2、基于K‑means++聚类将管网划为若干漏损分区
[0025] K‑means++聚类克服了传统K‑means聚类算法容易陷入局部最优的问题,可以较好地得到全局最优聚类分区。K‑means聚类存在随机选取聚类中心的缺陷,K‑means++改进算法最核心的原则是使初始聚类中心之间的相互距离尽可能远,期望选择到较优的聚类中心。其主要思想如下:
[0026] (1)在目标数据中随机选取某一样本数据作为第一个初始聚类中心C1;
[0027] (2)分别计算每个样本数据与已确定聚类中心之间的最短距离Dx,设定每个样本数据被选为下一个聚类中心的概率由式(5)求得,之后按照概率选择距离最大的样本作为聚类中心;
[0028]
[0029] (3)重复步骤(2),最终可得到所有的聚类中心。
[0030] (4)利用传统K‑means算法计算样本与各个聚类中心的相似度,以最小化欧式距离为度量标准,得到指定的k个漏损分区结果。
[0031] 关于漏损分区个数应根据供水管网的实际情况合理确定,综合考虑到分区的面积、监测点数量以及管理的效率等因素,这里基于每个监测分区至少有一个压力测点的原则进行分区。
[0032] 步骤3、设计暗漏过程仿真实验,生成暗漏样本
[0033] 实际供水管网中发生的暗漏往往存在一个累积发展的过程,短期内的水力状态变化都不显著。因此,暗漏分析须建立在一定时期的动态过程之上。为尽量模拟真实管网暗漏动态过程,每组仿真实验将试行10次单漏点漏损24小时延时模拟,逐次增加漏点的射流器系数,以形成反映暗漏发展趋势的样本数据。
[0034] 漏损节点射流器系数的取值应合理反映实际漏损流量占比。为有效分析暗漏节点对管网压力的影响,所选择的射流系数(1)不应过小:根据EPANET默认的水力计算精确度,添加射流器系数后的漏损点压力变化至少在0.01米水柱才能和正常工况有所区别。(2)不宜过大:射流器系数偏大时,泄漏可造成压力的明显下降,所需流量大幅上升,容易被察觉,不再是暗漏情形。
[0035] IWA漏损控制小组给出的暗漏建议标准如表1所示:
[0036] 表1 明漏和暗漏的流量界限
[0037]
[0038] 参考表1的基础上,同时结合实际漏损情况,射流器系数的设置应参考具体管网相应的用水规模,同时避免暗漏淹没在正常需水量变化之中,暗漏点最小射流器系数设置为0.1,最大设置为1.5。
[0039] 为体现暗漏逐渐增大的动态过程,在每组10次仿真实验中令相邻两次实验的射流器系数变化的最小间隔为0.1,根据先前设定的范围,共可得到 种不同的射流系数组。如表2展示其中若干组。
[0040] 表2 暗漏射流系数组
[0041]
[0042] 为贴近实际管网用户的需水量波动情况,对所有需水量模式乘子添加高斯噪声N[0,0.05*dn(t)]或者N[0,0.1*dn(t)],其中dn(t)代表节点n在t时间点原先的需水量乘子。
[0043] 具体的暗漏过程仿真实验设计步骤如下
[0044] (1)随机选取一个管网节点,从表2中任意选择一组暗漏射流器系数。
[0045] (2)在EPANET上设置暗漏射流系数组第一次的系数,同时添加指定的需水量噪声。模拟步长S(5分钟
[0046] (3)不改变节点,选择下一次的暗漏射流系数,同时添加指定的需水量噪声。记录测点的时序数据。
[0047] (4)重复步骤3直到第10次的暗漏24小时延时模拟结束。
[0048] 经过上述步骤,采用10次24小时延时模拟代表暗漏演化过程的10个片段,形成一组暗漏样本。
[0049] 根据暗漏实验设计要求利用EPANET水力模拟软件随机生成Q(Q>10000)组暗漏事例。建立暗漏演化过程数据库Trend
[0050]
[0051] 用暗漏演化趋势库Trend的最后一行举例说明, 表示在第k个管网分区第Lk个节点发生漏损时,压力监测点m在规定的10次24小时暗漏实验中的压力数据,监测点采样间隔=模拟步长S=15分钟,则 为1×960的向量。类似的, 表示的是流量测点对应的数据。
[0052] 步骤4、建立并训练基于随机森林的暗漏区域识别模型
[0053] 在随机模拟Q组暗漏实验后,暗漏演化过程数据库Trend所包含的数据量巨大,为降低暗漏实验数据的冗余度和问题复杂度,对每组10次实验监测点收集的数据进行优化降维处理,并尽可能保留暗漏演化过程中数据的完整性以及使得目标数据易于统计、分类和识别等,提出了三种暗漏特征提取方法:
[0054] (1)时序数据均值。若时序数据为X(n),长度为N,则均值x可以表示为:
[0055]
[0056] (2)模糊熵。假设管网流量或压力信号的长度为N,则模糊熵为:
[0057]
[0058] 其中m表示样本的嵌入维度,r表示相似容限度,表示相似度平均值函数,可由时序数据X(n)求得。
[0059] (3)傅里叶变换系数。通过傅里叶变换将时域数据信号转换到频域,对管网平差得到的各测点压力和流量数据作为长度为N的离散信号X(n),其傅里叶变换X(k)为[0060]
[0061] 其中e‑j2pkn/N代表的是基频为2π/N的周期复指数函数。经过傅氏变换可得到信号分解生成的N个复指数信号的线性排列。这里拟提取处理得到的信号高频分量作为特征,公式如下:
[0062]
[0063] 其中μ是决定选取的高频项数目的变量。
[0064] 上述三种暗漏特征提取方法从数据的集中趋势、复杂程度和频域转换进行分析。从三个方面描述了时序数据的特征,减少了仅从单个特征分析暗漏数据的片面性,能够较为具体的代表数据特点。
[0065] 建立基于随机森林(Random Forest,RF)的暗漏区域识别模型,训练过程主要分为3个步骤
[0066] (1)对N棵决策树组成的随机森林,需要对训练集做有放回的bagging随机抽样,其中每一个训练样本都代表着一组暗漏实验中的数据特征,即均值、模糊熵和傅里叶变换系数。生成N个训练样本集合,产生多个重复的样本集,避免决策树得到局部最优解。
[0067] (2)对单个决策树从子训练集A个属性变量中选用a个并对决策树进行训练,其中A的值不等同于步骤(1)中训练样本的3个暗漏数据特征,而是由人为设定。一般a的取值为log2A+1或是 该策略可以减少树与树之间的相关性并可间接提升单棵树的分类准确性。
[0068] (3)对下一个决策树重复(2)的操作,直至训练完所有的决策树则形成了随机森林暗漏区域识别模型。
[0069] 由于训练集和特征变量的二重随机抽样,所以可以有效地降低过拟合的风险。将所有基分类器的投票结果汇总分析得到结果,具体的投票决策过程如下:
[0070]
[0071] 上式中,H(x)是随机森林的分类结果,hi(x)代表单个决策树模型的预测分类值,Y代表决策树输出的结果,I(·)是指示器函数。
[0072] 将经过特征提取的暗漏样本训练集输入到随机森林模型进行训练,利用测试集对模型的分类性能进行评价,分类准确率定义如下:
[0073]
[0074] 这里,针对测试集,模型的分类准确率≥85%。如果随机森林模型分类的结果与实际暗漏区域相差较大,低于设定的分类准确率阈值,则重新训练暗漏区域识别模型,或者返回步骤2调整暗漏分区的数量再次训练模型。
[0075] 步骤5、根据实际压力、流量数据识别暗漏区域
[0076] 将训练得到的暗漏区域识别模型应用于实际管网中:
[0077] (1)从SCADA中按日期顺序、按不等间隔抽取10次24小时管网监测点实测数据;
[0078] (2)对采集到的实测数据做降维处理提取特征,具体为提取数据的均值,模糊熵和傅里叶变换高频分量。形成一个暗漏演化特征数据集,输入到基于随机森林的暗漏识别分类模型;
[0079] (3)若输入的压力流量数据符合暗漏特征,基于随机森林的暗漏区域分类模型输出漏损分区的编号1~k。
[0080] 本发明的有益效果:本发明针对暗漏短期内对水力状态影响不显著特点,提出了基于动态过程的识别方法,根据暗漏演化过程的水力仿真实验数据建立了暗漏区域识别模型,实现利用暗漏发生后压力和流量的演化趋势特征快速识别漏损分区,具有较高的识别精度和较强的可操作性。