《腐蚀科学与防护技术》
0 引言
随着我国电力系统向高压和大容量的发展,对系统运行的安全性和可靠性提出了更高的要求[1,2]。接地网是电网为了保障人身和设备安全而必备的装置,目前我国普遍采用镀锌钢和碳钢作为接地网导体。随着生态环境的恶化和线路电压等级的提升,接地网材料表面的腐蚀程度不断加剧甚至发生断裂,严重影响电网的安全运行[3]。传统的开挖检测接地网腐蚀状态方法虽然准确,但存在需要停机检查、浪费时间的缺点[4]。因此,有必要系统地研究接地网的腐蚀状态,建立稳定可靠的腐蚀预测模型,在不开挖的情况下准确预测接地网事故,从而显著提升电网运行的可靠性。
基于已有的接地网腐蚀数据,通过智能算法构建模型,进而对接地网腐蚀模型进行预测是一种潜在的解决方法。文献[5]应用BP神经网络建立了以腐蚀影响因素为输入参数的腐蚀预测模型。文献[6]首先应用层次分析法对各腐蚀因素进行科学权重,进而应用模糊理论建立预测模型。文献[7]建立了支持向量机的接地网预测模型,并通过人工蚁群算法对向量机的参数进行优化。文献[8]提出了一种将误差校正与改进最小二乘法支持向量机相结合的组合模型,并应用其对接地网腐蚀速率进行预测。文献[9]提出了一种改进果蝇算法优化BP神经网络算法,较准确地对接地网腐蚀速率进行预测。
由于腐蚀是一个长期和渐变的过程,故对实际电站接地网进行动态监测时通常选择以月为时间间隔,这就导致了腐蚀数据的样本通常少于100个,属于典型的小样本情况。而在样本情况过少的情况下,直接采用神经网络或其他拟合的方法,极易产生过拟合的问题,甚至因为样本过少,对过拟合的分析都具有很大的不确定性。此外,腐蚀速率虽然与土壤中的各项指标有关,但直接根据这些物理量纲差异巨大的参数拟合出腐蚀速率还是欠佳的。腐蚀是一个长期的、复杂的、包含时间积分的、非线性的电化学过程,相关环境参数也是探索研究中发现的比较重要的参数,而根据这些参数推断的腐蚀速率的趋势具有自然的对比性和相关性,因此,样本也具有超越仅仅用于拟合的价值。
本文提出了基于改进CL-ML模型的接地网不开挖腐蚀预测方法,把已经采样的珍贵样本作为锚点,预测新数据的腐蚀速率与现有样本腐蚀速率的关系,显著减小了拟合函数的压力与复杂性,并充分挖掘了稀有样本的内在相关性。通过进一步应用测量的样本模型对本文模型进行测试,证明其误差远小于采用传统的BP神经网络和广义回归神经网络的方法。
1 相关理论
1.1 对比学习
在对比学习(CL)中,数据本身将为学习算法提供监督[10]。对于任何数据点x,对比方法的目的是学习编码器f:文中列项说明格式如下:
(1)
式中:x+是与x相似或相等的数据点,称为正样本;x–是与x不同的数据点,称为负样本。score函数用来度量两个特征之间相似性,其表达式为:
上述的score函数其实是N-way softmax分类器常见的交叉熵损失,在对比学习文献中通常称为InfoNCE损失。InfoNCE也与互信息有关系,最小化InfoNCE损失可使f(x)和f(x+)之间互信息的下界最大化。作为样本输入的x也可以被称为锚定点。为了优化这一特性,本文通过构造一个softmax分类器正确地分类正样本对和负样本对。这个分类器鼓励f让正样本对相似,负样本对差异化:
(3)
1.2 度量学习
度量学习是学习一个度量相似度的距离函数。相似的目标距离近,不相似的距离远。度量学习(ML)的基本步骤为[11]:
(1)计算浅入度距离度量。
(2)将每个样本都当作一个锚点。
(3)根据距离挑一部分同类做正样本,一部分其他类做负样本组成子集。
(4)对每个要么是一个大的子集里基本包含整个mini-batch(小批量,N个样本)只是权重不同,要么是N个更小的数据对。
度量学习的一个关键点是损失函数的选择,目前国内外众多文献给出了多种损失函数。本文选取了其中一种常用的损失函数,并将在建模过程中给出详细的说明。
1.3 SE模块
SE模块为包含SE单元的复合结构,其中SE全称为Squeeze-and-Excitation,意思是“压缩与激励”[12]。在Squeeze阶段,输入参数为5个原始数据的归一化数据,经过5个不同的全连接层FC和LReLU函数后变为包含5个元素的向量V1。在Excitation阶段,经过膨胀后向量V1再次转变为5个元素的向量,并经过Sigmoid函数输出,成为衡量V1中每个元素重要性的系数并与V1相乘。具体结构示意图如图1所示。