[0051] 在下面的描述中,出于说明的目的,为了提供对一个或多个实施例的全面理解,阐述了许多具体细节。然而,很明显,也可以在没有这些具体细节的情况下实现这些实施例。在其它例子中,为了便于描述一个或多个实施例,公知的结构和设备以方框图的形式示出。
[0052] 图2是流程图,示出了本发明的一个实施例所述的基于遗传算法极限学习机的抽油机参数优化方法。如图2所示,本发明所述的基于遗传算法极限学习机的抽油机参数优化方法包括如下步骤:
[0053] 步骤S1:确定抽油机采油过程生产效率影响因素构成效率观测变量集合其中α1,α2为决策变量,α3~α146载荷数据环境变量, 为其他环境变量,
选取抽油机系统的性能变量构成性能观测变量集合:{y1,y2,y3,…yl}。
[0054] 在本发明的一个实施例中,选取决策变量α1为冲次、决策变量α2为有效冲程、α3~α146为载荷1至载荷144,其余环境变量包括:理论排量、功率因数、有功功率、无功功率、含水率中的一个或多个变量;选取抽油机生产过程性能变量y1为产液量、y2为耗电量。
[0055] 步骤S2:获得所述生产效率影响因素和系统性能变量的样本数据,得到效率影响因素样本矩阵α和性能样本矩阵Y:
[0056]
[0057]
[0058] 其中 为效率影响因素个数,N为样本个数,αik表示第i个效率影响因素变量的第k个观测值,i=1,2,...,M;k=1,2,...,N。
[0059] 步骤S3:利用主元分析算法对载荷数据进行降维处理,从而构建新的载荷主元变量。本发明中采用示功图描绘数据的144个载荷点做为部分环境变量进行建模。然而利用144维数据建模为参数维度灾难。故而利用主元分析算法对载荷数据进行降维处理。
[0060] 在一个实施例中,利用主元分析算法对载荷数据进行降维处理的步骤可以包括:
[0061] ①设置样本累计贡献率precent=0.95;
[0062] ②获取载荷数据 每个Lk具有第k观测变量的N个观测数据,3≤k≤146;
[0063] ③求出数据平均值 并利用原始数据减去均值得到
[0064] ④计算协方差矩阵
[0065] ⑤计算协方差矩阵的特征值E1,E2,...,E144与特征向量EV1,EV2,...,EV144;
[0066] ⑥由大到小依次排列特征值E'1,E'2,...,E'M,对应特征向量为EV'1,EV'2,...,EV'144,按特征值大小顺序取前d个特征值的特征向量构成矩阵[EV'1,EV'2,...,EV'd],此时其中d<144;特征向量代表原数据的分布方向,其对应的特征值越大,则该向量越重要(即为主元);其对应的特征值越小,则该向量越次要。
[0067] ⑦由[EV'1,EV'2,...,EV'd]与原始样本 求取载荷新的主元,其新载荷主元观测变量构成集合:{αz1,αz2,...,αzd},其为d个新变量,且每个变量为N个观测值构成的新主元矩阵:
[0068]
[0069] 步骤S4:由影响因素观测变量集合 中非载荷变量与载荷新主元观测变量集合{αz1,αz2,...,αzd}构建网络输入变量集合: 并令输入变
量集合为:{x1,x2,x3,...,xM},即,
[0070] 步骤S5:构建输入变量集合{x1,x2,x3,...,xM}观测样本值:
[0071]
[0072]
[0073] 其中,x1~x2为决策变量,x3~xM为新的环境变量。
[0074] 步骤S6:对得到的训练输入样本X、输出样本Y进行归一化处理,得到新的训练输入矩阵 输出矩阵
[0075] 在一个实施例中,所述归一化处理的算法如下:
[0076]
[0077] i=1,2,...,M;k=1,2,...,N
[0078]
[0079] j=1,2,....,l;k=1,2,...,N
[0080] 其中: 为设定输入变量归一化后数据范围的最大值、最小值;
[0081] xik为归一化前的第i个输入变量第k个样本值;
[0082] 为归一化后第i个输入变量第k个样本值;
[0083] xi,min=min{xik|1≤k≤N}
[0084] xi,max=max{xik|1≤k≤N}
[0085] 为设定输出变量归一化后数据范围的最大值、最小值;
[0086] yjk为归一化前第j个输出变量的第k个采集样本值;
[0087] 为归一化后第j个输出变量的第k个值;
[0088] yj,max=max{yjk|1≤k≤N}
[0089] yj,min=min{yjk|1≤k≤N}
[0090] 于是得到:
[0091]
[0092]
[0093]
[0094]
[0095] 步骤S7:在归一化后样本集中,选取样本集前 组样本作为网络训练样本集则样本集剩余 组作为测试样本集 其中 其中:训练样本集和测试样本集分别为:
[0096]
[0097]
[0098] 步骤S8:构建3层前馈神经网络,采用所述训练输入样本 对该网络进行训练,利用遗传算法训练网络权值W、权值β、隐含层阈值b,从而确定网络的参数,最终得到可计算出任一组输入观测值x1,x2,...,xM所对应的输出预测值 的前馈神经
网络:
[0099]
[0100] 具体地,在一个实施例中,如图3所示,所述3层前馈神经网络可以由输入层、隐含层和输出层组成,输入层与隐含层由权值W连接,其Wki表示第i个输入神经元与隐含层第k个神经元的间的连接权值;隐含层与输出层由权值β连接,其βkj表示第k个隐层神经元与输出层第j个神经元的间的连接权值;隐含层的神经元个数为s1,隐含层神经元的阈值为b,bk为第k个隐层神经元阈值;
[0101] 各权值、阈值具体为:
[0102]
[0103] 设隐含层神经元的激活函数为 网络的第m组输入样本 的输出 为:
[0104]
[0105] 其中,Wk=[Wk1,Wk2,…,WkM],最终得到可计算出任一组输入观测值x1,x2,...,xM所对应的输出预测值 的前馈神经网络:
[0106]
[0107] 在步骤S8中,利用遗传算法训练网络权值W、权值β、隐含层阈值b的步骤可以包括:
[0108] ①利用输入层到隐含层的权值W,隐含层阈值b构建初始种群P,该种群中第i个个体为 设置初始种群P个体L=50,设置最大遗传代数GEN=100。
[0109] ①构建遗传算法优化网络权值阈值的适应值函数:
[0110]
[0111] ③计算第i个个体的适应度函数值,利用个体 和训练样本输入样本 计算隐含层神经元的输出矩阵H(i):
[0112]
[0113] 由训练样本输入样本 对应的输出样本 与隐含层的输出矩阵H(i)共同求出(i) (i) -1 (i)隐含层到输出层的权值β , (H ) 为矩阵H 的逆矩阵;在求出个体
对应的β(i)后,构建网络预测函数F(i)(Pi,β(i),X);并将测试样本
集Xtest中的输入矩阵带入F(i)(Pi,β(i),X)得到预测测试集预测输出 故
而计算个体Pi适应度函数值:
[0114]
[0115] ④对种群P进行选择、交叉、变异操作,得到子群Q。
[0116] ⑤种群Q进行③、④操作得到种群Q的子群。循环进行以上步骤,得到第GEN代子群,并在第GEN代子群中选择一个最佳个体Pbest,个体Pbest第GEN代子群中计算得到测试样本预测输出值与实际输出值的均方差最小。
[0117] ⑤由Pbest确定的输入到隐层的权值W,隐层阈值b,计算隐层输出矩阵Hbest。计算计算隐层到输出的权值矩阵输出权值βbest:βbest=(Hbest)-1·Ytrain从而得到最佳模型。
[0118] 上述选择操作可以包括:在P中K个体中,按每个个体的概率φ(Pi)大小决定选中的机会,分K次从P中选择K个个体,其中概率
[0119] 上述交叉操作包括:将选择操作得出的K个个体进行二进制编码,个体中每个变量占据4字节,这样编码后一个个体的字节数为:4*(s1*M+s1);将个体Pi和Pj二进制编码后,将两个个体二进制编码第4·c位以后的编码进行调换,从而得到两个新的个体 和
[0120] 所述变异操作包括:将交叉操作得到的K个体 进行二进制编码,其中某个二进制编码后的个体 若第c位为1,则将1变成0;若第c位为0,则将0变成1,,从而得到一个新的个体Qi。
[0121] 步骤S9:针对产液量y1构造其偏好函数h=h(y1),该偏好函数为U形曲线,在其整个定义域上二阶可导且二阶导数恒大于零,将产液量y1的值划分为好、较好、一般、较差和极差5个区域,并通过所述偏好函数将该五个区域量化为数值h=h(y1);其中,产液量y1处于好区域对应偏好函数最小值。图4示出了本发明的一个实施例所使用的产液量偏好函数的图形。
[0122] 步骤S10:构建评价决策变量个体支配关系的适应度函数,系统的性能变量选取产液量(y1)、耗电量(y2),结合步骤S9构建的产液量偏好函数,得到适应度函数如下:
[0123]
[0124] 步骤S11:计算抽油机工艺系统环境变量的平均值,以作为优化决策参数时的环境状态。
[0125] 计算环境参数平均值具体算法如下:
[0126]
[0127] 其中N为该环境变量训练样本数量。
[0128] 步骤S12:利用决策变量x1,x2构建多目标优化的初始种群PD的个体,即设置决策变量的上下限xmin、xmax,即x1min≤x1≤x1max,x2min≤x2≤x2max,利用决策变量(x1,x2)的K对数据构建初始种群PD,即 初始化种群PD,令
其为第一代父代种群;生成一个空的精英解种群 设置精英个体个数为 设置最大
遗传代数GEN=100。
[0129] 步骤S13:进行第一次遗传迭代计算,并得到第二代精英种群A2、第二代父代种群具体步骤如下:
[0130] ①个体强度求取,将第一代父代种群与精英解种群组合成种群Rt,即 求取种群Rt中每个个体的原始适应度函数值,并比较个体之间的相互支配关系;定义变量R(c)为种群Rt中第c个个体强度,即第c个个体可以被种群Rt其他个体支配的数量;其中个体Rt(c)原始适应度函数值求取过程如下:通过种群个体Rt(c)与环境状态变量平均值 组建输入样本 计算样本Xc原始适应度函数值 并作为
个体Rt(c)的原始适应度函数值;
[0131] ②个体密度求取,利用个体Rt(i)与种群Rt中第b个邻近个体的距离值 则个体Rt(c)密度函数
[0132] ③求个体的适应值,将上述所求个体Rt(c)的强度R(c)和所求个体Rt(c)的密度值D(c)的相加作为个体Rt(c)的适应值;
[0133] ④在种群Rt将所有的非支配个体全部放入精英种群A2,但要保持精英种群个体数为 此时存在三种情况:A2中个体数为 则不需要在操作,如果A2中个体数小于 则需要2 2 2
在种群Rt剩余个体中选取适应值较小的个体放入A 中,保持A 个体数为 如果A中个体数大于 则需要在A2个体中比较个体的密度值D(c),将密度值较大的个体剔除,以保持A2个体数为
[0134] ⑤将A2中个体放入交配池中进行遗传操作得到第二代父代种群
[0135] ⑥将第二代父代种群 与第二代精英种群A2组合,并重复①~⑤过程,直至gen=GEN,输出精英种群AGEN,将AGEN的个体作为优化结果。
[0136] 步骤S14:将优化后的决策变量,以及环境变量的平均值带入建立工艺过程模型,计算优化后的决策变量的系统性能,该优化后的决策变量取值可保证在固定产液量的情形下,耗电量降低。
[0137] 下面以大港油田港510-3抽油机为实验对象采用本发明的方法进行优化。
[0138] 确定抽油机采油过程生产效率影响因素构成效率观测变量集合其中α1,α2为决策变量冲次、有效冲程,α3~α146功图载荷数据,α147为环境变量平均功率因数,α148为环境变量平均有功功率,α149为环境变量平均无功功率,α150为环境变量理论排量、α151为环境变量计算泵效、α152为环境变量含水率。选择抽油机生产过程的产液量y1、耗电量y2作为建立抽油机系统模型的性能变量{y1,y2}。
[0139] 采集油井2013年12月26日至2014年12月23日数据。对所有变量按照24小时为采集时间间隔求取24小时数据的平均值,并作为该变量样本。采集数据部分地示于表1和表2。
[0140] 表1
[0141]
[0142] 表2
[0143]
[0144]
[0145] 利用PCA输入变量降维处理,得到新主元数据示于表3。
[0146] 表3
[0147]
[0148] 构建新的采集建模样本数据[X,Y]。共获得可建模数据256组,示于表4中。
[0149] 表4
[0150]
[0151]
[0152] 将匹配后的数据与载荷新主元数据进行匹配,并进行归一化处理。归一化后的数据部分地示于表5。
[0153] 表5
[0154]
[0155] 基于遗传算法优化极限学习机建模。设定隐含层神经元个数为s1=20,选择可建模样本中的200组作为训练样本。基于遗传算法得到最佳输入层到隐含层权值W和阈值b如下:
[0156]
[0157]
[0158] 图5示出了利用本发明的方法训练神经网络所产生的产液量训练效果图;图6示出了利用本发明的方法训练神经网络所产生的耗电量训练效果图。图7示出了测试样本产液量预测效果图;图8示出了测试样本耗电量预测效果图。
[0159] 由建模效果可知,训练效果较优,产液量、耗电量训练误差均控制在较小的范围,训练效果较好。由所得的建模与测试样本进行预测,得到测试样本误差百分比也控制较小的范围内,故知模型泛化能力较好。
[0160] 产液量偏好函数设计,根据偏好函数设计准则,采用3-S类软偏好设计,根据生产者对产液量的多少的喜爱程度用:极好、好、一般、较差、差等五个个等级描述。极好程度利用建模训练集中产液量所有值的平均值作为极好程度的偏好值为:47.3,并利用训练集中产液量最小值37.3、最大值57.3作为不可接受域的临界值。故而设计偏好程度区间为:[0,2],[2,4],[4,6],[6,8],[8,10]等,且设计的偏好程度区间所对应的实际产液量区间为:
[0161] [37.3,38.4],[38.4,39.6],[39.6,40.9],[40.9,42.8],[42.8,47.3]以及
[0162] [47.3,51.8],[51.8,53.6],[53.6,55.5],[55.5,56.2],[56.2.57.3]。故而设计产液量偏好函数为h(y1)=0.1×(y1-47.3)2。图9示出了偏好函数的图形;
[0163] 利用决策变量(x1,x2)的K对数据构建初始种群P,设置种群大小50,即初始化的种群样本数量为K=50;决策变量冲次(x1)的优化范围2.0≤x1≤4.5;决策变量有效冲程(x2)的范围3.0≤x2≤3.6。设置最大遗传代数GEN=100。
[0164] 算环境参数平均值具体算法如下:
[0165]
[0166] 具体的环境参数平均值示于表6中。
[0167] 表6
[0168]
[0169]
[0170] 计算得到的产液量偏好值与耗电量的pareto解集关系示于图10中。Pareto前沿所对应的数值解集示于表7中。
[0171] 表7
[0172]
[0173] 在表7中,产液量偏好程度属于[0,1.3]区间,产液量在极好的范围内优化,符合抽油机定量采油的工作制度。
[0174] 将优化后的决策变量,以及环境变量的平均值带入建立工艺过程模型,计算优化后的决策变量的系统性能,与实际样本的系统性能平均值进行比较,在保证固定的产液量的前提下,耗电量降低,则上述方法有效。去产液量偏好值解集的平均值求取实际对应的产液量大小。其对比结果示于表8。
[0175] 表8
[0176]
[0177] 由表8可知,计算得到偏好程度平均值为0.75,此时产液量可能为49.51t/d或者45.08t/d。此时计算得到在保持定量式采油工作状态下,耗电量下降16.57%。系统效率比(产液量/耗电量)可提高8%。达到了节能设计目的。说明该方法有效。
[0178] 尽管已经结合详细示出并描述的优选实施例公开了本发明,但是本领域技术人员应当理解,对于上述本发明所提出的基于遗传算法极限学习机的抽油机参数优化方法,还可以在不脱离本发明内容的基础上做出各种改进。因此,本发明的保护范围应当由所附的权利要求书的内容确定。