首页 > 专利 > 重庆科技学院 > 基于遗传算法极限学习机的抽油机参数优化方法专利详情

基于遗传算法极限学习机的抽油机参数优化方法 0 0

有效专利查看PDF

申请进展

基本信息

申请人信息

代理人信息

摘要

法律状态

权利要求

说明书

专利申请流程有哪些步骤？

申请

申请号：指国家知识产权局受理一件专利申请时给予该专利申请的一个标示号码。唯一性原则。

申请日：提出专利申请之日。

2015-03-12

申请公布

申请公布指发明专利申请经初步审查合格后，自申请日（或优先权日）起18个月期满时的公布或根据申请人的请求提前进行的公布。

申请公布号：专利申请过程中，在尚未取得专利授权之前，国家专利局《专利公报》公开专利时的编号。

申请公布日：申请公开的日期，即在专利公报上予以公开的日期。

2015-07-01

授权

授权指对发明专利申请经实质审查没有发现驳回理由，授予发明专利权；或对实用新型或外观设计专利申请经初步审查没有发现驳回理由，授予实用新型专利权或外观设计专利权。

2017-08-25

预估到期

发明专利权的期限为二十年，实用新型专利权期限为十年，外观设计专利权期限为十五年，均自申请日起计算。专利届满后法律终止保护。

2035-03-12

基本信息

有效性	有效专利	专利类型	发明专利
申请号	CN201510109219.X	申请日	2015-03-12
公开/公告号	CN104680025B	公开/公告日	2017-08-25
授权日	2017-08-25	预估到期日	2035-03-12
申请年	2015年	公开/公告年	2017年
缴费截止日
分类号	G06N3/12	主分类号	G06N3/12
是否联合申请	独立申请	文献类型号	B
独权数量	1	从权数量	8
权利要求数量	9	非专利引证数量	1
引用专利数量	4	被引证专利数量	0
非专利引证	1、Wang H F,et al。《.Application of asingle-speed three-power energy-savingmotor in pumping unit》《.Electric Machine& Control Application》.2010,第50-54页. 辜小花,等《.面向抽油机节能的GRNN过程建模及工艺参数优化》《.重庆大学学报》.2013,第36卷(第6期),第130-136页. 宋宜斌《.多层前馈神经网络改进算法及其应用》《.计算机工程》.2003,第109-111页.;
引用专利	US2004/0240717A1、CN103914622A、CN102982373A、CN1035443889A	被引证专利
专利权维持	3	专利申请国编码	CN
专利事件		事务标签	公开、实质审查、授权

申请人信息

申请人	重庆科技学院	第一申请人	重庆科技学院
专利权人	重庆科技学院	当前专利权人	重庆科技学院
发明人	辜小花、李太福、梅青平、裴仰军、王坎、周伟、杨永龙、曹旭鹏	第一发明人	辜小花
地址	重庆市沙坪坝区虎溪大学城重庆科技学院	邮编
申请人数量	1	发明人数量	8
申请人所在省	重庆市	申请人所在市	重庆市沙坪坝区

代理人信息

代理机构

专利代理机构是经省专利管理局审核，国家知识产权局批准设立，可以接受委托人的委托，在委托权限范围内以委托人的名义办理专利申请或其他专利事务的服务机构。

重庆蕴博君晟知识产权代理事务所

代理人

专利代理师是代理他人进行专利申请和办理其他专利事务，取得一定资格的人。

王玉芝

摘要

本发明提供一种基于遗传算法极限学习机的抽油机参数优化方法，包括：1)确定抽油机的生产效率影响因素和性能变量、2)获得其样本数据、3)对载荷数据降维、4)由非载荷变量与载荷新主元构建网络输入变量集、5)构建输入变量的样本值、6)归一化处理、7)选取训练和测试样本、8)构建前馈神经网络并训练、9)构造产液量偏好函数、10)构建评价决策变量个体支配关系的适应度函数、11)计算系统环境变量的平均值、12)利用决策变量构建初始种群并生成精英解种群、13)进行遗传迭代计算，得到第二代精英种群和父代种群、14)迭代循环，最终得到优化后的生产效率影响因素值。优化后，可保证在产液量基本固定的情况下耗电量最小。

摘要附图
说明书附图：图1
说明书附图：图2
说明书附图：图3
说明书附图：图4
说明书附图：图5
说明书附图：图6
说明书附图：图7
说明书附图：图8
说明书附图：图9
说明书附图：图10

法律状态

序号	法律状态公告日	法律状态	法律状态信息
1	2017-08-25	授权
2	2015-07-01	实质审查的生效	IPC(主分类): G06F 19/00 专利申请号: 201510109219.X 申请日: 2015.03.12
3	2015-06-03	公开

权利要求

权利要求书是申请文件最核心的部分，是申请人向国家申请保护他的发明创造及划定保护范围的文件。

1.一种基于遗传算法极限学习机的抽油机参数优化方法，包括如下步骤：
1)确定抽油机采油过程生产效率影响因素构成效率观测变量集合其中
α1，α2为决策变量，α3～α146载荷数据环境变量，为其他环境变量，选取抽油机系统的性能变量构成性能观测变量集合：{y1,y2,y3,…yl}；
2)获得所述生产效率影响因素和系统性能变量的样本数据，得到效率影响因素样本矩阵α和性能样本矩阵Y：
其中为效率影响因素个数，N为样本个数，αik表示第i个效率影响因素变量的第k个观测值，i＝1,2,...,M；k＝1,2,...,N；
3)利用主元分析算法对载荷数据进行降维处理，从而构建新的载荷主元变量矩阵：
4)由影响因素观测变量集合中非载荷变量与载荷新主元观测变量集合
{αz1,αz2,...,αzd}构建网络输入变量集合：并令输入变量集合
为：{x1,x2,x3,...,xM}，即，
5)构建输入变量集合{x1,x2,x3,...,xM}观测样本值：
其中，x1～x2为决策变量，x3～xM为新的环境变量；
6)对得到的训练输入样本X、输出样本Y进行归一化处理，得到新的训练输入矩阵输出矩阵
7)在归一化后样本集中，选取样本集前组样本作为网络训练样本集则样
本集剩余组作为测试样本集其中其中：训练样本集和测试
样本集分别为：
8)构建3层前馈神经网络，采用所述训练输入样本对该网络进行训练，利用
遗传算法训练网络权值W、权值β、隐含层阈值b，从而确定网络的参数，最终得到可计算出任一组输入观测值x1,x2,...,xM所对应的输出预测值的前馈神经网络：
9)针对产液量y1构造其偏好函数h＝h(y1)，该偏好函数为U形曲线，在其整个定义域上二阶可导且二阶导数恒大于零，将产液量y1的值划分为好、较好、一般、较差和极差5个区域，并通过所述偏好函数将该五个区域量化为数值h＝h(y1)；其中，产液量y1处于好区域对应偏好函数最小值；
10)构建评价决策变量个体支配关系的适应度函数，系统的性能变量选取产液量(y1)、耗电量(y2)，结合步骤S9构建的产液量偏好函数，得到适应度函数如下：
11)计算抽油机工艺系统环境变量的平均值，以作为优化决策参数时的环境状态；
12)利用决策变量x1,x2构建多目标优化的初始种群PD的个体，即设置决策
变量的上下限xmin、xmax,即x1min≤x1≤x1max，x2min≤x2≤x2max，利用决策变量(x1,x2)的K对数据构建初始种群PD，即初始化种群PD,令其为第一代父代种群；
生成一个空的精英解种群设置精英个体个数为设置最大遗传代数GEN＝100；
13)进行第一次遗传迭代计算，并得到第二代精英种群A2、第二代父代种群具体步骤如下：
①个体强度求取，将第一代父代种群与精英解种群组合成种群Rt，即求取种
群Rt中每个个体的原始适应度函数值，并比较个体之间的相互支配关系；定义变量R(c)为种群Rt中第c个个体强度，即第c个个体可以被种群Rt其他个体支配的数量；其中个体Rt(c)原始适应度函数值求取过程如下：通过种群个体Rt(c)与环境状态变量平均值组建输入样本计算样本Xc原始适应度函数值并作为个体
Rt(c)的原始适应度函数值；
②个体密度求取，利用个体Rt(i)与种群Rt中第b个邻近个体的距离值则个体Rt(c)密度函数
③求个体的适应值，将上述所求个体Rt(c)的强度R(c)和所求个体Rt(c)的密度值D(c)的相加作为个体Rt(c)的适应值；
④在种群Rt将所有的非支配个体全部放入精英种群A2，但要保持精英种群个体数为此时存在三种情况：A2中个体数为则不需要在操作，如果A2中个体数小于则需要在种群Rt剩余个体中选取适应值较小的个体放入A2中，保持A2个体数为如果A2中个体数大于则需要在A2个体中比较个体的密度值D(c)，将密度值较大的个体剔除，以保持A2个体数为
⑤将A2中个体放入交配池中进行遗传操作得到第二代父代种群
⑥将第二代父代种群与第二代精英种群A2组合，并重复①～⑤过程；直至gen＝GEN，输出精英种群AGEN,将AGEN的个体作为优化结果；
14)将优化后的决策变量，以及环境变量的平均值带入建立工艺过程模型，计算优化后的决策变量的系统性能，该优化后的决策变量取值可保证在固定产液量的情形下，耗电量降低。

2.如权利要求1所述的基于遗传算法极限学习机的抽油机参数优化方法，其中，
所述决策变量α1为冲次、决策变量α2为有效冲程、α3～α146为载荷1至载荷144，其余环境变量包括：理论排量、功率因数、有功功率、无功功率、含水率中的一个或多个变量；所述抽油机生产过程性能变量y1为产液量、y2为耗电量。

3.如权利要求1所述的基于遗传算法极限学习机的抽油机参数优化方法，其中，
设所述决策变量、环境变量和性能变量的观测值采集周期的最大值为tmax，则这些变量中的任一变量的样本取为tmax时间内该变量的观测值的平均值。

4.如权利要求1所述的基于遗传算法极限学习机的抽油机参数优化方法，其中，
利用主元分析算法对载荷数据进行降维处理的步骤包括：
①设置样本累计贡献率precent＝0.95；
②获取载荷数据每个Lk具有第k观测变量的N个观测数据,3≤k≤146；
③求出数据平均值并利用原始数据减去均值得到
④计算协方差矩阵
⑤计算协方差矩阵的特征值E1,E2,...,E144与特征向量EV1,EV2,...,EV144；
⑥由大到小依次排列特征值E1',E'2,...,E'M,对应特征向量为EV1',EV2',...,EV′144，按特征值大小顺序取前d个特征值的特征向量构成矩阵[EV1',EV2',...,EVd']，此时其中d＜144；
⑦由[EV1',EV2',...,EVd']与原始样本求取载荷新的主元，其新载荷主
元观测变量构成集合:{αz1,αz2,...,αzd}，其为d个新变量，且每个变量为N个观测值构成的新主元矩阵：

5.如权利要求1所述的基于遗传算法极限学习机的抽油机参数优化方法，其中，
所述归一化处理的算法如下：
其中: 为设定输入变量归一化后数据范围的最大值、最小值；
xik为归一化前的第i个输入变量第k个样本值；
为归一化后第i个输入变量第k个样本值；
xi,min＝min{xik|1≤k≤N}
xi,max＝max{xik|1≤k≤N}
为设定输出变量归一化后数据范围的最大值、最小值；
yjk为归一化前第j个输出变量的第k个采集样本值；
为归一化后第j个输出变量的第k个值；
yj,max＝max{yjk|1≤k≤N}
yj,min＝min{yjk|1≤k≤N}
于是得到：

6.如权利要求1所述的基于遗传算法极限学习机的抽油机参数优化方法，其中，
所述前馈神经网络由输入层、隐含层和输出层组成，输入层与隐含层由权值W连接，其Wki表示第i个输入神经元与隐含层第k个神经元的间的连接权值；隐含层与输出层由权值β连接，其βkj表示第k个隐层神经元与输出层第j个神经元的间的连接权值；隐含层的神经元个数为s1，隐含层神经元的阈值为b，bk为第k个隐层神经元阈值；
所述各权值、阈值具体为：
设隐含层神经元的激活函数为网络的第m组输入样本的输出为：
其中，Wk＝[Wk1,Wk2,…,WkM]，最终得到可计算出任一组输入观测值x1,x2,...,xM所对应的输出预测值的前馈神经网络：

7.如权利要求6所述的基于遗传算法极限学习机的抽油机参数优化方法，其中，
利用遗传算法训练网络权值W、权值β、隐含层阈值b的步骤包括：
①利用输入层到隐含层的权值W,隐含层阈值b构建网络权值阈值单目标的初始种群P，该种群中第i个个体为
②构建遗传算法优化网络权值阈值的适应值函数：
③计算第i个个体的适应度函数值，利用个体和训练样本输入
样本计算隐含层神经元的输出矩阵H(i)：
(i)
由训练样本输入样本对应的输出样本与隐含层的输出矩阵H 共同求出隐含
层到输出层的权值β(i)， (H(i))-1为矩阵H(i)的逆矩阵；在求出个体
对应的β(i)后，构建网络预测函数F(i)(Pi,β(i),X)；并将测试样本
test (i) (i)
集X 中的输入矩阵带入F (Pi,β ,X)得到预测测试集预测输出故
而计算个体Pi适应度函数值：
④对种群P进行选择、交叉、变异操作，得到子群Q；
⑤种群Q进行③、④操作得到种群Q的子群，循环进行以上步骤，得到第GEN代子群，并在第GEN代子群中选择一个最佳个体Pbest，个体Pbest第GEN代子群中计算得到测试样本预测输出值与实际输出值的均方差最小；
⑥由Pbest确定的输入到隐层的权值W，隐层阈值b，计算隐层输出矩阵Hbest，计算计算隐层到输出的权值矩阵输出权值βbest：βbest＝(Hbest)-1·Ytrain从而得到最佳模型。

8.如权利要求7所述的基于遗传算法极限学习机的抽油机参数优化方法，其中，
所述选择操作包括：在P中K个体中，按每个个体的概率φ(Pi)大小决定选中的机会，分K次从P中选择K个个体，其中概率
所述交叉操作包括：将选择操作得出的K个个体进行二进制编码，个体中每个变量占据
4字节，这样编码后一个个体的字节数为：4*(s1*M+s1)；将个体Pi和Pj二进制编码后，将两个个体二进制编码第4·c位以后的编码进行调换，从而得到两个新的个体和
所述变异操作包括：将交叉操作得到的K个体进行二进制编码，其中某个二进制编码后的个体若第c位为1，则将1变成0；若第c位为0，则将0变成1,，从而得到一个新的个体Qi。

9.如权利要求1所述的基于遗传算法极限学习机的抽油机参数优化方法，其中，
计算环境参数平均值具体算法如下：
其中N为该环境变量训练样本数量。

说明书

技术领域

[0001] 本发明属于采油领域，具体涉及一种基于遗传算法极限学习机的抽油机参数优化方法。

背景技术

[0002] 抽油机采油作为一种机械采油方式，主要由电动机、地面传动设备和井下抽油设备三部分组成，如图1所示。抽油机的整个采油过程主要分为上下两个冲程：上冲程，即驴头悬点向上运动，提起抽油杆柱和井下抽油设备，此过程中电动机需消耗大量的能量；下冲程，即驴头悬点向下运动，抽油机的抽油杆柱电动机做功。在抽油杆柱上下运动过程中，电动机的负载发生周期变化。抽油机的运行参数的选择对整个抽油机系统的能量消耗影响很大。为了使抽油机采油生产过程既能完成预定的产液量，又能使抽油机生产过程的耗电量最低，需要对抽油机运行参数进行节能优化。

发明内容

[0003] 本发明是为了解决现有技术中存在的上述技术问题而做出，其目的在于提供一种基于遗传算法极限学习机的抽油机参数优化方法，以保证抽油机的生产状态最佳，从而达到减少能耗，提高系统效率的目的。

[0004] 为了实现上述目的，本发明提供一种基于遗传算法极限学习机的抽油机参数优化方法，该方法包括的步骤如下：

[0005] 1)确定抽油机采油过程生产效率影响因素构成效率观测变量集合其中α1，α2为决策变量，α3～α146载荷数据环境变量，为其他环境变量，选取抽油机系统的性能变量构成性能观测变量集合：{y1,y2,y3,…yl}；

[0006] 2)获得所述生产效率影响因素和系统性能变量的样本数据，得到效率影响因素样本矩阵α和性能样本矩阵Y：

[0007]

[0008]

[0009] 其中为效率影响因素个数，N为样本个数，αik表示第i个效率影响因素变量的第k个观测值，i＝1,2,...,M；k＝1,2,...,N；

[0010] 3)利用主元分析算法对载荷数据进行降维处理，从而构建新的载荷主元变量矩阵：

[0011]

[0012] 4)由影响因素观测变量集合中非载荷变量与载荷新主元观测变量集合{αz1,αz2,...,αzd}构建网络输入变量集合：并令输入变量集
合为：{x1,x2,x3,...,xM}，即，

[0013] 5)构建输入变量集合{x1,x2,x3,...,xM}观测样本值：

[0014]

[0015]

[0016] 其中，x1～x2为决策变量，x3～xM为新的环境变量；

[0017] 6)对得到的训练输入样本X、输出样本Y进行归一化处理，得到新的训练输入矩阵输出矩阵

[0018]

[0019]

[0020]

[0021]

[0022] 7)在归一化后样本集中，选取样本集前组样本作为网络训练样本集则样本集剩余组作为测试样本集其中其中：训练样本集
和测试样本集分别为：

[0023]

[0024]

[0025] 8)构建3层前馈神经网络，采用所述训练输入样本对该网络进行训练，利用遗传算法训练网络权值W、权值β、隐含层阈值b，从而确定网络的参数，最终得到可计算出任一组输入观测值x1,x2,...,xM所对应的输出预测值的前馈神经网络：

[0026]

[0027] 9)针对产液量y1构造其偏好函数h＝h(y1)，该偏好函数为U形曲线，在其整个定义域上二阶可导且二阶导数恒大于零，将产液量y1的值划分为好、较好、一般、较差和极差5个区域，并通过所述偏好函数将该五个区域量化为数值h＝h(y1)；其中，产液量y1处于好区域对应偏好函数最小值；

[0028] 10)构建评价决策变量个体支配关系的适应度函数，系统的性能变量选取产液量(y1)、耗电量(y2)，结合步骤S9构建的产液量偏好函数，得到适应度函数如下：

[0029]

[0030] 11)计算抽油机工艺系统环境变量的平均值，以作为优化决策参数时的环境状态；

[0031] 12)利用决策变量x1,x2构建多目标优化的初始种群PD的个体，即设置决策变量的上下限xmin、xmax,即x1min≤x1≤x1max，x2min≤x2≤x2max，利用决策变量(x1,x2)的K对数据构建初始种群PD，即初始化种群PD,令其为第一代父代种
群；生成一个空的精英解种群设置精英个体个数为设置最大遗传代数GEN＝100；

[0032] 13)进行第一次遗传迭代计算，并得到第二代精英种群A2、第二代父代种群P2。具体步骤如下：

[0033] ①个体强度求取，将第一代父代种群与精英解种群组合成种群Rt，即求取种群Rt中每个个体的原始适应度函数值，并比较个体之间的相互支配关系；定义变量R(c)为种群Rt中第c个个体强度，即第c个个体可以被种群Rt其他个体支配的数量；其中个体Rt(c)原始适应度函数值求取过程如下：通过种群个体Rt(c)与环境状态变量平均值组建输入样本计算样本Xc原始适应度函数值并作为
个体Rt(c)的原始适应度函数值；

[0034] ②个体密度求取，利用个体Rt(i)与种群Rt中第b个邻近个体的距离值则个体Rt(c)密度函数

[0035] ③求个体的适应值，将上述所求个体Rt(c)的强度R(c)和所求个体Rt(c)的密度值D(c)的相加作为个体Rt(c)的适应值；

[0036] ④在种群Rt将所有的非支配个体全部放入精英种群A2，但要保持精英种群个体数为此时存在三种情况：A2中个体数为则不需要在操作，如果A2中个体数小于则需要在种群Rt剩余个体中选取适应值较小的个体放入A2中，保持A2个体数为如果A2中个体数大于则需要在A2个体中比较个体的密度值D(c)，将密度值较大的个体剔除，以保持A2个体数为

[0037] ⑤将A2中个体放入交配池中进行遗传操作得到第二代父代种群

[0038] ⑥将第二代父代种群P2与第二代精英种群A2组合，并重复①～⑤过程，直至gen＝GEN GENGEN，输出精英种群A ,将A 的个体作为优化结果；

[0039] 14)将优化后的决策变量，以及环境变量的平均值带入建立工艺过程模型，计算优化后的决策变量的系统性能，该优化后的决策变量取值可保证在固定产液量的情形下，耗电量降低。

[0040] 本发明的有益效果是，利用遗传算法优化的极限学习机算法(GAELM)建立油田机采过程的高精度模型，并利用建立油田机采过程的高精度模型，并利用智能特性的进化算法改进强度Pareto进化算法(Strength Pareto evolutionary algorithm 2,SPEA2)对建立的模型进行搜索，探寻抽油机生产过程中最佳工艺决策参数，给出面向节能降耗的抽油机生产最佳参数，指导生产。通过选择优化后的运行参数，可以使抽油机在运行过程中保证在产液量基本固定且具有最小偏好值的情况下，耗电量最小，从而可以降低油田生产成本并提高油田生产效率。

实施方案

[0051] 在下面的描述中，出于说明的目的，为了提供对一个或多个实施例的全面理解，阐述了许多具体细节。然而，很明显，也可以在没有这些具体细节的情况下实现这些实施例。在其它例子中，为了便于描述一个或多个实施例，公知的结构和设备以方框图的形式示出。

[0052] 图2是流程图，示出了本发明的一个实施例所述的基于遗传算法极限学习机的抽油机参数优化方法。如图2所示，本发明所述的基于遗传算法极限学习机的抽油机参数优化方法包括如下步骤：

[0053] 步骤S1：确定抽油机采油过程生产效率影响因素构成效率观测变量集合其中α1，α2为决策变量，α3～α146载荷数据环境变量，为其他环境变量，
选取抽油机系统的性能变量构成性能观测变量集合：{y1,y2,y3,…yl}。

[0054] 在本发明的一个实施例中，选取决策变量α1为冲次、决策变量α2为有效冲程、α3～α146为载荷1至载荷144，其余环境变量包括：理论排量、功率因数、有功功率、无功功率、含水率中的一个或多个变量；选取抽油机生产过程性能变量y1为产液量、y2为耗电量。

[0055] 步骤S2：获得所述生产效率影响因素和系统性能变量的样本数据，得到效率影响因素样本矩阵α和性能样本矩阵Y：

[0056]

[0057]

[0058] 其中为效率影响因素个数，N为样本个数，αik表示第i个效率影响因素变量的第k个观测值，i＝1,2,...,M；k＝1,2,...,N。

[0059] 步骤S3：利用主元分析算法对载荷数据进行降维处理，从而构建新的载荷主元变量。本发明中采用示功图描绘数据的144个载荷点做为部分环境变量进行建模。然而利用144维数据建模为参数维度灾难。故而利用主元分析算法对载荷数据进行降维处理。

[0060] 在一个实施例中，利用主元分析算法对载荷数据进行降维处理的步骤可以包括：

[0061] ①设置样本累计贡献率precent＝0.95；

[0062] ②获取载荷数据每个Lk具有第k观测变量的N个观测数据,3≤k≤146；

[0063] ③求出数据平均值并利用原始数据减去均值得到

[0064] ④计算协方差矩阵

[0065] ⑤计算协方差矩阵的特征值E1,E2,...,E144与特征向量EV1,EV2,...,EV144；

[0066] ⑥由大到小依次排列特征值E'1,E'2,...,E'M,对应特征向量为EV'1,EV'2,...,EV'144，按特征值大小顺序取前d个特征值的特征向量构成矩阵[EV'1,EV'2,...,EV'd]，此时其中d＜144；特征向量代表原数据的分布方向，其对应的特征值越大，则该向量越重要(即为主元)；其对应的特征值越小，则该向量越次要。

[0067] ⑦由[EV'1,EV'2,...,EV'd]与原始样本求取载荷新的主元，其新载荷主元观测变量构成集合:{αz1,αz2,...,αzd}，其为d个新变量，且每个变量为N个观测值构成的新主元矩阵：

[0068]

[0069] 步骤S4：由影响因素观测变量集合中非载荷变量与载荷新主元观测变量集合{αz1,αz2,...,αzd}构建网络输入变量集合：并令输入变
量集合为：{x1,x2,x3,...,xM}，即，

[0070] 步骤S5：构建输入变量集合{x1,x2,x3,...,xM}观测样本值：

[0071]

[0072]

[0073] 其中，x1～x2为决策变量，x3～xM为新的环境变量。

[0074] 步骤S6：对得到的训练输入样本X、输出样本Y进行归一化处理，得到新的训练输入矩阵输出矩阵

[0075] 在一个实施例中，所述归一化处理的算法如下：

[0076]

[0077] i＝1,2,...,M；k＝1,2,...,N

[0078]

[0079] j＝1,2,....,l；k＝1,2,...,N

[0080] 其中: 为设定输入变量归一化后数据范围的最大值、最小值；

[0081] xik为归一化前的第i个输入变量第k个样本值；

[0082] 为归一化后第i个输入变量第k个样本值；

[0083] xi,min＝min{xik|1≤k≤N}

[0084] xi,max＝max{xik|1≤k≤N}

[0085] 为设定输出变量归一化后数据范围的最大值、最小值；

[0086] yjk为归一化前第j个输出变量的第k个采集样本值；

[0087] 为归一化后第j个输出变量的第k个值；

[0088] yj,max＝max{yjk|1≤k≤N}

[0089] yj,min＝min{yjk|1≤k≤N}

[0090] 于是得到：

[0091]

[0092]

[0093]

[0094]

[0095] 步骤S7：在归一化后样本集中，选取样本集前组样本作为网络训练样本集则样本集剩余组作为测试样本集其中其中：训练样本集和测试样本集分别为：

[0096]

[0097]

[0098] 步骤S8：构建3层前馈神经网络，采用所述训练输入样本对该网络进行训练，利用遗传算法训练网络权值W、权值β、隐含层阈值b，从而确定网络的参数，最终得到可计算出任一组输入观测值x1,x2,...,xM所对应的输出预测值的前馈神经
网络：

[0099]

[0100] 具体地，在一个实施例中，如图3所示，所述3层前馈神经网络可以由输入层、隐含层和输出层组成，输入层与隐含层由权值W连接，其Wki表示第i个输入神经元与隐含层第k个神经元的间的连接权值；隐含层与输出层由权值β连接，其βkj表示第k个隐层神经元与输出层第j个神经元的间的连接权值；隐含层的神经元个数为s1，隐含层神经元的阈值为b，bk为第k个隐层神经元阈值；

[0101] 各权值、阈值具体为：

[0102]

[0103] 设隐含层神经元的激活函数为网络的第m组输入样本的输出为：

[0104]

[0105] 其中，Wk＝[Wk1,Wk2,…,WkM]，最终得到可计算出任一组输入观测值x1,x2,...,xM所对应的输出预测值的前馈神经网络：

[0106]

[0107] 在步骤S8中，利用遗传算法训练网络权值W、权值β、隐含层阈值b的步骤可以包括：

[0108] ①利用输入层到隐含层的权值W,隐含层阈值b构建初始种群P，该种群中第i个个体为设置初始种群P个体L＝50，设置最大遗传代数GEN＝100。

[0109] ①构建遗传算法优化网络权值阈值的适应值函数：

[0110]

[0111] ③计算第i个个体的适应度函数值，利用个体和训练样本输入样本计算隐含层神经元的输出矩阵H(i)：

[0112]

[0113] 由训练样本输入样本对应的输出样本与隐含层的输出矩阵H(i)共同求出(i) (i) -1 (i)隐含层到输出层的权值β ， (H ) 为矩阵H 的逆矩阵；在求出个体
对应的β(i)后，构建网络预测函数F(i)(Pi,β(i),X)；并将测试样本
集Xtest中的输入矩阵带入F(i)(Pi,β(i),X)得到预测测试集预测输出故
而计算个体Pi适应度函数值：

[0114]

[0115] ④对种群P进行选择、交叉、变异操作，得到子群Q。

[0116] ⑤种群Q进行③、④操作得到种群Q的子群。循环进行以上步骤，得到第GEN代子群，并在第GEN代子群中选择一个最佳个体Pbest，个体Pbest第GEN代子群中计算得到测试样本预测输出值与实际输出值的均方差最小。

[0117] ⑤由Pbest确定的输入到隐层的权值W，隐层阈值b，计算隐层输出矩阵Hbest。计算计算隐层到输出的权值矩阵输出权值βbest：βbest＝(Hbest)-1·Ytrain从而得到最佳模型。

[0118] 上述选择操作可以包括：在P中K个体中，按每个个体的概率φ(Pi)大小决定选中的机会，分K次从P中选择K个个体，其中概率

[0119] 上述交叉操作包括：将选择操作得出的K个个体进行二进制编码，个体中每个变量占据4字节，这样编码后一个个体的字节数为：4*(s1*M+s1)；将个体Pi和Pj二进制编码后，将两个个体二进制编码第4·c位以后的编码进行调换，从而得到两个新的个体和

[0120] 所述变异操作包括：将交叉操作得到的K个体进行二进制编码，其中某个二进制编码后的个体若第c位为1，则将1变成0；若第c位为0，则将0变成1,，从而得到一个新的个体Qi。

[0121] 步骤S9：针对产液量y1构造其偏好函数h＝h(y1)，该偏好函数为U形曲线，在其整个定义域上二阶可导且二阶导数恒大于零，将产液量y1的值划分为好、较好、一般、较差和极差5个区域，并通过所述偏好函数将该五个区域量化为数值h＝h(y1)；其中，产液量y1处于好区域对应偏好函数最小值。图4示出了本发明的一个实施例所使用的产液量偏好函数的图形。

[0122] 步骤S10：构建评价决策变量个体支配关系的适应度函数，系统的性能变量选取产液量(y1)、耗电量(y2)，结合步骤S9构建的产液量偏好函数，得到适应度函数如下：

[0123]

[0124] 步骤S11：计算抽油机工艺系统环境变量的平均值，以作为优化决策参数时的环境状态。

[0125] 计算环境参数平均值具体算法如下：

[0126]

[0127] 其中N为该环境变量训练样本数量。

[0128] 步骤S12：利用决策变量x1,x2构建多目标优化的初始种群PD的个体，即设置决策变量的上下限xmin、xmax,即x1min≤x1≤x1max，x2min≤x2≤x2max，利用决策变量(x1,x2)的K对数据构建初始种群PD，即初始化种群PD,令
其为第一代父代种群；生成一个空的精英解种群设置精英个体个数为设置最大
遗传代数GEN＝100。

[0129] 步骤S13：进行第一次遗传迭代计算，并得到第二代精英种群A2、第二代父代种群具体步骤如下：

[0130] ①个体强度求取，将第一代父代种群与精英解种群组合成种群Rt，即求取种群Rt中每个个体的原始适应度函数值，并比较个体之间的相互支配关系；定义变量R(c)为种群Rt中第c个个体强度，即第c个个体可以被种群Rt其他个体支配的数量；其中个体Rt(c)原始适应度函数值求取过程如下：通过种群个体Rt(c)与环境状态变量平均值组建输入样本计算样本Xc原始适应度函数值并作为
个体Rt(c)的原始适应度函数值；

[0131] ②个体密度求取，利用个体Rt(i)与种群Rt中第b个邻近个体的距离值则个体Rt(c)密度函数

[0132] ③求个体的适应值，将上述所求个体Rt(c)的强度R(c)和所求个体Rt(c)的密度值D(c)的相加作为个体Rt(c)的适应值；

[0133] ④在种群Rt将所有的非支配个体全部放入精英种群A2，但要保持精英种群个体数为此时存在三种情况：A2中个体数为则不需要在操作，如果A2中个体数小于则需要2 2 2
在种群Rt剩余个体中选取适应值较小的个体放入A 中，保持A 个体数为如果A中个体数大于则需要在A2个体中比较个体的密度值D(c)，将密度值较大的个体剔除，以保持A2个体数为

[0134] ⑤将A2中个体放入交配池中进行遗传操作得到第二代父代种群

[0135] ⑥将第二代父代种群与第二代精英种群A2组合，并重复①～⑤过程，直至gen＝GEN，输出精英种群AGEN,将AGEN的个体作为优化结果。

[0136] 步骤S14：将优化后的决策变量，以及环境变量的平均值带入建立工艺过程模型，计算优化后的决策变量的系统性能，该优化后的决策变量取值可保证在固定产液量的情形下，耗电量降低。

[0137] 下面以大港油田港510-3抽油机为实验对象采用本发明的方法进行优化。

[0138] 确定抽油机采油过程生产效率影响因素构成效率观测变量集合其中α1，α2为决策变量冲次、有效冲程，α3～α146功图载荷数据，α147为环境变量平均功率因数，α148为环境变量平均有功功率，α149为环境变量平均无功功率，α150为环境变量理论排量、α151为环境变量计算泵效、α152为环境变量含水率。选择抽油机生产过程的产液量y1、耗电量y2作为建立抽油机系统模型的性能变量{y1,y2}。

[0139] 采集油井2013年12月26日至2014年12月23日数据。对所有变量按照24小时为采集时间间隔求取24小时数据的平均值，并作为该变量样本。采集数据部分地示于表1和表2。

[0140] 表1

[0141]

[0142] 表2

[0143]

[0144]

[0145] 利用PCA输入变量降维处理，得到新主元数据示于表3。

[0146] 表3

[0147]

[0148] 构建新的采集建模样本数据[X,Y]。共获得可建模数据256组，示于表4中。

[0149] 表4

[0150]

[0151]

[0152] 将匹配后的数据与载荷新主元数据进行匹配，并进行归一化处理。归一化后的数据部分地示于表5。

[0153] 表5

[0154]

[0155] 基于遗传算法优化极限学习机建模。设定隐含层神经元个数为s1＝20，选择可建模样本中的200组作为训练样本。基于遗传算法得到最佳输入层到隐含层权值W和阈值b如下：

[0156]

[0157]

[0158] 图5示出了利用本发明的方法训练神经网络所产生的产液量训练效果图；图6示出了利用本发明的方法训练神经网络所产生的耗电量训练效果图。图7示出了测试样本产液量预测效果图；图8示出了测试样本耗电量预测效果图。

[0159] 由建模效果可知，训练效果较优，产液量、耗电量训练误差均控制在较小的范围，训练效果较好。由所得的建模与测试样本进行预测，得到测试样本误差百分比也控制较小的范围内，故知模型泛化能力较好。

[0160] 产液量偏好函数设计，根据偏好函数设计准则，采用3-S类软偏好设计，根据生产者对产液量的多少的喜爱程度用：极好、好、一般、较差、差等五个个等级描述。极好程度利用建模训练集中产液量所有值的平均值作为极好程度的偏好值为：47.3,并利用训练集中产液量最小值37.3、最大值57.3作为不可接受域的临界值。故而设计偏好程度区间为：[0,2],[2,4],[4,6],[6,8],[8,10]等，且设计的偏好程度区间所对应的实际产液量区间为：

[0161] [37.3,38.4],[38.4,39.6],[39.6,40.9],[40.9,42.8],[42.8,47.3]以及

[0162] [47.3,51.8],[51.8,53.6],[53.6,55.5],[55.5,56.2],[56.2.57.3]。故而设计产液量偏好函数为h(y1)＝0.1×(y1-47.3)2。图9示出了偏好函数的图形；

[0163] 利用决策变量(x1,x2)的K对数据构建初始种群P，设置种群大小50，即初始化的种群样本数量为K＝50；决策变量冲次(x1)的优化范围2.0≤x1≤4.5；决策变量有效冲程(x2)的范围3.0≤x2≤3.6。设置最大遗传代数GEN＝100。

[0164] 算环境参数平均值具体算法如下：

[0165]

[0166] 具体的环境参数平均值示于表6中。

[0167] 表6

[0168]

[0169]

[0170] 计算得到的产液量偏好值与耗电量的pareto解集关系示于图10中。Pareto前沿所对应的数值解集示于表7中。

[0171] 表7

[0172]

[0173] 在表7中，产液量偏好程度属于[0,1.3]区间，产液量在极好的范围内优化，符合抽油机定量采油的工作制度。

[0174] 将优化后的决策变量，以及环境变量的平均值带入建立工艺过程模型，计算优化后的决策变量的系统性能，与实际样本的系统性能平均值进行比较，在保证固定的产液量的前提下，耗电量降低，则上述方法有效。去产液量偏好值解集的平均值求取实际对应的产液量大小。其对比结果示于表8。

[0175] 表8

[0176]

[0177] 由表8可知，计算得到偏好程度平均值为0.75，此时产液量可能为49.51t/d或者45.08t/d。此时计算得到在保持定量式采油工作状态下，耗电量下降16.57％。系统效率比(产液量/耗电量)可提高8％。达到了节能设计目的。说明该方法有效。

[0178] 尽管已经结合详细示出并描述的优选实施例公开了本发明，但是本领域技术人员应当理解，对于上述本发明所提出的基于遗传算法极限学习机的抽油机参数优化方法，还可以在不脱离本发明内容的基础上做出各种改进。因此，本发明的保护范围应当由所附的权利要求书的内容确定。

附图说明

[0041] 图1示出了抽油机的工作模型；

[0042] 图2示出了本发明一个实施例所述的基于遗传算法极限学习机的抽油机参数优化方法的流程图；

[0043] 图3示出了本发明一个实施例中的前馈神经网络的结构；

[0044] 图4示出了本发明一个实施例中的产液量偏好函数的图形；

[0045] 图5示出了利用本发明的方法训练神经网络所产生的产液量训练效果图；

[0046] 图6示出了利用本发明的方法训练神经网络所产生的耗电量训练效果图；

[0047] 图7示出了测试样本产液量预测效果图；

[0048] 图8示出了测试样本耗电量预测效果图；

[0049] 图9示出了偏好函数的图形；

[0050] 图10示出了产液量偏好值与耗电量的pareto解集关系。

1基于遗传算法极限学习机的抽油机参数优化方法