[0048] 为了便于本领域人员更好的理解本发明,下面结合附图和具体实施例对本发明做进一步详细说明,下述仅是示例性的不限定本发明的保护范围。
[0049] 本实施例公开的一种基于周期传输模型的开关柜传感器网络数据压缩方法,如图1所示,包括如下步骤:
[0050] 步骤S1、传感器节点采集当前周期的读数,并将采集的所有读数按时间次序构建读数向量R。
[0051] 具体地,传感器节点在当前周期内采集读数,每采集一个读数,令读数的数量加“1”,当获得τ个读数时,按时间次序构建读数向量:
[0052] R=[r1,r2,...,rτ]
[0053] 上式中,τ表示当前周期的读数总个数,τ=2N,N∈Z,Z为整数集;
[0054] 并将R加入待执行读数向量集。
[0055] 步骤S2、从待执行读数向量集中按照加入次序选择某一向量Ri,并根据向量Ri中元素个数将其分为两类:第一类是将该向量Ri划分成两个元素个数相等的子向量,计算两个子向量的皮尔逊相关系数和两个子向量中元素均值差绝对值;第二类是直接计算向量中两元素差的绝对值。
[0056] 具体地,步骤S2具体包括如下:
[0057] 步骤S2.1、从待执行读数向量集中按照加入次序选择向量Ri,并判断向量Ri中元素个数2n是否等于2:若2n≠2,则执行步骤S2.2;若2n=2,则执行步骤S2.3;
[0058] 步骤S2.2、将该向量Ri划分成两个元素个数相等的子向量和 并计算两个子向量的皮尔逊相关系数 和两个子向
量中元素均值差绝对值
[0059] 其中,皮尔逊相关系数 的计算公式如下:
[0060]
[0061] 上式中, 表示数据的相关性;
[0062] 然后判断 与tp的大小关系和 与tm的大小关系:
[0063] (1)若 且 则认为 与 是高度正相关且向量元素均值相近;其中, 和 分别表示两个子向量元素的均值,tp表示高度相关阈值数,tp∈[‑1,
1],tm表示均值相近阈值数,tm≥0,tp值越高数据越精确、越低压缩率越高,tm则相反,tm值越低数据越精确、越高压缩率越高,tp和tm的值根据具体情况合理调整;
[0064] 记元素值为两个子向量对应元素值的平均数的向量
[0065]
[0066] 更新 并更新读数向量R中Ri的对应位置的值;从待执行向量集中剔除向量Ri,并将 加入待执行数据集;
[0067] (2)若 或 则认为 与 不是高度正相关或向量元素均值不相近;
[0068] 当 中元素个数n=2且 和两元素差的绝对值大于tm时,则执行步骤S3;否则,则按照次序将 和 加入待执行读数向量集;
[0069] 步骤S2.3、计算向量中两元素差的绝对值 再判断 与tm的大小关系:
[0070] (1)若 则认为Ri中两元素的值相近,令:
[0071]
[0072] 然后更新读数向量R中Ri的对应位置的值;
[0073] (2)若 则保持原数值。
[0074] 步骤S3、将步骤S2中第一类的两个子向量中的某一读数元素视为候补离群值,判断候补离群值是否为离群值:若是,计算并更新读数向量;否则,保持原数值。
[0075] 本实施例中,步骤S3具体包括如下:
[0076] 步骤S3.1、将子向量 和 中的读数元素ri视为候补离群值,并令
[0077] 分别计算 和 与向量Ri′的皮尔逊相关系数 和
[0078]
[0079] 其中,Ri′获得方法如下:取读数向量集R中Ri的向量首元素位置除以8的余数,若余数为1,则从尾元素位置后一个开始向后取4个元素组成向量Ri′,若余数为5,则从首元素位置前一个开始向前取4个元素组成向量Ri′;j=4,5, rl∈Ri′;
[0080] 步骤S3.3、分别判断 和 与tp的大小关系,以及对应的两个子向量中元素均值差绝对值 与tm的大小关系:
[0081] (1)若 且对应的 则认为 与Ri′高度相关,元素均值相近且读数元素ri是离群值;若 且对应的 则认为 与Ri′高
度相关,元素均值相近且读数元素ri是离群值;
[0082] 其次,若 和 的计算值都满足以上情况,即, 且对应的以及 且对应的 则取 满足的情况:计算对
应的 更新 并更新读数向量R中Ri和Ri′的对应位置的值;
[0083] (2)若同时满足 或对应的 以及 或对应的则认为读数元素ri不是离群值,保持原数值。
[0084] 步骤S4、当待执行读数向量集为空时,统计读数向量集中的相同元素个数和不相同元素个数,编译字典,以减少数据的位数,进一步压缩数据。
[0085] 本实施例中,步骤S4具体包括如下:
[0086] 当待执行读数向量集为空时,则表示所有数据处理结束;统计读数向量集中的相同元素个数和不相同元素个数,并按相同元素个数从大到小排列,按不相同元素个数分配二进制索引,编译成如下字典,最后将读数向量R中的元素读数代替为二进制索引:
[0087] 表1 编译的字典
[0088]不相同元素个数ni 索引二进制表示s1 对应元素读数ri
1,2 0,1 r1,r2
3,4 00,01,10,11 r1,r2,r3,r4
5,6,7,8 000,001,...,111 r1,r2,...,r8
… … …
[0089] 步骤S5、将步骤S4得到的字典与读数向量集R传输给下一个传感器节点。
[0090] 步骤S6、进入下一周期,并按照上述步骤S1‑S5持续循环。
[0091] 本发明所述的数据压缩方法在处理带扰动的周期开关柜传感数据时,能达到良好的效果,可以将开关柜传感器网络数据压缩至原数据的10%‑30%,并保证数据失真率在0.5%‑5%以内,单个读数周期的读数总个数越多,压缩率越高。由于本发明的方法保证了时序,所以开关柜传感器数据对时间的变化趋势也有一定的保障。同时,根据具体情况合理调节两个阈值tp和tm,可使压缩方法达到不同的效果,具有一定的灵活性。
[0092] 以上仅描述了本发明的基本原理和优选实施方式,本领域人员可以根据上述描述做出许多变化和改进,这些变化和改进应该属于本发明的保护范围。