电网数据存储技术选型的研究

(整期优先)网络出版时间:2018-12-22
/ 2

电网数据存储技术选型的研究

何子骥唐军伟

(新疆信息产业有限责任公司新疆乌鲁木齐830026)

摘要:随着信息技术的发展,人们对电网建设的关注程度越来越高,建设电网的主要基础以物理电网,电网的发展在符合电力发展的前提下提高了质量和数量,在一定程度上减少了输电成本,同时也符合国家可持续发展的需要,完成了信息分析、信息处理、信息集成、信息安全和信息显示。电网数据的存储技术,实现了电网的建设。从电力企业的设备监测以及运行,对电力企业的管理以及电力企业的营销数据进行全方位的处理与分析,在电网规模不断扩大的基础上,输电线路的状态实时监测数据库处理的工作量不断提升,确保输电线路监测运行状态处于正常情况下,以符合监视控制、培训以及运行管理需要。

关键词:电网;数据存储;选型

电网需要监测的电气设备分布范围广,获取的数据以千位数量级增长,对实时性和可靠性要求更高,面对这些分布式、海量、多源异构的信息,采用一般数据存储方式会导致网络的阻塞和重载。所以,针对电网对数据的存储及实时读取的要求传统的集中式关系数据库无法满足。本文针对未来电网中大规模的动态感知数据存储技术的选型进行了深入研究,并充分考虑了电网对数据的存储、传输以及查询方面的要求,提出了一种以数据为中心的支持未来大规模电网的数据存储方法。

1电网数据概述

在电网运行的众多数据中,负荷预测数据、计划类的数据、基础性的数据以及电网运行的数据等属于结构性的数据方式。再者,在应用中还有一些非结构性的数据方式存在。比如:视频的监控以及图形图像的处理等慢慢在应用中发挥出重要的作用。随着电网数据规模的扩大、结构的渐渐复杂、应用种类的增多,进行高质量的数据存储相对来讲较为困难。所以,必须要对于系统运行的方式和结构等等进行整体性改变,将存储的质量提高上来。

2电网数据存储技术

2.1数据存储方法分类

2.2.1结构化方法

结构化方法的中心思想是:对数据的存储位置进行计算的时候主要采集数据的节点利用散列函数来进行的,随后再将感知数据根据相应的数据传输方式向对应的节点进行发送然后完成存储。结构化方法有多种,其中主要以GHT方法较为典型,该方法的主要思路就是利用散列函数将事件或者是数据在某个地理位置当中映射出来然后进行存储,可以完成数据的分类存储功能,查询的时候十分方便。然而不足之处在于,假如采用的散列函数映射机制对于映射距离没有充分进行考虑,会导致查询指令或某些数据的传输距离太远而而导致系统资源和能量的浪费,再者对于系统的实时性也无法保证。再者,GHT方法可能会面对较高的节点失效的风险,从而对整个系统性能造成影响,同时容易发生热点区域的查询瓶颈问题。

2.2.2非结构化方法

现阶段,针对非结构化存储方法的实际应用以及理论研究较少,主要是由于这种存储方法大多数操作的完成都时采集数据的传感器节点本身,如节点需要根据之前确定的时间间隔对数据进行采集然后上传给某个基站,或者是存储在本地,再者还需要节点本身主动向查询用户或者是系统终端进行监测数据方面的报告。经过实验证明和理论分析,在开销方面非结构化存储方法节点自身较大,现阶段在实际的系统运行当中还没有对其进行有效的运用。

2.2分布式存储策略

2.2.1GHT存储方法

GHT,即地理散列哈希方法,该方法主要是将感知数据中的某个部分作为哈希函数的输入关键字,在某个地理位置当中对检测事件或者该数据进行映射,最后利用GPSR路由协议在距离哈希位置最近的节点上对其进行数据存储。为了有效防止传感器节点故障导致数据丢失的情况,在电网的应用中,GHT存储方法在进行多点存储的时候还采用了结构化复本的方式。GHT方法的不足在于:(1)传感器节点一定要做自己的所在地理位置有所了解。(2)GHT方法的存储代价很高,再者当数据量较大的时候,可能会造成数据丢的情况。

2.2.2DIM存储方法

DIM也是一种基于信息中介映射机制的分布式数据存储方法。数据存储的时候需要事先选择合适的哈希函数对数据的存储位置进行确定;DIM存储方法的关键是具有局部保持特性的哈希函数的选择以及以数据为中心的存储。DIM方法的不足在于:通过地理路由协议GPSR进行数据传输时,所以电网监测端的每个传感器节点对于自身所处的地理位置信息必须要知道;K-D树的维护困难,耗费系统资源。

2.2.3SCOOP存储方法

SCOOP方法主要是对上述几种策略都没有考虑电网中监测系统采用的信息中介机制的动态性,即当监测数据的存储位置通过信息中介映射到某个固定位置后就不再发生变化。SCOOP数据存储方法在多查询和多基站的情况下十分有效,但是其不足之处在于是当对处于野外的电网系统或输电线路进行监测时,基站节点的工作负荷较大。

3应“以实用质量为先”作为存储技术选型方法

3.1以“实用质量为先”的技术选型依据

3.1.1恢复可靠性

备份本身没有价值,其唯一价值体现于恢复,因而这一要素无疑是重中之重。备份系统的恢复可靠性主要取决于备份硬件对于所存数据采用的完整性、可靠性和一致性保护。

3.1.2运行稳定性

与生产存储不同,备份存储属于后台操作,通常都是在无人值守的夜间进行的,及时处理所发生问题,所以其要求稳定可靠的运营状态。

3.1.3运维便利性

作为运营支撑系统的一部分,备份在出现故障的时候为了对于整体业务的运营造成影响需要尽快修复。更重要的是,需能确保维护过程不会对已有的备份数据造成损坏。

3.1.4实用持续备份速度

备份一般情况下需占用生产主机/服务器,通常均会在业务量低的夜间备份窗口内进行(电网数据系统一般允许每天6~8个小时),所以对实用备份速度有一定要求;

3.1.5复杂环境兼容能力

电网数据的应用环境复杂,且会不断升级、增添或者是变化。备份系统一定要能够对其进行良好适应,从而不对系统的升级、扩展以及改造造成相应的负担。

3.2首选方案

在进行电网数据存储及时选型的时候本着以“实用质量为先”的原则,磁盘磁带化技术可谓是首选。

现阶段在RAIT容错磁带库技术之上发展起来的磁盘磁带化技术在存储备份领域广泛应用。磁盘磁带化技术对磁带与磁盘二者之间存储的技术优势进行了有效结合,实现了磁盘的逻辑封闭存储。

磁盘磁带化技术的创新在于将磁带的裸数据读写技术和磁盘热容错RAID技术合而为一,兼收两种存储技术的优势,实现了存储载体中离线封闭性和设备安全性的功能组合,符合电力信息系统数据保护的多层次需求,是适合电网数据信息系统备份、灾备与存档等应用的佳选择。

结束语:

针对电网数据存储技术进行分析,对于我们开展电网数据分类存储是非常有利的,然后针对原有的电网系统进行智能化、现代化的改造,将电网数据运行的水平和质量提高上来,从而有效确保电网系统的安全性,进一步的满足人们对稳定安全、高质量、电力资源应用的需求。

参考文献:

[1]王尔玺,周一.基于云平台的分布式新能源监控数据分析方法研究[J].能源与环保,2018,40(03):154-158.

[2]陆海锋.分布式的XML数据存储和信息传输模型研究[J].现代计算机(专业版),2018(06):85-88.

[3]刘大为.电力调度SCADA系统中历史数据压缩及存储策略[J].内燃机与配件,2018(02):224-225.

[4]孙辉,卢炳德.大规模电力设备监测数据存储和批量特征分析[J].电力信息与通信技术,2018,16(01):26-32.