国内或国外 期刊或论文

您当前的位置:发表学术论文网经济论文》 电力行业大数据研究综述> 正文

电力行业大数据研究综述

所属分类:经济论文 阅读次 时间:2021-10-11 10:33

本文摘要:摘要:概述了电力行业大数据的特点,介绍了数据的采集、存储和处理、分析和挖掘、应用,分别从发电、输电、配电、用电四大环节对电力相关的大数据应用研究进行归纳与总结,接着介绍电力大数据应用的成功案例,最后阐述了电力大数据应用面临的挑战。 关键词:电

  摘要:概述了电力行业大数据的特点,介绍了数据的采集、存储和处理、分析和挖掘、应用,分别从发电、输电、配电、用电四大环节对电力相关的大数据应用研究进行归纳与总结,接着介绍电力大数据应用的成功案例,最后阐述了电力大数据应用面临的挑战。

  关键词:电力;大数据;模型;算法;应用

电力论文

  1引言

  随着煤炭、石油、天然气、太阳能、光伏等多类型能源的引入,以及设备控制、感知与维护等电力相关领域信息化程度的提升,电力行业的数据正以高复合增长率快速膨胀,这些多源异构的海量数据共同构成了电力行业大数据[1,2]。大数据贯穿未来电力工业生产及管理等各个环节,起到独特而巨大的作用,是中国电力工业在打造下一代电力工业系统过程中有效应对资源有限、环境压力等问题,实现厚积薄发、绿色可持续性发展的关键[3]。利用大数据技术,人们可以掌握更加丰富详实的实时信息、历史信息,进行时间跨度更大、涉及业务范围更广的综合分析,以辅助电力行业内的更优决策[1,4-7]。

  电力论文范例: 电力工程汽轮机常见问题和措施分析

  例如,为克服新能源输出功率不稳定的缺点,人们需要综合分析各类气象因素,如温度、气压、湿度、降雨量、风向、风力等,以提高对新能源预测的准确度。但是,电力行业现有的数据管理方式和数据分析方法难以支撑如此大量、复杂且快速增长数据的存储、管理与分析[1,7],因此,急需引入大数据处理机制,提高数据的采集、存储、加工、处理和分析全链条的处理能力,满足能源及电力行业各阶段不同的应用需求,为管理提升和服务转型提供技术支撑[5,6]。本文先介绍电力行业大数据的特点和研究范畴,阐述了典型电力大数据分析算法,接着总结了近期电力大数据领域在发、输、配、用四大环节的相关应用研究。

  2电力行业大数据特点

  对照容量、速率、多样性、真实性和价值“5V”特征,电力行业的大数据有以下特点。

  (1)数据体量大:随着信息化的快速发展和智能电力系统的全面建成,电力设备产生了大量的运营数据。(2)数据类型多:传统的电力系统数据源包括:电表计量与计费数据、不同电力环节的电流、电压、谐波等测量数据、设备状态监测数据。随着传感器、信息传播技术、多媒体技术的发展以及各类电力信息化管理系统的普及,图像、视频等非结构化数据在电力数据中的占比不断加大,此外,电力行业内还有大量的环境数据、经济数据等需要进行关联分析,这些都直接导致了数据类型的增多,极大地增加了大数据分析的复杂度。

  (3)速率高:电力调度与保护类数据的采集、处理和分析对速率的要求高,数据本身有实时性的要求,对数分析结果往往也有实时性要求,如差动保护,使得系统要有快的响应速度和强大的数据处理分析能力。(4)真实性要求高:电力应用对数据的真实性要求高,然而,输配电线路与环境的噪声干扰、信息传输错误、非技术性失误等都会降低数据的真实性。(5)价值高:电力大数据涉及电力的生产、配送、交易和消费的方方面面,利用大数据技术提取有效信息,用于电能的分析、预测、管理及规划,潜在的经济、社会和环境效益高[1]。

  3电力大数据的研究范畴

  电力大数据研究可分为采集、清洗与存储、分析与挖掘、行业应用四大部分。

  3.1数据采集

  电力行业大数据不仅采集发电机组、储能系统、输电线路监测系统、调度自动化系统、配网自动化系统、用电信息采集管理系统、地理信息系统等行业内的信息,还采集如气象、政策法规等行业外的数据[6,7]。

  3.2数据处理与存储

  收集到的数据受到环境、传输等因素的影响,不可避免地存在噪声、缺失和错误,需要对原始采集到的数据进行预处理,经过处理后的原始数据在正确性、完整性、一致性和可靠性各方面得到提高。常用的数据处理方法有滤波、内插、异常数据的识别和删除等[8,9]。采用键值、列存储、文档和图形四个分类的非关系型的数据库(NoSQL),具有良好的可扩展性,解决了非结构化数据的存储难题[10,11]。随着云计算的普及,数据的存储走向了云端,云存储有着良好的架构设计与容错设计,代表性的云存储技术有谷歌公司的BigTable和亚马逊公司的Dynamo数据存储服务。

  3.3数据分析与挖掘

  大数据分析与挖掘按照处理的时间特性可以分为离线计算、批量计算、内存计算和流计算等方式[12,13];按照数据分析算法的原理可分为分类、聚类、关联分析、神经网络、降维和集成算法[4,6,14]。

  (1)分类算法在数据分析中,经常需要对数据进行分类,常见的分类算法包括决策树(DecisionTree,DT)、临近算法、支持向量机(SupportVectorMachine,SVM)、Boost树分类、贝叶斯分类等。单纯的分类算法仅适用于小规模数据集的挖掘,结合模糊理论可以提高分类的性能[15,16]。DT是一种有监督的学习,在构建决策树的过程中采用自顶向下的递归方式,每一次递归选取在当前状态下最优的特征或者属性来划分数据集,常用的特征包括:信息增益、基尼指数等。SVM是基于统计学理论的前馈学习网络,包括分类和回归两个步骤,以在特征空间找到最佳的超平面分离,模型构建的关键在于核函数及其参数的选择。SVM用于小数据集的时间序列分析、定量构效关系等领域时,线性与非线性的分类效果好,但用于样本数据集大的场合时,参数选择往往很困难,推理实效性差[17]。

  (2)聚类算法聚类将数据划分为不同的簇,簇间差异较大,簇内的差异较小,借此将正常状态和故障状态区分出来,适用于设备故障和异常状态的识别[14]。常用的簇间距离的度量包括:密度、曼哈顿距离、欧氏距离、汉明距离等。聚类是一种无监督的学习分类算法。经典聚类算法有K均值[18]、K中心点等。(3)关联分析关联分析基于支持度和置信度挖掘对象之间的关联关系,有效地应用于推荐系统、商业分析、公共管理等领域[14,19]。经典算法包括:Apriori和FPGrowth。FP-Growth基于Apriori构建,将数据集存储在一个特定的、称作FP树的结构来发现频繁项集,算法的执行速度快于Apriori。

  (4)神经网络神经网络已进行了数十年的研究,受限于计算机处理能力和训练数据量的不足,早期应用的性能并不理想。随着计算、存储能力的提升和云计算架构的普及,神经网络模型获得了足够多的训练数据,构造的网络规模越来越大,精确性也得到提高。常见的神经网络包括:反向传递神经网络(BackPropagationNeuralNetwork,BPNN)、自组织映射、循环神经网络、长短期记忆神经网络(LongShort-TermMemory,LSTM)等。

  (5)数据降维维度算法是以非监督学习的方式利用较少的信息来归纳或者解释数据,与聚类算法一样,常用于高维数据的可视化或者简化输入数据,以便于监督式学习算法的应用。常见的算法包括:主成分分析(PrincipalComponentAnalysis,PCA)、香农映射、偏最小二乘回归、多维尺度分析、投影追踪等。(6)集成算法集成算法用一些相对较弱的学习模型独立地就同样的样本进行训练,然后把结果整合起来进行整体预测。集成算法的难点在于如何针对具体应用来选择集成哪些较弱的学习模型以及如何整合最终的学习结果。常见的算法包括:Boosting、BootstrappedAggregation(Bagging)、AdaBoost、堆叠泛化、梯度推进机、随机森林[20]。

  3.4数据分析的应用

  电力企业可通过电力大数据分析用户对电能的需求量、用电特征等信息,依据客户实际情况科学制定供电方案,以提高服务质量[21]。电力企业可利用历史数据,绘制用电设备监测表格,若电力设备发生故障可及时明确故障原因,主动向维修人员推送故障信息,这对提升电网抢修速度、缩小故障范围、缩短停电时间十分重要。例如,基于用能数据、地理信息以及气象数据可以分析区域内的能源结构与耗能特性,为实现能源的可持续开发与利用提供指导方向。

  4电力行业的大数据研究

  电力行业的大数据产生于发电、输电、配电、用电四个环节。在能源与电力改革的大背景下,大数据在电力系统的发输配用环节得到利用,有力提升了电力系统的运行水平和管理水平。

  4.1发电领域的大数据研究

  包括风能、太阳能、潮汐等各种可再生新能源具有分布广泛、可再生的环境友好特性,但具有断续性和不稳定性,对其的利用是电力工业面临的重大挑战。

  4.1.1新能源功率预测

  为了提高新能源的调度、维修和管理水平,采用基于大数据集的建模系统来建立可再生能源的精确预测模型成为全球研究的热点[22-31],主要的数据分析方法包括:SVM[24,26]、神经网络[24,26,28]。文献[24]提出了一种反向传播和牛顿插值数学函数法相结合的神经网络算法,对风速数据进行处理,从而达到预测发电量的目的。文献[29]先采用数据分割剔除异常数据,根据紊流强度将数据分为若干个子集和等分部分,计算每个最小部分中数据的质心,以质心作为SVM算法的训练数据,实现对风力发电机组功率曲线的建模。

  文献[26]提出了一种基于K均值和神经网络的数据挖掘方法,利用历史记录中的气象信息进行聚类分析,将历史记录中的气象信息分为不同的类别,然后对基于bagging算法的神经网络进行训练,从而得到风能的预测结果。文献[27]运用SVM回归方法,通过将经验模式分解得到若干固有模式函数和参数,依据历史风速时间序列来预测风速。太阳辐射、温度和其他气象因素的变化导致光伏发电的输出功率非常不稳定的。

  文献[28]采用两个LSTM神经网络的注意机制分别对温度和功率输出进行自适应预测,以时间序列的方式对短期光伏发电量进行预测。文献[29]从宏观和微观两个方面研究了分布式光伏系统的扩散趋势和预测方法,宏观方面对光伏系统的容量和位置做了聚类分 析,微观方面对光伏的功率进行预测。文献[30]利用高分辨率天气预报数据,用不同时空关联性的深度卷积神经网络来捕捉云层运动模式及其对太阳能发电预测的影响。文献[31]对光伏发电时间序列的内在和随机特性进行多尺度分析,包括:大时间尺度数据的多重聚类分析、小时间尺度数据的标准化变换和概率分布建模,并将聚类结果与气象领域的理论模型进行了交叉验证,实现对光伏发电量的预测。

  4.1.2发电控制和调度

  随着各类新能源、分布式电源、电动汽车等的不断接入,提高电力调控智能化水平势在必行,而大数据技术在数据整合集成能力上表现优越,为其在电力调控中的应用提供了广阔空间。文献[32]依据风电功率预测的精度随时间尺度减小而提高的特点,采用基于核密度估计的稳健优化方法来处理风电的不确定性,实现风电、水电和火电系统的多时间尺度鲁棒调度模型,以最小的输出总功率调整来满足功率平衡。文献[33]采用K均值聚类和PCA的混合型降维方法,利用少量代表性站点的实测值来估算太阳能发电站点的总发电功率,以便于发电侧的调度。

  4.2输电领域的大数据研究

  随着电网广域测量系统的发展,电网形成了具有时空特性的高维海量运行数据,使得数据驱动的电网状态分析成为可能。

  4.2.1暂态稳定性分析

  暂态稳定性分析是保证电网稳定运行的重要手段。文献[34]考虑电网运行数据特点建立数据模型,结合随机矩阵理论和时间序列分析建立量化评价指标,在整体分析电网运行状态的基础上,分析不同扰动对电网稳定的影响程度和影响范围;文献[35]综合随机矩阵理论中M-P定律、圆环率、线性特征值及熵理论来评估电网受扰后的脆弱性,得出了电网的薄弱点评判指标。

  4.3配电领域的大数据研究

  随着配电自动化设备的普及,越来越多的运行数据可从监控和数据采集系统中收集得到,通过大数据分析可以获知配电网的薄弱环节及设备故障隐患,提高故障定位和抢修的反应速度,缩短停电时间,提高配电网的供电可靠性。

  4.3.1配电网故障定位

  传统的配电网故障定位采用行波测距方法[43],需要沿线路加装数量众多的测量装置,而基于大数据分析的故障定位方法利用形式化分类器模型[44,45]或神经网络技术[45,46]可以在任何给定的时间分析网格信息,从而确定网格的健康状况。文献[44]仅利用在一级变电站测量到的电压暂降数据,用SVM对未测量到的数据进行估计,采用匹配法确定可能的故障区段,采用欧氏距离法分析确定故障距离,实现了利用有限模拟数据来检测单端母线故障区段和故障距离的综合故障定位。

  文献[45]结合SVM数据描述和核密度非参数估计,提出了一种基于多层次系统分区和子区域概率故障检测的定位策略,不采用0或1的硬判决方式,而采用概率密度函数来获得各子区域故障检测的置信度来定位故障区域。文献[46]采用直觉模糊集来表示报警信息的不确定性,利用拓扑分析和电气设备、保护动作、断路器跳闸之间的逻辑关系,建立了基于直觉模糊Petri网的电力系统诊断模型。文献[47]利用配电网历史告警信息和通用电网保护配置模型构造假设告警序列,并和真实告警序列做时序置信度的相似性计算,再利用直觉模糊Petri网络进行故障诊断。该模型具有很好的处理直觉模糊集不确定信息的能力,并用时间置信度对模型的初始位置值进行修正。

  4.4用电领域的大数据研究

  随着高级量测体系(AdvancedMeteringInfrastructure,AMI)的逐步完善和智能电表的普及,用户侧用电数据的规模日益增长,为用电领域的大数据分析提供基础。

  4.4.1用电负荷预测

  动态电力市场交易需要准确的短期负荷预测,用循环神经网络[54-56]分析收集到的历史用能数据,可有效提高负荷预测的准确度,为能源管理、运行和市场分析提供重要依据。不同于输变电领域的负荷预测,单户住宅的能耗通常是难以预测的,为了克服负荷曲线的波动性和不确定性,文献[55]用循环神经网络构建了基于相似性的链式传递学习方法,提高了运算效率,而文献[56]采用简单池化的循环神经网络来避免过度拟合问题。

  LSTM[57,58]可解决一般循环神经网络存在的长期依赖问题,文献[57]采用该模型构建了以季度和月份为检测窗口的电能消耗预测模型和异常用电检测方法。鉴于传统SVM存在输入变量不易确定以及模型参数难最优化的问题,文献[58]提出了一种基于最小绝对值收缩与选择算子的LSVM短期负荷预测方法,提高了预测结果的准确性和稳定性。

  5电力行业大数据应用的案例

  5.1大数据在新能源电力调度中的应用

  建设具有较高精度的风电和光伏功率预测系统,是解决这两种新能源并网运行的关键措施。风光功率预测系统以风电场和光伏电站的历史功率数据、地理地形、气候规律数据等为基础建立预测模型,利用气象部门发布的天气预报数据,采用神经网络类的大数据分析方法[24,26,28,77],来预测风电和光伏的短期和超短期功率输出数值,生成功率预测曲线,为电力调度决策提供依据。贵州电网利用境内众多的小水电站资源,建立了风光功率预测系统,实现了调管范围内的风电、光伏、小水电的合理调度控制,基本保证了全额消纳间歇式的风光新能源,实现了功率预测技术和调度运行的有效结合,取得了显著的环境效益和经济效益。

  5.2大数据的反窃电应用

  窃电现象在我国部分地区仍然严重,特别是工业用电大户的窃电行为给电力系统带来了大的经济损失和潜在的安全隐患,然而,现场检查耗时耗力、风险高、不确定因素多,传统反窃电工作的难度很大。国家电网公司研制的大数据反窃电分析平台通过分析电流、电压、线损、波形等数据变化情况,综合运用相关性分析、模式识别、决策数判决等多个大数据分析模型进行用电档案信息、历史数据、同行业数据等数据指标的比对,绘制窃电用户画像,提高了识别潜在窃电用户的精准度[78]。

  6电力行业大数据研究面临的挑战

  尽管发电、输配电网、供电公司都对大数据分析及其在各自业务中的应用表现出了极大的兴趣,但是,多重因素导致实际部署的大数据应用甚少。电力行业是个庞大复杂、高度耦合的有机运行体,相对封闭的管理体制形成了条块分离的垂直业务系统,相关数据隔离存储在多个系统之中,而战略级别的应用顶层设计缺位导致应用软件和数据库互通缺乏标准的数据格式,不同历史阶段部署的各类信息和通信系统普遍存在互操作性问题,使得实际应用过程中的数据获取困难[1,79,80]。

  此外,作为关乎国计民生的命脉,电力行业各环节产生的数据都有保密要求,有的被划分为机密类别,有的涉及用户个人隐私[81],因此,对于研究人员来说,进行高度相关的研究是十分困难的,导致大部分的研究还是停留在用理想数据进行算法的测试与验证上,实践价值有待提高。

  7总结

  本文先描述了电力行业大数据的五个特点,即:体量大、类型多、速率高、真实性要求高、价值高;接着简要介绍了电力大数据研究范畴的四个方面,包括:数据的采集、数据的存储和预处理、概括得出的六大类数据分析和挖掘算法以及大数据分析结果的应用;重点按发电、输电、配电、用电四大环节对当前电力大数据研究的现状进行归纳与总结,接着介绍了电力大数据分析在新能源电力调度和反窃电两个应用方向的成功案例,最后指出电力大数据应用面临的各种挑战。

  电力行业中的大数据分析是一个全面而复杂的研究领域,要实现在设备运行和行业建设中发挥出作用,不仅取决于大数据的分析算法,还需要综合系统运行、用户行为模式、信息通信技术、管理制度等多领域的专业知识,需要多领域专业技术与智能算法间的协同配合,技术挑战和应用前景都非常巨大。

  参考文献(References):

  [1]IEEESmartGridBigDataAnalyticsMachineLearningandArtificialIntelligenceintheSmartGridWorkingGroup.Bigdataanalyticsinthesmartgrid:introduction,benefits,challengesandissues[R].2018.

  [2]DarkH,HannaniE,AqqalA,etal.Bigdatamanagementinsmartgrid:concepts,requirementsandimplementation[J].JournalofBigData,2017,13(4):1-19.

  [3]中国电机工程学会电力信息化专业委员会(PowerInformationProfessionalCommitteeofChineseSocietyforElectricalEngineering).中国电力大数据发展白皮书(WhitepaperonthedevelopmentofChinaelectricpowerbigdata)[R].2013.

  [4]曹军威,袁仲达,明阳阳,等(CaoJunwei,YuanZhongda,MingYangyang,etal.).能源互联网大数据分析技术综述(Surveyofbigdataanalysistechnologyforenergyinternet)[J].南方电网技术(SouthernPowerSystemTechnology),2015,9(11):1-12.

  [5]MaZ,XieJ,LiH,etal.Theroleofdataanalysisinthedevelopmentofintelligentenergynetworks&application[J].IEEENetwork,2017,31(5):88-95.

  作者:赵海波

转载请注明来自发表学术论文网:http://www.fbxslw.com/jjlw/28355.html