电力窃漏电用户自动识别 2017/4/10.

Slides:

Advertisements

Similar presentations

四川财经职业学院会计一系会计综合实训目录情境 1.1 企业认知情境 1.3 日常经济业务核算情境 1.4 产品成本核算情境 1.5 编制报表前准备工作情境 1.6 期末会计报表的编制情境 1.2 建账.

Advertisements

主编：邓萌【点按任意键进入】【第六单元】教育口语. 幼儿教师教育口语概论模块一幼儿教师教育口语分类训练模块二适应不同对象的教育口语模块三《幼儿教师口语》编写组.

第一組加減法思澄、博軒、暐翔、寒菱. 大綱 1. 加減法本質 2. 迷思概念 3. 一 ~ 七冊分析 4. 教材特色.

海南医学院附院妇产科教室华少平妊娠合并心脏病  概述  妊娠、分娩对心脏病的影响  心脏病对妊娠、分娩的影响  妊娠合病心脏病的种类  妊娠合并心脏病对胎儿的影响  诊断  防治.

植树节的由来植树节的意义各国的植树节纪念中山先生植树节的由来历史发展到今天， “ 植树造林，绿化祖国 ” 的热潮漫卷了中华大地。从沿海到内地，从城市到乡村，涌现了多少造林模范，留下了多少感人的故事。婴儿出世，父母栽一棵小白怕，盼望孩子和小树一样浴光吮露，茁壮成长；男女成婚，新人双双植一株嫩柳，象征家庭美满，幸福久长；

客户协议书填写样本和说明河南省郑州市金水路 299 号浦发国际金融中心 13 层吉林钰鸿国创贵金属经营有限公司.

浙江省县级公立医院改革与剖析马进上海交通大学公共卫生学院

第二章环境.

教师招聘考试政策解读讲师：卢建鹏

了解语文课程的基本理念，把握语文素养的构成要素。把握语文教育的特点，特别是开放而有活力的语文课程的特点。

北台小学构建和谐师生关系做幸福教师 2012—2013上职工大会.

福榮街官立小學我家孩子上小一.

第2期技職教育再造方案（草案）教育部 101年12月12日 1 1.

企业员工心态管理培训企业员工心态管理培训讲师：谭小琥.

历史人物的研究 ----曾国藩组员: 乔立蓉杜曜芳杨慧组长:马学思杜志丹史敦慧王晶.

教育部高职高专英语类专业教学指导委员会刘黛琳山东 • 二○一一年八月

淡雅诗韵七（12）班第二组蔡聿桐.

第七届全国英语专业院长/系主任高级论坛汇报材料

小數怕長計, 高糖飲品要節制瑪麗醫院營養師張桂嫦.

制冷和空调设备运用与维修专业全日制2+1中等职业技术专业.

会计信息分析与运用 —浙江古越龙山酒股份有限公司财务分析组员：2006级工商企业管理专业金国芳叶乐慧魏观红徐挺挺虞琴琴.

第六章人体生命活动的调节人体对外界环境的感知.

芹菜英语051班 9号黄秋迎概论:芹菜是常用蔬菜之一，既可热炒，又能凉拌，深受人们喜爱。近年来诸多研究表明，这是一种具有很好药用价值的植物。别名:旱芹、样芹菜、药芹、香芹、蒲芹。芹菜属于花,芽及茎类。

2012年学生党支部书记工作交流大连理工大学建工学部孟秀英

北京市职业技能鉴定管理中心试题管理科.

2014吉林市卫生局事业单位招聘153名工作人员公告解读

各類所得扣繳法令與申報實務財政部北區國稅局桃園分局 103年9月25日

初級游泳教學.

爱国卫生工作的持续发展区爱卫办俞贞龙.

第八章数学活动方程组图象解法和实际应用

本课内容提要一、汇率的含义二、汇率变化与币值的关系三、汇率变化的影响. 本课内容提要一、汇率的含义二、汇率变化与币值的关系三、汇率变化的影响.

散文鉴赏方法谈.

比亚迪集成创新模式探究深圳大学2010届本科毕业论文答辩姓名：卓华毅专业：工商管理学号：指导老师：刘莉

如何撰写青年基金申请书报告人：吴金随.

点击输入标题点击输入说明性文字.

國際志工海外僑校服務越南國立臺中教育大學 2010年國際志工團隊.

學分抵免原則及學分抵免線上操作說明會.

教学查房黄宗海南方医科大学第二临床医学院外科学教研室.

评建工作安排.

“十二五”国家科技计划经费管理改革培训概预算申报与审批国家科学技术部 2012年5月.

“十二五”国家科技计划经费管理改革培训概预算申报与审批国家科学技术部 2012年5月.

首都体育学院武术与表演学院张长念太极拳技击运用之擒拿首都体育学院武术与表演学院张长念

现行英语中考考试内容与形式的利与弊黑龙江省教育学院于钢 2016, 07，黄山.

第5讲：比较安全学的创建吴超教授 (O)

彰化縣西勢國小備課工作坊新生入學的班級經營主講：黃盈禎

重庆市西永组团K标准分区基本情况介绍.

西貢區歷史文化清水灣鍾礎營,楊柳鈞,林顥霖, 譚咏欣,陳昭龍.

所得稅扣繳法令與實務財政部北區國稅局桃園分局 102年12月19日 1 1.

角色造型第四章欧式卡通造型主讲：李娜.

走进校园流行高二15班政治组指导老师：曾森治老师.

医院文化建设广东省中医院 2011年3月26日.番禺.

案例：海底捞模式 ——把服务做到极致.

医疗法律法规培训连云港市东辛农场医院周卫平二0一四年十二月.

史泰博出货检验员面试中·········

09英本2班罗芬.

个人所得税扣缴申报表填报讲解.

主講人:孫台義教授哈薩克大學國際關係學院客座教授

土地增值税清算业务培训主讲人：吴金娟怀集地税.

实训报告财务管理二班第三小组组长：董文芳执笔人：王瑾组员：汲伦庞宁宁姜美.

义务教育英语（7—9年级）教学指导意见.

資源中心辦理補救教學之推動重點服務單位：國立新竹教育大學演講者：林志成教授.

增值税相关知识莱西市国家税务局刘冬梅.

流通业务外包的实践与思考魏育辉北京工业大学图书馆 2012年5月31日.

项目二站姿、蹲姿、坐姿.

怎样吃饭有礼貌？ ——商务宴会礼仪培训 2014年7月24日.

新编报关实务（第二版）新世纪高职高专教材编审委员会组编主编肖立秋侯伟强李坪新世纪高职高专

从“钱学森之问”谈创业型经济发展与创新人才培养

用相频曲线测阻尼系数的探索指导教师陈乾吉新程.

Presentation transcript:

电力窃漏电用户自动识别 2017/4/10

目录 1 背景与挖掘目标 2 分析方法与过程 3 上机实验 4 拓展思考

案例背景据统计，全国每年因窃电造成的损失都在200亿元左右；被查获的窃电案件不足总窃电案件的30%。如深圳龙岗工业区一家只有两条生产线的小塑料包装厂，一年窃电折价就30－40万元之多，某市06年因窃电损失达4亿元。此外，窃电行为造成电力设施重大破坏，从而引发的大面积停电事故每年都发生多起。这不仅给国有资产造成巨大的损失，也严重扰乱了供电秩序，威胁到电网安全运行。如何通过监测数据自动识别偷漏电行为？

传统方法存在的缺陷传统的用电检查及反偷查漏工作主要依靠突击检查的手段来打击窃电行为，存在先天性的缺陷和不足：基于指标加权的用电异常分析模型，虽然能获得用电异常的某些信息，但由于终端误报或漏报过多，无法达到真正快速精确定位窃漏电嫌疑用户的目的，往往令稽查工作人员无所适从。而且在采用这种方法建模时，模型各输入指标权重的确定需要用专家的知识和经验，具有很大的主观性，存在明显的缺陷，所以实施效果往往不尽如人意。一是由于用电检查工作是按计划开展的，有一定的周期性。在两次检查之间客户存在的安全用电隐患、计量装置故障及窃电行为等不容易发现。二是没有针对性，在进行用电检查时，按既定计划先后到现场进行，面对几万专变用户不能及时发现计量故障及窃电行为。三是用电检查人员在开展工作时，缺乏客户负荷情况和用电情况的信息。现场检查掌握的也只是客户当时的情况。如果客户存在不定期的窃电行为，将难以发现。

原始数据情况实时负荷数据终端报警数据用户违约、窃电处理通知书

原始数据情况用电负荷数据，采集时间间隔为15分钟，可进一步计算该大用户的用电量。

原始数据情况终端报警数据，其中与窃漏电相关的报警能较好的识别用户的窃漏电行为

原始数据情况 ******** *** 用户违约、窃电处理通知书，里面记录了用户的用电类别和窃电时间

原始数据情况用户违约、窃电处理通知书，里面记录了用户的用电类别和窃电时间

挖掘目标归纳出窃漏电用户的关键特征，构建窃漏电用户的识别模型；利用实时监测数据，调用窃漏电用户识别模型实现实时诊断。

目录 1 背景与挖掘目标 2 分析方法与过程 3 上机实验 4 拓展思考

分析方法与过程初步分析：窃漏电用户在电力计量自动化系统的监控大用户中只占小部分，同时某些大用户也不可能存在窃漏电行为，如银行、税务、学校、工商等非居民类别，故在数据预处理时有必要将这些类别用户剔除。用电负荷不能直接体现出用户的窃漏电行为，终端报警存在很多误报和漏报的情况，故需要进行数据探索和预处理，总结窃漏电用户的行为规律，再从数据中提炼出描述窃漏电用户的特征指标。结合历史窃漏电用户信息，整理出识别模型的专家样本数据集，再进一步构建分类模型，实现窃漏电用户的自动识别。

分析方法与过程总体流程：

分析方法与过程第1步：数据抽取与窃漏电相关的原始数据主要有用电负荷数据、终端报警数据、违约窃电处罚信息以及用户档案资料等。为了尽可能全面覆盖各种窃漏电方式，建模样本要包含不同用电类别的所有窃漏电用户及部分正常用户。窃漏电用户的窃漏电开始时间和结束时间是表征其窃漏电的关键时间节点，在这些时间节点上，用电负荷和终端报警等数据也会有一定的特征变化，故样本数据抽取时务必要包含关键时间节点前后一定范围的数据。抽取近5年来所有的窃漏电用户有关数据和部分不同用电类别正常用电用户的有关数据。

分析方法与过程第2步：探索分析—窃漏电用户分布分析

分析方法与过程第2步：探索分析—用电量周期性分析

分析方法与过程第2步：探索分析—用电量周期性分析

分析方法与过程第3步：数据预处理数据清洗：从业务以及建模的相关需要方面考虑，筛选出需要的数据通过数据的探索分析，发现在用电类别中，非居民用电类别不可能存在漏电窃电的现象，需要将非居民用电类别的用电数据过滤掉。结合本案例的业务，节假日用电量与工作日相比，会明显偏低。为了尽可能达到较好数据效果，过滤节假日的用电数据。

分析方法与过程第3步：数据预处理缺失值处理：数据缺失严重

分析方法与过程第3步：数据预处理缺失值处理：在原始计量数据，特别是用户电量抽取过程中，发现存在缺失的现象。若将这些值抛弃掉，会严重影响后续分析结果。

分析方法与过程第3步：数据预处理缺失值处理

编程练习分析方法与过程第3步：数据预处理缺失值处理拉格朗日插值法其中为缺失值对应的下标序号，为缺失值的插值结果，为非缺失值的下标序号。牛顿插值法编程练习

分析方法与过程第3步：数据预处理数据变换电量趋势下降指标线损指标告警类指标

分析方法与过程第3步：数据预处理用电量趋势正常用电数据变换第1天窃漏电第2天窃漏电第3天窃漏电电量趋势下降指标从正常用电到窃漏电特征分析

分析方法与过程第3步：数据预处理数据变换电量趋势下降指标对统计当天设定前后5天为统计窗口期，计算这11天内的电量趋势下降情况，首先计算这11天的每天的电量趋势，计算第i天的用电量趋势是考虑前后5天期间的用电量斜率，即：其中，，为第天的电量趋势，为第天的用电量。

分析方法与过程第3步：数据预处理数据变换电量趋势下降指标若电量趋势为不断下降的，则认为具有一定的窃电嫌疑，故计算这11天内，当天比前一天用电量趋势为递减的天数，即设有则这11天内的电量趋势下降指标为

分析方法与过程第3步：数据预处理数据变换电量趋势增长指标线损指标线损率公式：其中为第天的线路供电量，为线路上各个用户的总用电量

分析方法与过程第3步：数据预处理数据变换电量趋势增长指标线损指标线路的线损率可作为用户线损率的参考值，若用户发生窃漏电，则当天的线损率会下降，但由于用户每天的用电量存在波动，单纯以当天线损率下降了作为窃漏电特征则误差过大，所以考虑前后几天的线损率平均值，判断其增长率是否大于1%，若线损率的增长率大于1%则具有窃漏电的可能性。对统计当天设定前后5天为统计窗口期，首先分别计算统计当天与前5天之间的线损率平均值和统计当天与后5天之间的线损率平均值，若比的增长率大于1%，则认为具有一定的窃电嫌疑，故定义线损指标

分析方法与过程第3步：数据预处理数据变换电量趋势增长指标线损指标告警类指标与窃漏电相关的终端报警主要有电压缺相、电压断相、电流反极性等告警，计算发生与窃漏电相关的终端报警的次数总和，作为告警类指标。

分析方法与过程第4步：构建专家样本对2009年1月1日至2014年12月31日所有窃漏电用户及部分正常用户的电量、告警及线损数据和该用户在当天是否窃漏电的标识，按窃漏电评价指标进行处理，得到专家样本库。

编程练习分析方法与过程第5步：构建模型构建窃漏电用户识别模型对专家样本随机选取20%的作为测试样本，剩下80%的作为训练样本。 LM神经网络建模 CART决策树建模编程练习

分析方法与过程第5步：构建模型构建窃漏电用户识别模型 LM神经网络由混淆矩阵（训练样本），分类准确率为94.0%，正常用户被误判为窃漏电用户占正常用户的3.4%，窃漏电用户被误判为正常用户占正常窃漏电用户的2.6%。

分析方法与过程 b) CART决策树由混淆矩阵（训练样本），分类准确率为95.3%，正常用户被误判为窃漏电用户占正常用户的1.3%，窃漏电用户被误判为正常用户占正常窃漏电用户的3.4%。

分析方法与过程第5步：构建模型模型评价用测试样本对两个模型进行评价，评价方法采用ROC曲线进行评估。观测LM神经网络和CART决策树ROC曲线的CLASS2折线，经过对比发现LM神经网络的ROC曲线比CART决策树的ROC曲线更加靠近单位方形的左上角，LM神经网络ROC曲线下的面积更大，说明LM神经网络模型的分类性能较好，能应用于窃漏电用户识别。 LM神经网络在测试样本下的ROC曲线 CART决策树在测试样本下的ROC曲线

分析方法与过程第5步：构建模型进行窃漏电诊断

目录 1 背景与挖掘目标 2 分析方法与过程 3 上机实验 4 拓展思考

上机实验(MATLAB) 实验目的实验内容掌握拉格朗日插值法进行缺失值处理掌握LM神经网络和CART决策树构建分类模型用户的用电数据存在缺失值，数据见“/data/missing_data.xls”，利用拉格朗日插值算法补全数据。对所有窃漏电用户及正常用户的电电量、告警及线损数据和该用户在当天是否窃漏电的标识，按窃漏电评价指标进行处理并选取其中291个样本数据，得到专家样本，数据见“/data/model.xls”，分别使用LM神经网络和CART决策树实现分类预测模型，利用混淆矩阵和ROC曲线对模型进行评价。注意：数据80%作为训练样本，剩下的20%作为测试样本。

上机实验拓展(SPSS) 实验目的实验内容掌握MLP神经网络和CART决策树构建分类模型对所有窃漏电用户及正常用户的电电量、告警及线损数据和该用户在当天是否窃漏电的标识，按窃漏电评价指标进行处理并选取其中291个样本数据，得到专家样本，数据见“/data/model.xls”，分别使用MLP神经网络和CART决策树实现分类预测模型，利用混淆矩阵对模型进行评价。注意：数据80%作为训练样本，剩下的20%作为测试样本。本案例SPSS版本为SPSS Modeler 14.1 ，下载地址： http://www.tipdm.org/jmgj/568.jhtml

上机实验拓展(SPSS) MLP神经网络注：运行模型文件时需重新设置数据文件路径

上机实验拓展(SPSS) 训练集分析结果：测试集分析结果：

上机实验拓展(SPSS) b) CART决策树注：运行模型文件时需重新设置数据文件路径

上机实验拓展(SPSS) 训练集分析结果：测试集分析结果：

上机实验拓展(SAS) 实验目的实验内容掌握神经网络和决策树构建分类模型对所有窃漏电用户及正常用户的电电量、告警及线损数据和该用户在当天是否窃漏电的标识，按窃漏电评价指标进行处理并选取其中291个样本数据，得到专家样本，数据见“/data/model.xls”，在DATA部读取数据文件，在EM模块分别使用神经网络和决策树实现分类预测模型，并评价模型。注意：数据80%作为训练样本，剩下的20%作为测试样本。本案例SAS版本为SAS 9.3，下载地址http://www.tipdm.org/jmgj/569.jhtml

上机实验拓展(SAS) a) DATA步读入数据 /*读取数据文件model.xls*/ %macro grabpath ; %qsubstr(%sysget(SAS_EXECFILEPATH),1, %length(%sysget(SAS_EXECFILEPATH))-%length(%sysget(SAS_EXECFILEname))-5) %mend grabpath; %let path=%grabpath; %let name=data\model.xls; %let pathname=&path&name; %put &pathname; /*pathname为model.xls的路径*/ %macro importdata ; PROC IMPORT OUT= WORK.model DATAFILE="&pathname";/*引用宏变量pathname*/ sheet="Sheet1"; getnames=yes; RUN; %mend importdata; %importdata proc print data=WORK.model; run;

上机实验拓展(SAS) b) EM建模

目录 1 背景与挖掘目标 2 分析方法与过程 3 上机实验 4 拓展思考

拓展思考目前企业偷漏税现象泛滥，严重影响国家的经济基础。为了维护国家的权力与利益，应该加大对企业偷漏税行为的防范工作。如何用数据挖掘的思想，智能的识别企业偷漏税行为，有力的打击企业偷漏税的违法行为，维护国家的经济损失和社会秩序。汽车销售行业，通常是指销售汽车整车的行业。汽车销售行业在税收上存在少开发票金额、少计收入，上牌、按揭、保险等一条龙服务未入帐反映，不及时确认保修索赔款等多种情况，导致政府损失大量税收。汽车销售企业的部分经营指标能一定程度上评估企业的偷漏税倾向，附件（（见：/拓展思考/拓展思考样本数据.xls））提供了汽车销售行业纳税人的各个属性和是否偷漏税标识，请结合汽车销售行业纳税人的各个属性，总结衡量纳税人的经营特征，建立偷漏税行为识别模型，识别偷漏税纳税人。

Thank You! 泰迪科技： www.tipdm.com