远 动 监 控 技 术 西南交通大学电气工程学院
第六章 远动监控系统可靠性 第一节 常用的可靠性指标 第二节 远动监控系统冗余结构设计 第三节 硬件可靠性设计 第四节 软件的可靠性 第一节 常用的可靠性指标 第二节 远动监控系统冗余结构设计 第三节 硬件可靠性设计 第四节 软件的可靠性 第五节 接地技术 第六节 抗干扰编码
可靠性参数(Reliability): 与可靠性有关的常用参数定义: 可靠性 可用性 可维护性 安全性 1. 可靠度R(t) RAMS—Reliability, Availability , Maintainability,Security 可靠性 可用性 可维护性 安全性 可靠性参数(Reliability): 1. 可靠度R(t) 在规定的条件下和规定的时间内,系统能完成规定功能的概率。 2. 瞬时失效率λ(t)-电子设备 老化 基本为一常数 单位时间内t时刻,系统发生瞬时失效的概率。
3. 平均寿命MTTF和平均无故障工作时间MTBF 平均寿命MTTF(Mean Time To Failure): (不可维修系统)一批相同产品失效前工作寿命的平均值。 平均无故障工作时间MTBF(Mean Time Between Failure): (可维修系统)系统两次相邻故障间的工作时间的平均值。
并联系统的可靠性: 如果组成系统的所有单元都失效,整个系统 才会失效,这种系统称为并联系统。 并联系统的可靠性: 并联系统的失效率: 1 2 n-1 n … 并联系统的失效率: 并联系统的平均无故障时间:MTBF=
串联系统: 串联系统的失效率: 串联系统的可靠性: 1 2 …… N 思考题: 并联系统的可靠性>串联系统的可靠性,为什么?
可用性参数(Availability , Maintainability) 1. 系统维修度G(t) 在规定的条件和规定的时间内,系统能被修复的概率。 2. 修复率μ(t) 单位时间t时刻,系统瞬时被修复的概率。 3. 平均修复时间MTTR: MTTR=1/μ 4. 瞬态有效度A(t) 系统在时刻t处于可工作状态的概率。 5. 稳态有效度A(系统利用率,系统可用率) 稳态有效度定义:当时间t趋于无穷大情况下的瞬态有效度, 系统的利用率 即:
大系统可用率: 一个大系统往往由多个相对独立的部分组成,这些部分被称为子系统。每个子系统都有自己的可用率。 这些子系统组成一个大系统时,根据这些子系统的之间的连接关系,可以计算出整个系统的可用率: 串联系统的可用率:由多个子系统组成的系统,若该系统必须在每个子系统均正常运行的条件下才能正常运行,则各个子系统的连接是串联的,这样的系统为串联系统。
串联系统的可用率与各子系统可用率的关系为: 其中 为系统可用率; 为各子系统的可用率。 举例:有两个子系统,可用率分别为90%和95%,在它们串联后,总可用率为:85.5% 结论:子系统的串联使总的可用性下降!
并联系统的可用率 若系统由两个或多个并列的子系统组成,该系统在 其中一个子系统正常运行时就能保证正常运行,则 各个子系统的连接关系是并联的,这样的系统被称 为并联系统。 对于两个子系统并联而成的系统,其可用率与两个子系统的可用率的关系为: 举例:有两个子系统,可用率分别为90%和95%,在它们并联后,总可用率为:99.5% 结论:子系统的并联使总的可用性提高!
提高系统可靠性指标的方法: 采取:冗余设计、减额设计、热设计、稳定性设 计、电磁兼容性设计、软件可靠性设计等 提高可靠性的方法,保证电路、系统在设计 时既具有较高的可靠性指标。
第六章 远动监控系统可靠性 第一节 常用的可靠性指标 第二节 远动监控系统冗余结构设计 第三节 硬件可靠性设计 第四节 软件的可靠性 第一节 常用的可靠性指标 第二节 远动监控系统冗余结构设计 第三节 硬件可靠性设计 第四节 软件的可靠性 第五节 接地技术 第六节 抗干扰编码
冗余系统定义:某一设备或系统与另一设备或系统的基本功能完全相同,它们不管其中一个运行还是故障,另一个都可以执行要求的功能。 冗余方式的系统配置方案:重要设备、信道、控制终端、打印机等。 冗余配置的目的:提高系统的可靠性。 冗余的备用方式: 冷备用:作为备用的设备不运行指定的程序或关 机待命,主机故障或需切换时投入。 热备用:主备同时运行,备机监视主机,自动切 换,故障或需要时切换运行。
对于两个相同单元组成的可维修并联热备用系统: 无冗余系统的可靠性: 单元系统: 稳态有效度: (系统利用率) 瞬时失效率 对于两个相同单元组成的可维修并联热备用系统: 修复率 对可维修并联热备系统停机时间: 由A=MTBF/(MTBF+MTTR)可得:
例: 取:瞬时失效率λ=0.00025 系统修复率μ=0.004 则: MTBF1= 4000h, A1=94.12% MTBF2=36000h, A2=99.65% 可见: 采用双冗余可维修系统,可大幅提高系统的MTBF以及系统利用率。 多冗余系统:效果进一步改善不明显,但成本大大 增加!
调度端 设调度端系统各设备的可用率分别为: 服务器1: A1 服务器2:A2 磁盘阵列A3 调度员工作站1:A4 调度员工作站2:A5 以太网交换机 服务器2 磁带机 磁盘阵列 通信前置机1 调度员工作站1 调度员工作站2 调度端 通信前置机2 设调度端系统各设备的可用率分别为: 服务器1: A1 服务器2:A2 磁盘阵列A3 调度员工作站1:A4 调度员工作站2:A5 通信前置机1: A6 通信前置机2: A7 以太网1: A8 以太网2:A9
则调度系统的可用性模型为: 则系统可用性指标为As: A1+(1-A1)*A2 A3 A4+(1-A5)*A4 A6+(1-A6)*A7 A8+(1-A8)*A9 则系统可用性指标为As: As=(A1+(1-A1)*A2)*A3*(A4+(1-A5)*A4)*(A6+(1-A6)*A7)*(A8+(1-A8)*A9)
第六章 远动监控系统可靠性 第一节 常用的可靠性指标 第二节 远动监控系统冗余结构设计 第三节 硬件可靠性设计 第四节 软件的可靠性 第一节 常用的可靠性指标 第二节 远动监控系统冗余结构设计 第三节 硬件可靠性设计 第四节 软件的可靠性 第五节 接地技术 第六节 抗干扰编码
一、远动通道及通信设备双冗余 一般,远动通道及通信设备均设计为双冗余备用结构。根据通道的实际传输媒介的不同,通道冗余备用结构又可分为环形结构和双T形结构。 图6.3 双T结构 特点:单T故障不会影响系统通信
图6.4 环型结构 环型结构突出优点:各执行端除接收、执行来自调度端的命令外,还对经过本站传送的报文进行中继放大(多为再生中继方式),该方式下单点故障不会影响系统通信。
二、电路优化设计 CMOS电路在噪声容限方面优于TTL电路,因而执行端的电路尽可能采用高速CMOS电路 遵循减额设计原则:“减额”使元器件产品在低于其额定值的条件下工作。以降低元器件失效率和提高设备可靠性。 对电源部分的设计:包括器件选择、绝缘设计、布线设计、抗干扰、热稳定、通风等 看门狗电路:计时电路 ——电磁兼容(EMC),传导+辐射
电磁兼容的意义:电气或电子设备或系统能够在规定的电磁环境下不因电磁干扰而降低工作性能,他们本身所发射的电磁能量不影响其他设备或系统的正常工作,从而达到互不干扰,在共同的电磁环境下一起执行各自功能的共存状态。 电磁兼容的内容:抗干扰(设备和系统抵抗电磁干扰的能力)和电磁发射控制(设备和系统发射的电磁能量的控制)两个方面。 电磁干扰的三要素:干扰源、传播途径和接收器 干扰源:危害性电磁信号 传播途径:辐射和传导 接收器:收到电磁信号的电路.
1.电磁干扰源分析 目前与电力系统有关的电磁干扰源有外部干扰和内部干扰两方面。 外部干扰源指的是与远动系统的结构无关,而是由使用条件和外部环境因素决定的干扰源。对变电站的RTU装置来说,外部干扰源主要有交、直流回路开关操作、扰动性负荷(非线形负荷、波动性负荷)短路故障、大气过电压(雷电)、静电、无线电干扰和核电磁脉冲等。 概括表现为如下三类: 变电站设备的交流电源及直流电源受低频振动扰动; 传导瞬变和高频干扰; 场的干扰。
2.电磁干扰的耦合途径 电磁干扰耦合的途径可归纳为如下几种: (1)电容性耦合。 (2)电感性耦合。 (3)共阻抗耦合。 (4)辐射耦合
3.电磁干扰可能造成的后果 (1)电源回路干扰的后果。 (2)模拟量输入通道干扰的后果。 (3)开关量输入、输出通道干扰的后果。 (4)CPU和数字电路受干扰的后果
提高电磁兼容性和抗干扰能力的6大法宝: 接地 隔离 屏蔽 双绞 吸收 滤波
1.接地 一次系统接地:处理一次系统接地时,应注意对于引入瞬变大电流的地方应设多根接地线并加密接地网,以降低瞬变电流引起的地电位升高和地网各点电位差。 (1)设备接地线要接于地网导体交叉处。 (2)设备接地处要增加接地网络互连线。 (3)避雷针、避雷器接地点应采用两根以上的接地线和加密接地网络。
二次系统接地: 二次系统接地分安全接地(保护接地)和工作接地两大类。 对工作接地要求是: 1)工作接地网(总线)各点电位应一致; 2)多个电路公用接地线时,其阻抗应尽量小; 3)由多个电子器件组成的系统,各电子器件的工作接地应连在一起,通过一点与安全接地网相连。
1)保护性接地 防电击接地 防雷接地 防静电接地 2)功能性接地 逻辑接地 屏蔽接地 信号回路接地
被控站系统的地线种类。 在变电站综合自动化系统中,大致有如下5种地线: 1)微机电源地和数字地(即逻辑地):这种地是微机直流电源和逻辑开关网络的零电位。 2)模拟地:这是A/D转换器和前置放大器或比较器的零电位。 3)信号地:这种地通常为传感器的地。 4)噪声地:是继电器、电动机等的噪声地。 5)屏蔽地:即机壳接地。
微机电源地(0V)和数字地的处理。 1)微机电源地采用浮地的方法。 2)微机电源地与机壳共地。 3)一点接地和多点接地问题。
图7.3.2 一点接地示意图
数字地和模拟地的处理。 1)数字地和模拟地共地,其连接方法如图7.3.4所示。 2)模拟地浮空的接线方式。 3)模拟地和数字地通过一对反相二极管相连接。其连接方法如图7.3.5所示。
图7.3.4 模拟地与数字地的连接 图7.3.5 模拟地与数字地通过二极管连接
目的:通过隔离元器件把噪声干扰的路经切断, 从而达到抑制噪声干扰的效果。 1.模拟量的隔离(互感器,光电隔离) 2.隔离 目的:通过隔离元器件把噪声干扰的路经切断, 从而达到抑制噪声干扰的效果。 1.模拟量的隔离(互感器,光电隔离) 2.开关量输入、输出的隔离 (光电隔离) 3.其他隔离措施 (继电器隔离) 返回本节
3.屏蔽 (1)一次设备与自动化系统输入、输出的连接采用带有金属外皮(屏蔽层)的控制电缆,电缆的屏蔽层两端接地,对电场耦合和磁耦合都有显著的削弱作用。 (2)二次设备内,综合自动化系统中的测量和微机保护或自控装置所采用的各类中间互感器的一、二次绕组之间加设屏蔽层,这样可起电场屏蔽作用,防止高频干扰信号通过分布电容进入自动化系统的相应部件。 (3)机箱或机柜的输入端子上对地接一耐高压的小电容,可抑制外部高频干扰。 (4)执行端RTU的机柜和机箱采用铁质材料,本身也是一种屏蔽。
(1)控制电缆尽可能离开高压母线和暂态电流的入地点,并尽可能减少平行长度。 4.减少强电回路的感应耦合 (1)控制电缆尽可能离开高压母线和暂态电流的入地点,并尽可能减少平行长度。 (2)电流互感器回路的A、B、C相线和中性线应在同一根电缆内,避免出现环路。 (3)电流和电压互感器的二次交流回路电缆,从高压设备引出至监控和保护安装处时,应尽量靠近接地体,减少进入这些回路的高频瞬变漏磁通。 返回本节
三、外围接口电路的可靠性设计 1. 遥控输出电路
BJ1、BJ2取保护的作用。HJ、LJ分别为行、列继电器。 计算机输出接口控制BJ、HJ、LJ。由HJ、LJ来确定被控对象的出口继电器(CJ)。 借助于状态采集和保护出口继电器,可有效地保证输出继电器不会错误输出。 无CJ闭合时,UO=0。有一个CJ闭合时,UO=U1。 有K个CJ闭合时,UO=KU1。
2. 遥信、遥测采集电路 采用光电隔离技术,使其RTU的内系统和外系统在电气上实现有效的隔离,避免外界的干扰直接进入系统内部,造成系统损坏。 常用的隔离措施有光电隔离、继电器隔离、隔离变压器隔离。 对模拟量采集:主要是区分“模拟地”和“数字地”:模拟回路和数字回路是不同的电气系统,必须将两个地分离,不能混淆。
第六章 远动监控系统可靠性 第一节 常用的可靠性指标 第二节 远动监控系统冗余结构设计 第三节 硬件可靠性设计 第四节 软件的可靠性 第一节 常用的可靠性指标 第二节 远动监控系统冗余结构设计 第三节 硬件可靠性设计 第四节 软件的可靠性 第五节 接地技术 第六节 抗干扰编码
软件研制方法未完全成熟,缺乏坚实的科学基础和管理制度。 软件不可靠的原因: 软件是人工制造的逻辑性非常强的产品,生产过程中的种种原因,都可能造成差错或故障。 软件研制方法未完全成熟,缺乏坚实的科学基础和管理制度。 至今没有一套完善的程序正确性的验证方法和理论,对研制的软件进行彻底有效的验证。
软件错误的来源,主要有以下几个方面: 在设计、编制和调试中发生的错误 在移植、修改中产生的错误 算法的近似性,导致整个变量区的不够精确;数据结构的缺陷、数据描述符与实际使用不一致 程序中出现了特异点和临界值,未提供相应的测试和处理 特权用户操作失效,造成系统软件出错或局部功能实效 硬件故障造成软件出错(如磁盘故障导致程序或数据出错) 电磁干扰,使程序或数据丢失或出错 系统环境(硬件、软件)变化时,程序不能随环境而变化 操作错误使软件受到破坏或发生差错
软件可靠性:软件在规定的时间内和规定的条件下,能正常执行其规定的功能而无差错的概率。 软件故障(Fault):当软件运行时,由于软件内部错误的存在而导致不能实现其规定的任务。 软件失效(Failure):指软件失去了规定的功能,或者说是由软件错误导致可见输出错误的一个事件。
一、软件失效率曲线 软件的失效率曲线:
二、软件可靠性与硬件可靠性的比较
软件可靠性的三个要素: 1)规定时间: 2)规定的环境条件 3)规定的功能
三、提高软件可靠性的措施 1. 改进软件的生产管理 2.选取主流工具软件和操作系统:便于交流、升级、换代。 3.严格规定编程要求 按照软件工程的原理、方法,建立科学的生产管理制度和生存期内的完整档案资料,严格按照有关的规范、规定执行。 2.选取主流工具软件和操作系统:便于交流、升级、换代。 3.严格规定编程要求 严格采用模块化结构,接口定义清晰明确,划分简洁合理。 编程风格严谨,力求避免结构上的混乱。 具有详尽的注释,保证良好的可读性,以利于分析、修改。 对程序的修改调试应有完整的记录。 程序应具有良好的抗干扰能力,即程序对接受外界的指令的条件要作严格的判断,保证输入的非法信息不会干扰系统的正常运行;防止计算机病毒的侵入。
6. 与硬件相关的软件问题:软件的存储介质;容错设计等;软硬件结合。 4. 采用组态软件的形式 组态软件是一组功能很强的工具软件包。 在组态软件中,将程序代码设计成相对固定的模块,这些模块根据指定的数据文件中的数据来确定其操作数、操作步骤及操作结果。 5. 人机界面: 采用汉字、图形显示;显示清晰、简明、易于理解,不能造成意义上的含混。 对各种操作有明确提示信息,对错误操作输入提出警告。 对系统中出现的异常情况要进行及时的记录和报警,并给出处理情况的提示信息。 6. 与硬件相关的软件问题:软件的存储介质;容错设计等;软硬件结合。
干扰对测控系统的影响: (1)干扰使数据采集的误差加大。 (2)干扰使输出控制误差加大。 (3)数据受干扰发生变化。 (4)干扰使程序运行失常。 1.提高采样信号信噪比的措施 2.软件冗余措施 3.设置自诊断程序
常用的自检程序如下: 1.防止程序运行失常的措施 2.RAM、ROM的自检程序 3.A/D、D/A转换器的自检程序 4.面板显示装置的检查 5.总线及插件自检
1.防止程序运行失常的措施 (1)监视CPU工作的定时计数器 (2)设置软件陷阱 2.RAM、ROM的自检程序 (1)ROM自检 (2)RAM自检程序
检查ROM最常用的方法是采用校验和法。 即在将程序写入ROM时,保留一个单元(一般是最后一个单元)不写程序码而写入校验字,使ROM的每一列(即字节的各位)具有奇数(或偶数个)1,从而使ROM的校验和为全1(或全0)。 例:如表7.4.1所示是8×8ROM,前面7个单元写入的是程序代码,最后一字节写入校验字11001010B,使最后的校验和为全1。校验程序则从ROM的第一个单元开始,按位相加,最后的校验和若与设置的全1(或全0)相等,则说明ROM内容正确,否则指示ROM出错,如图7.4.2所示。
图7.4.1 ROM自检原理
图7.4.2 ROM自检程序流程图 设地址指针,设计数值 清工作单元 按字节读ROM 工作单元异或 地址指针加1 计数器减1 计数器为 0? 地址指针加1 计数器减1 计数器为 0? 工作单元内容变反 结果为 0? 置ROM故障标志 结束 图7.4.2 ROM自检程序流程图
图7.4.3 RAM 自检 框图