5 容错设计技术 报告人:田素云 2011. 10. 21.

Slides:



Advertisements
Similar presentations
酒店绩效考核攻略 一 业务流程再造 管理环节突破 利润急速倍增 专为您企业量身裁衣服务 突破导师 : 周忠亭副教授 北京大学管理案例研究 中心特聘餐饮讲师 北洋战略研究院研究员 北大时代光华高级讲师 中国十大餐饮管理讲师 中华酒店管理专家教授 教育部首批中国餐饮经理人 师资成员.
Advertisements

人力资源工作总结 行政部 人力资源部年度工作 一方面通过招聘管理、劳动合同管理、 入离职管理等,确保各项人事管理工作 的合法性、规范性. 另一方面通过建立员工培训计划,加强 企业文化的贯彻和渗透,提升员工的凝 聚力和归属感,提升员工的敬业度。
美 丽的轴对称图形 教学内容 教学目标 教学重点、难点 教法、学法 教学过程 教材从具体到抽象,从感性到理性,从实 践到理论,再用实践检验理论,层次分明,循序 渐进的指导学生认识自然界和日常生活中具有轴 对称性质的事物,使学生进一步认识前面所学的 平面图形的本质特征。 教 学 内 容教 学 内.
配樂:夢的序曲 ( 鋼琴 ) 雁蕩山因山頂有湖,蘆葦茂密,結草為湯,南歸秋雁多宿於此,故名雁蕩。始於 南北朝,興於唐,盛於宋,雁蕩山來晚了一步,未能在 “ 五岳 ” 中占得一席之地。 沒有金碧輝煌的涂飾,村野之山的雁蕩倒因此多了份瀟灑風神。
1. 法律學系助教群: 大學部助教 徐碧霜 行政助教 葉靜芳 研究所助教 阮博謙 台中 法政學院 1. 台北 法商學院 民國 50 年 中興大學合併法商學院法律系 民國 89 年 法商學院改制為台北大學.
科学就医健康教育核心信息 健康中国行·科学就医 一、倡导科学就医 二、遵从分级诊疗 三、定期健康体检 四、鼓励预约挂号 五、就医注意事项
第一节 职业基础知识 第二节 社会需要剖析 第三节 用人单位认知
★中国近代史: 1840年————1949年 鸦片战争 新中国诞生 ★历史线索: 1、资本主义列强对中国的侵略 2、中国人民的反抗和探索:
郭跃平个人资料 职称: 副教授 毕业院校: 天津大学 工作单位: 内蒙古商贸学院 学历及学位: 研究生 硕 士 联系电话:
凱琪的包裹 這個故事是發生在第二次世界大戰後的歐洲。故事 藉由美國及荷蘭的兩位小女孩,因書信的往來而發
自动化专业介绍 廖家平.
股 票.
说课课件 感悟工业革命力量,闪耀科技创新光辉 ----《走向整体的世界》教学设计及反思 爱迪生 西门子 卡尔·本茨 诺贝尔 学军中学 颜先辉.
The Design and Implementation of a Wireless Healthcare Application for WSN- enabled IMS Environments Author: El Barachi, M.; Alfandi, O. Source: IEEE Consumer.
《疯 娘》 --100个人看后99个人会落泪的故事 图文:网络
校园信息管理系统 河北科技大学网络中心 2000/4/10.
2015届就业指导课程教学大纲介绍.
证券交易模拟 第2讲 交易规则与盘面术语.
個人簡介 施再繁 台大電機所計算機組博士.
《办公自动化》 2014版,文秘财会.
岡山區103年第12次 登革熱聯繫會報會議 岡山區公所 103年12月30日 1.
水仙电器财务失败案例.
美国史 美利坚合众国创造了一个人类建国史的奇迹,在短短230年的时间从一个被英帝国奴役的殖民地到成为驾驭全世界的“超级大国”、“世界警察”,美国的探索为人类的发展提供了很宝贵的经验。
渤海商品交易所 丹东玉米交易中心 全国统一客服电话:
學校:光春國中 班級:七年三班 製作團隊: 顏序芳 李邰岳 謝宜軒
徵收苗栗市福全段147、1588及文心段10、11地號等4筆土地之
市场营销策略模块 项目十 促销策略―广告宣传
讲 义 大家好!根据局领导的指示,在局会计科和各业务科室的安排下,我给各位简要介绍支付中心的工作职能和集中支付的业务流程。这样使我们之间沟通更融洽,便于我们为预算单位提供更优质的服务。 下面我主要从三方面介绍集中支付业务,一是网上支付系统,二是集中支付业务流程及规定等,
揭秘 庄家 股市中的 为什么你的股票一买就跌,一卖就涨? 为什么出了利好,股价反而下跌? 为什么有的股票一直涨停?
中国人民公安大学经费管理办法(试行) 第一章总则 第四条:“一支笔” “一支笔”--仅指单位主要负责人。负责对本 单位的经费进行审核审批。
102學年度預算編製說明會 主辦單位:會計室 102/02/22.
105年度產學合作培育 研發菁英計畫說明會 教育部高等教育司 /
总 复 习 班 级:测控技术与仪器2011-1、2班 授 课:滕召胜.
2012年度人力资源部工作总结
----银行间的比较 论资本构成与充足率 淡 彩 的 黑 板 淡 彩 的 黑 板 金融73班 王艺霏 王 英
教育信息化建设诊断评价与改进一级指标体系构建
执行《劳动合同法》中 应当注意的十大问题.
組長:呂淑君 組員:邱采王亭 吳仁傑 池姿霖 楊佩慈
WCCC Lab 無線通訊暨雲端計算實驗室 指導教授 曾學文.
北京盈科“企业用工风险防范”系列讲座 员工入职法律风险防范技巧.
第九章 差错控制编码 9.4 线性分组码 9.1 引言 9.5 循环码 9.2 纠错编码的基本原理 9.6 卷积码 9.7 网格编码调制
乳猪断奶后拉稀,掉膘与教槽料.
第9课 北美大陆上的新体制 导入新课 新课教学 课堂小结 知识结构 巩固练习
VANET & Routing.
Gauge Repeatability and Reproducibility
土石流監測無線感測網路系統 Debris flow observation system based on wireless sensor network 授課教授:林俐玲教授 (1) 鄭皆達教授(2) 陳鴻烈教授 (3) 林德貴教授(4) 學生:陳明賢 2008年 6月 21 日.
崇拜即將開始, 請大家安靜片刻, 預備心靈敬拜上帝。
转义字符填充法 零比特填充法 采用特殊的信号与编码法 确定数据长度法
指導教授:金仲達 老師 成員: 陳俊佐 陳惠雯 李怡緯 鄧雅文 劉哲維 鍾逸帆
Advisor : Prof. Frank Y.S. Lin Presented by Yen-Yi, Hsu
第六次全国人口普查 近期数据处理工作部署 夏雨春 2010年12月28日.
第 1部分 软件测试概述.
Reporter: Green Advisor: Hsueh-Wen Tseng
Speaker: Wang,Song-Ferng Advisor: Dr. Ho-Ting Wu 2015/7/6
2.3 平面与回转体表面相交 回转体截切的基本形式 截平面 截平面 截交线 截交线.
彰化縣自造教育示範中心 電子自造研習課程 Saturday, April 20, 2019.
主讲人: 颜蓉花 E---mail: 财务管理课程 (第二版) 主讲人: 颜蓉花 E---mail:
微信商城系统操作说明 色卡会智能门店.
國民年金 np97006.
多路程控高压电源的研制及其在核探测技术中的应用
諮商與工商心理學系 選課輔導暨師生面對面座談會
聰明管理零用錢 主講人:高鳳儀 行政院金融監督管理委員會銀行局 指導 中華民國銀行公會暨信合社聯合社 主辦.
Practical Opportunistic Data Collection in WSN with mobile sinks
所得稅法第14條、第126條修正條文 薪資所得計算方式二擇一 定額減除 特定費用減除 維持現行薪資所得特別扣除額20萬元減除方式
大綱 一.受試者之禮券/禮品所得稅規範 二.範例介紹 三.自主管理 四.財務室提醒.
高精度、高稳定性多路程控高压电源的设计 天津市森特尔新技术有限公司.
商品摄影选讲课件 ——13电子商务.
第一章 绪论 学 习 指 导 本章学习目的是了解本课程的性质和任务。学习要求是懂得互换性的含义;了解互换性与标准化的关系及其在现代化生产中的重要意义;了解优先数的基本原理及其应用。
三、 动量和角动量 1 、 质点动量定理 动量 冲量.
Presentation transcript:

5 容错设计技术 报告人:田素云 2011. 10. 21

提纲 概述 故障模型 故障检测 故障修复 可靠性协议

概述 容错,翻译为“fault-tolerant”,有“容故障”的含义 容错研究关注的领域 网络容错 无线传感器网络容错(因素) 大规模集成电路,分布式系统,数据库,互联网,... 网络容错 网络中某个节点或节点的某个部件发生故障时,网络仍然能完成指定的工作。 无线传感器网络容错(因素) 自身容易发生故障 受到外界环境影响 WSNs正常工作,更需要有效的容错设计来满足其可靠性要求。

概述 容错的基本概念 三者的关系 故障(fault),是指一个设备、元件或组件的一种物理状态,在此状态下它们不能按照所要求的方式工作。 差错(error),是指一个不正确的步骤、过程或结果。 失效(failure),是指某个设备中止了它完成所要求功能的能力。 三者的关系 故障只有在某些条件下才能在其输出端产生差错,这些差错由于在系统内部,不容易被观测到。 差错只有积累到一定程度或者在某些系统环境下,才能使系统失效。 故障和差错是面向制造与维修的;失效是面向用户的。

概述 最底层的故障,引起数据输出的差错,导致系统最后的失效,这种关系普遍存在。

容错的重要性 WSNs对容错设计的新挑战 技术和实现因素 应用模式 新兴的研究和工程领域 与传统网络的差异 传感器节点通常需要直接暴露在环境中,更易受到物理、化学、生物等外力的破坏,所以自身可靠性差。 传感器节点体积小,能量、计算、存储、通信受限,分布式组网完成任务,本身就是一个挑战。 应用模式 无线传感器网络通常是运行在无人干预模式,它们需要具有更强的容错能力。 新兴的研究和工程领域 处理特定问题的最优方法还不明确,技术与预期应用在快速变化,所以容错处理难以预见。 与传统网络的差异 无线通信网络,以网络为中心,提供网络的互联、互通和互操作,为数据提供正确、可靠的传输。 无线传感器网络,以数据的采集、 数据的处理为中心(必要时,可以牺牲部分节点,保证完成任务)。

容错的重要性(续) 面对挑战的期望 WSNs容错设计需要考虑三个方面 传感器网络的软、 硬件必须具有很强的容错性 ,以保证系统具有高可信性和高强壮性。 在网络节点的软、 硬件出现故障时 ,能够通过应用一定的容错技术使整个系统自动调整或自动重构 ,纠正错误 ,保证任务的正常执行。 无线传感器网络的容错算法不能过于复杂 ,同时还应当支持节能的特性;一般而言 ,要达到越好的容错性 ,将消耗越多的能量;,在设计无线传感器网络的容错算法时 ,还需要在这两者之间进行权衡。 WSNs容错设计需要考虑三个方面 故障模型,故障检测,故障修复

提纲 概述 故障模型 故障检测 故障修复 可靠性协议

故障模型 故障分类 三者关系 部件级 节点级 网络级 网络包含节点 节点包含部件 层次关系决定了高层故障本质由低层故障所造成 故障级别 故障表征 故障检测 修复机制 部件级 故障节点能够正常通信,但是测量数据是错误的 检测出错误的测量数据 舍弃或校正出错误的测量数据 节点级 故障节点不能与其他节点进行通信 通过询问或重新路由等方法检测故障节点 通过移动冗余节点弥补形成的连接和覆盖问题 网络级 某个区域内的节点都出现故障,造成部分网络停止工作 区域故障节点数目统计;数据包穿越率 舍弃或同上处理 表1 故障模型的层次

部件级模型 部件故障 传感器节点由计算、通信、存储、能量供应、传感等功能部件组成,每个部件都有可能发生故障。 部件故障主要归于传感部件故障 传感、供电、通信等部件发生故障,测量值偏离了实际值。 传感器节点由计算、通信、存储、能量供应、传感等功能部件组成,每个部件都有可能发生故障。 处理器、存储器、通信部件的可靠性高,不易出错。 传感部件(感应器+模数转换ADC),低成本、能量受限、暴露在外界环境,易发生故障。 部件故障主要归于传感部件故障

部件级模型(续) 部件故障分类 按测量值与实际值的差值的组成与成因,故障分为4类。 固定故障,感应器的读数一直为某个固定的值(通常大于或小于正常的感知范围,不能提供任何感知环境的信息)。 偏移故障,在真实值的基础上附加一个常量。 倍数故障,真实值被放大或缩小某个倍数 方差下降故障,使用时间过长,感应器老化后变得越来越不精确而产生的。 注:没有对测量值的先验知识,仅以结果不能分辨出偏移故障与倍数故障。

提纲 概述 故障模型 故障检测 故障修复 可靠性协议

故障检测 故障检测的分类 故障检测的目标 部件故障检测(检测传感器部件) 节点故障检测(定位故障节点) 检测网络中的异常行为 基于空间相关性 基于贝叶斯网络 节点故障检测(定位故障节点) 集中式 分布式 故障检测的目标 检测网络中的异常行为

部件故障检测 部件故障的分类 故障检测的衡量指标 简单的传感器故障模型 复杂的传感器故障模型 识别率,发生故障的部件被检测为有故障的概率。 0-1模型(0-不工作;1-正常工作) 直接观察输出结果,判断故障 复杂的传感器故障模型 连续或多级数字输出 基于空间相关性或基于贝叶斯网络,判断故障 故障检测的衡量指标 识别率,发生故障的部件被检测为有故障的概率。 误报率,把正常部件判定为发生故障的概率。

基于空间相关性 基本思想 方法分类 空间相关性,WSNs中相邻节点的同类传感器所测量的值通常很相近。 一个节点通过周围邻居节点的同类传感器来检测自己的传感器是否发生了故障。 方法分类 需要地理位置信息 不需要地理位置信息

需要地理位置信息 某节点的传感部件测量结果与周围节点(依地理信息判定)测量结果都不同时,这个节点的传感部件可能发生故障。 例 节点1~节点8都感应到了事件的发生,而节点n没有感应到事件的发生,则认为节点n的传感部件发生了故障 如果节点n及节点1~节点7都感应到了事件,则可以判断节点8的传感部件发生了故障。

需要地理位置信息(续) 一种检测方法 三角形法 节点n在三个可信节点的三角区域内 切线垂直于连心线

不需要地理位置信息(1/3) 基本思想 判断策略 不需要地理信息,节点依据侦听到的邻居(依节点邻居表判定)数据来判断自己的测量值是否正确。 多数投票策略 均值策略 中值策略

不需要地理位置信息(2/3) 判断策略的形式化表达 表2 三种故障检测策略

不需要地理位置信息(3/3) 判断策略的比较 识别率 误报率 时间复杂度 多数投票策略 较高 低 O(n) 均值策略 较低 中值策略 高 O(nlogn) 表3 判断策略比较 综合能效、检测精度及时间复杂度,中值策略是一种适于无线传感器网络。

判断策略的改进 错误实例 多数投票策略 节点设置可信度(权重值) 可信度高 权重值大 投票权大 提高识别度,减少误报率

判断策略的改进(续) 策略改进、加入权值后的比较结果,提高识别度,减少误报率。

故障检测 故障检测的分类 故障检测的目标 部件故障检测(检测传感器部件) 节点故障检测(定位故障节点) 检测网络中的异常行为 基于空间相关性 基于贝叶斯网络 节点故障检测(定位故障节点) 集中式 分布式 故障检测的目标 检测网络中的异常行为

基于贝叶斯网络(1/4) 基本思想 检测工具 贝叶斯网络 不同部件间的潜在关系(部件间的信任关系),可以用来检测传感部件是否发生故障。 这些部件可以属于同一节点,也可属于不同节点。 检测工具 贝叶斯网络(BBN) 贝叶斯网络 基于概率推理的数学模型 结构:一个有向图和与之对应的概率表的集合 阶段:构造、学习、推理 模型化并推理出不确定的因素。

基于贝叶斯网络(2/4) 实例 构造 大鸭岛实验情景来应用贝叶斯信任网络实现传感部件的故障检测 环境监测中有五个属性:温度(T),湿度(H),气压(P),光照强度(L),节点电压(V) 这五个属性的关系所示:气压和湿度受温度影响,而电压影响了所有其他属性。 构造 有向图 一个节点所有属性的联合概率分布 V P H L T 图9 属性间的条件依赖关系 P(V,T,H,P,L)=P(V) P(L|V) P(T|V) P(H|V,T) P(P|V,T)

基于贝叶斯网络(3/4) 学习 设所有属性被划分成两个不重叠的子区间r1,r2。 通过大量数据训练得到以下概率 S P(St) P(Sv) P(N|S):给定当前读数落入某个区间的概率的情况下, 邻居读数落入某个区间的概率。 S P(St) P(Sv) r1 0.9 0.6 r2 0.1 0.4 表4 温度、电压的概率分布 St Sv P(Sp) P(Sh) r1 r2 0.5 0.6 0.4 0.9 0.1 0.3 0.7 0.2 0.8 表5 气压、湿度的条件概率分布

基于贝叶斯网络(4/4) 推理 已知节点的湿度H∈r2,电压V∈r1,由此来推测是否T∈r1? T P(H|V,T) P(T) P(V) P(T|V=r1,H=r2) r1 0.4*0.9*0.6=0.216 0.4 r2 0.8*0.1*0.6=0.048 0.8 表6 计算推理

故障检测 故障检测的分类 故障检测的目标 部件故障检测(检测传感器部件) 节点故障检测(定位故障节点) 检测网络中的异常行为 基于空间相关性 基于贝叶斯网络 节点故障检测(定位故障节点) 集中式 分布式 故障检测的目标 检测网络中的异常行为

节点故障检测 定义 节点能否与外界正常通信 原因 能量耗尽 通信故障 分类 集中式 分布式

从节点到Sink节点的链路质量的一种衡量 集中式故障检测 名称 描述 邻居列表 由邻居ID号组成的一个列表 链路质量 用0至100间的一个数来表示 字节数 节点传输和收到的字节数 下一跳 路由的下一跳节点 路径丢失 从节点到Sink节点的链路质量的一种衡量 在Sink节点放置检测程序,实时监测网络状态。 各节点周期性地向Sink节点上报信息。 Sink节点的处理能力高,利用收集的信息判断某事件的发生。 表7 收集信息列表 事件名 描述 用来识别事件的信息 节点丢失 节点没有出现在任何节点的邻居列表中 所有邻居表 孤立节点 节点没有任何邻居 此节点的邻居表 路由改变 比较当前路由表与上次路由表的变化 此节点的路由表 邻居表改变 比较当前邻居表与上次邻居表的变化 链路质量改变 此节点与邻居的链路质量低于统计定义的门槛值。把当前的和以前的链路质量写入日志 表8 事件列表

分布式故障检测 不是由Sink节点统一检测,而是由每个节点分别自行检测 算法分为多个阶段 每个阶段分为两部分 每个阶段检测一项故障原因 每个阶段分为两部分 判断故障是否发生 处理故障措施 检测阶段有顺序性,调换顺序会导致误判

提纲 概述 故障模型 故障检测 故障修复 可靠性协议

故障修复 基本思想: 容错拓扑(预防)策略:通过预先设计的拓扑算法部署无线传感器网络节点或临时变更部分节点的路由,使得WSNs对节点发生故障有一定容忍度,这样在部分传感器节点发生故障时,剩余节点仍能保持通信,继续工作。 容错节点(修补)策略:无线传感器网络通常不需要所有节点都保持活动状态,利用WSNs的容错节点(包括WSNs的冗余节点或睡眠节点),当有节点失效时,容错节点在当前位置或移动到制指定位置,从而弥补失效节点所造成的连接割断或覆盖漏洞。

故障修复 具体策略的应用,取决于WSNs的具体情况(WSNs是否可以按预先设计部署节点;局部范围内是否存在容错节点等),当然如果将上述预防策略与修补策略相结合,会得到更好的WSNs故障修复结果。 本节将论述基于连接和基于覆盖的两类故障修复方法。

基本概念 节点模型 节点连通 点覆盖 区域覆盖 连通与覆盖 定理 R-通信半径 r-感知半径 r通常小于R,如图13 |AB|<=R,即节点A与节点B连通,如图14 点覆盖 |AC|<=r,即位置C在节点A的感知范围内,如图15-1 区域覆盖 区域内所有点被覆盖,如图15-2 连通与覆盖 连通问题,保证网络中各节点都能正常通信 覆盖问题,保证监控区域中每个位置至少被一个节点覆盖 定理 R>=2r,完全覆盖保证监控区域内各节点都连通

故障修复分类 基于连接的修复 部署k连通拓扑 非k连通图 基于覆盖的修复

部署k连通拓扑 基本概念:构造k连通图是一种建立容错拓扑的方法。k连通网络是指网络中任意两点之间都至少有k条不相交的路径,k连通网络中任意k-1个节点发生故障时网络仍能保持连通。 例:三连通图能容忍任意2个节点的故障而剩余节点仍能保持网络连通性

部署k连通拓扑(续) 在完全图中找最小代价的k连通子图是NP难题,有很多近似算法。 例:集中式算法 FGSS (Fault-tolerant Global Spanning Subgraph) FGSS是一个集中式贪婪算法,它使得网络中的最大能耗最小化。把网络模型化为一个图,节点是图中的点,存在直接通信连接的节点间作一条边,两个节点间的距离作为该边的权重。(把距离等效为能量,信息传送距离越远,耗能越大)

FGSS 算法步骤: 例:生成最小代价二连通图 a) 按权重对所有边排序,生成最小连通子树(单连通图,权重和最小); b) 然后按剩余边权重从小到大依次考虑边是否加入生成子图,判断准则是该边的两个端点还没有k条不相交的路径连通时,就把这条边加入生成子图; c)最后判定是否所有节点都达到k连通,如果不是则重复b步,否则算法结束。 例:生成最小代价二连通图

FGSS(续)

故障修复分类 基于连接的修复 部署k连通拓扑 非k连通图 基于覆盖的修复

非k连通图 (1/4) 网络维持k连通需要消耗大量资源,所以很难在大规模的网络中要达到k连通。在非k连通的网络中,需要有特定的方法来处理节点故障。 例:当上层节点发生故障,基站将不能收到下层节点的信息。

非k连通图 (2/4) 介绍一种基于重新路由建立的(动态)容错拓扑方法。 基本概念: 该拓扑方法要求基站有数据结构存储每个节点的邻居节点信息(包含邻居节点间的距离)。 WSNs中的节点被分为3个集合 R={WSNs中处于活动状态的节点,图例以白色节点表示} D={WSNs中失效的节点,图例以黑色节点表示} S={WSNs中由于上层节点失效无法与基站通信但仍有效能的节点,图例以灰色节点表示} Best R Neighbors:S集中离R集最近的节点(距离最近)。 (以相邻节点间的距离为衡量尺度) Best Base Station Neighbors:S集中离基站最近的节点(跳数最小)。 (以节点到基站的跳数为衡量尺度,因为多跳情况下节点到基站的传输距离很难得到,但以跳数为衡量尺度会导致两节点跳数少实际传输距离长的情况,屏蔽了两节点跳数多实际传输距离短的情况)

非k连通图 (3/4) 该方法中基站查询到从某个节点失效通信中断,将它的下层节点的下一跳重新定向到能与基站保持通信的最近节点,并给出了两中路由选择方案 Subdividing by Best R Neighbors Subdividing by Best Base Station Neighbors

非k连通图 (4/4) Subdividing by Best R Neighbors 算法步骤: a)将WSN节点划分到不同的集合。 b)依据基站存储的每个节点的邻居节点信息,每次从S集中寻找一个节点到某个R集的距离最近,将其从S划出归到R集。 c)最后判断S集是否为空,如果非空,则重复b步;否则为空,路由变更结束,基站广播更新后的路由信息到各节点。 优点:相邻节点的平均传输距离小,网络整体能耗小。 缺点:节点路由更新的信息量大。 Subdividing by Best Base Station Neighbors b)按找规定上层节点的路由重定向,其下层相连的子节点路由不再发生变化。所以依据基站存储的每个节点的邻居节点信息以及原有的路由信息,每次从S集中分层寻找到基站跳数最少的上层节点,然后将其及其下层子节点从S划出归到R集。 优点:节点路由更新的信息量小。 缺点:相邻节点的平均传输距离大,网络整体能耗大。

故障修复分类 基于连接的修复 部署k连通拓扑 非k连通图 基于覆盖的修复

基于覆盖的修复 无线传感器网络用来监测环境时,节点失效会造成某些区域不被覆盖,这时需要采取措施来弥补造成的覆盖空洞。可以在网络中部署一部分可以移动的节点,当其他节点失效时,这些冗余的节点就移动到某个区域以弥补失效节点对网络造成的影响。 覆盖的两个定义 注:当节点失效,节点的覆盖区域将变成遗漏区域

基于覆盖的修复(续) 覆盖修复过程:(假设网络中的节点具有移动能力) 1)初始化阶段:节点计算自己的覆盖区域、每个覆盖区域对应的移动区域。 2)恐慌请求阶段:垂死节点广播求助消息。 3)恐慌回应阶段:垂死节点的邻居收到求助消息后计算如果自己移动到垂死节点的移动区域,是否会影响到自身的覆盖区域,如果不影响则给求助节点返回消息。 4)决策阶段:垂死节点根据收到的回应信息,决定让哪个节点移动。 (以节点A失效为例,补图说明)

提纲 概述 故障模型 故障检测 故障修复 可靠性协议

可靠性协议 无线传感器网络在不同的抽象级别具有不同的容错技术 从网络各层次协议的角度,主要介绍物理层、链路层、网络层、传输层设计需要考虑的与容错相关的问题

可靠性协议 可靠性分析 物理层 链路层 网络层 传输层

物理层 物理层是实现无线网络通信的基石,其可靠性能的优劣直接影响到整个系统的容错能力。 物理层功能:负责数据的编码调制、解调解码、发送与接收。 设计考虑因素:WSNs中的通信,为了使得数据能够被可靠地传输或接收,必须要做到高的接收机灵敏度、低的背景噪声及较强的抗干扰能力。 设计实现方法:天线设计,增强信号强度;跳频扩频调制技术,增大传输带宽;CMOS工艺及软件无线电技术发展;采用自适应调制编码方式,提高可靠性及容错能力。

链路层 链路层功能:负责数据流的多路选择、数据帧侦测、媒介访问、差错控制。 设计考虑因素:保证点到点、点到多点的可靠性链接,并提供对共享媒介的公平、有效的访问。 设计实现方法:自动重发请求(ARQ);前向纠错(FEC)。 1)ARQ:发送方在收到重发请求或超时没有收到接收方的确认时,会重发数据包。 ( 优点:可靠性强;缺点:数据可能多次发送,消耗能量。现在WSNs已很少使用) 2)FEC:要求编码器对信源产生的符号信息按照一定的规则加上冗余,即使接收方收到的数据包出现部分错误,它仍然能够通过冗余译码得到正确的信息。前向纠错既能检测错误,也能纠正一定数量错误。 (优点:减少数据多次重复发送,节约能量;缺点:需要编码译码设备,计算复杂)

网络层 网络层功能:负责源节点到汇聚节点的路由。 设计考虑因素:无线传感器节点容易失效,路由协议必须考虑容错性。 设计实现方法:多路径路由(包括局部多路径路由,泛洪等) 1)局部多路径路由:适用于路由路径可分主次的情况,当主路经上的节点失效时,可以选择备份的路径来消除故障节点的影响。 (优点:控制拥塞,节能;缺点:需要维护路由表) 2)泛洪:一类适用于路由路径不分主次的容错路由协议。消息到达目的地或到达最大允许跳数之前,每个节点都广播收到的消息,具有很高的容错性。 (优点:不需要维护路由表;缺点:发送大量冗余信息,造成通信链路拥塞,消耗大量能量)

网络层(续)

传输层 传输层功能:提供可靠的、低延迟、能量有效的、公平的信息传输。 设计考虑因素:信道损耗、干扰、带宽有限、突发通信、节点资源受限等。 设计实现方法:信息传输在不同方向的不同实现方法。 1)从传感器节点到汇聚节点的传输 事件区域感应:事件区域一般会有多个传感器节点感应到数据,而这些数据具有相似性,汇聚节点不是对单个节点的数据感兴趣,而是整个事件区域内感应节点所收集的信息,保证了感应/检测到事件特征而形成的数据流的可靠传输

传输层(续) 2)从汇聚节点到传感器节点的传输 汇聚节点到传感器节点传输的数据流通常较为重要,可能包含编程配置文件,应用相关的查询和指令(需要更高可靠性)。 PSFQ(Pump Slowly,Fetch Quickly):发送节点低速向网络注入数据包以避免网络拥塞,接收节点有足够的时间来检测这些数据包是否丢失,假如发送丢失就请求重传。当节点收到的包序不等于上一个包序号加1,那么就认为有包丢失。这个节点在收到正确的包前停止继续发送包。(提供了接收端延迟,可靠传输) 例:节点B在没有收到2号包就收到了3号包,那么判断2号包丢失了,于是向A请求重发2号包。只有真正收到2号包后,节点B才继续向C发送包。

小结 本章首先介绍容错领域的基本概念和容错的重要性,然后分别从故障模型、故障检测、故障修复三个方面讲述了无线传感器网络的容错技术,最后分析了容错在无线传感器网络各个协议层次设计时需要考虑的因素。 由于无线传感器网络的特点,可靠性必定是需要考虑的关键因素之一,无线传感器网络的各个关键技术都必须考虑故障的存在,容错技术将是无线传感器网络需要重点考虑的技术之一。

参考文献 [1] 孙利民,李建中,陈渝,等. 无线传感器网络[M]. 北京:清华大学出版社,2005. [5]闵应骅.容错技术二十五年[J].计算机学报,1995,18(12):930-943. [6] 崔莉,鞠海玲,苗勇等. 无线传感器网络研究进展[J].计算机研究与发展,2005,42(1):163-174. [7] 陈颖文,徐明,虞万荣.无线传感器网络的容错问题与研究进展[J].计算机工程与科学,2008, 30(2):87-91. [8] Ning Li,Jennifer C.Hou . FLSS:A Fault-Tolerant Topology Control Algorithm for Wireless Networks .WSNA’04,Sept.26 Oct.1,2004,Philadelphia,Pennsylvania, USA. [9] Jessica Staddon,Dirk Balfanz,Glenn Durfee. Efficient Tracing of Failed Nodes in Sensor Networks . WSNA’02,Sept.28,2002.Atlanta,Georgia,USA.275-286. [10] Saurabh Ganeriwal,Aman Kansal,Mani B.Srivastava. Self Aware Actuation for Fault Repair in Sensor Networks .international Conference on Robotics d Automation New Orleans.LA April.2004:5244-5249.

谢谢!