5、非对称广域覆盖的信息共享网络结构研究 提出一种非对称的广域覆盖共享信息网络结构,研究了新结构下Internet主流信息共享的主动服务模式;并讨论了资源解析、重组等关键技术。在Tunet中的实验结果表明,新结构具有高覆盖能力、检索便捷等特点,同时网络延时等指标得到明显改善。 介绍应用层网络行为构成一个虚拟的逻辑网络,例如WWW、P2P、CDN(内容分发网络)的逻辑链接,该网络与物理层紧密耦合,而用户行为呈现出越来越明显的分布特征,对物理网络整体特征的理论研究产生了重要影响,对工程技术的设计与应用提出了新的挑战。可以以图示为基础简要的介绍一些虚拟网络与物理网络的作用关系。 信息共享网络新结构示意图 系统发布示意图 研究成果发表于《电子与信息学报》2009 许晨敏硕士、徐蕾博士、叶王毅硕士等
6、流量控制协议模型构建 New idea:建立了TCP流量的朗之万方程,阐明了流量特征与各参数间的定量关系。描述了RED算法的控制机理,建立了基于解析的流量控制系统方程。基于对流量控制的平衡点分析,得出RED算法适用范围的理论依据,并给出了系统状态相变的全程描述。 基本通信链路模型 介绍应用层网络行为构成一个虚拟的逻辑网络,例如WWW、P2P、CDN(内容分发网络)的逻辑链接,该网络与物理层紧密耦合,而用户行为呈现出越来越明显的分布特征,对物理网络整体特征的理论研究产生了重要影响,对工程技术的设计与应用提出了新的挑战。可以以图示为基础简要的介绍一些虚拟网络与物理网络的作用关系。 n=20 相图 n=90 相图 n=200 相图 [1]互联网流量控制的朗之万模型及相变分析,物理学报,2009,58(11) [2]Using SDE to Achieve the Stable and Statistical Analyses for TCP/RED Flows, WCICA2010 [3] Estimation of the variances of TCP/RED using stochastic differential equations, Asian Journal of Control [4] Covariances of linear stochastic differential equations and their application in analysis of computer network, Tsinghua Science and Technology 樊华博士
根据ABCD坐标计算距离,结果是ABC成簇,D较远。依此构建Overlay网络。 7、用户相似度空间研究方法举例 根据ABCD坐标计算距离,结果是ABC成簇,D较远。依此构建Overlay网络。 添加代理节点P,使其在拓扑空间和兴趣空间里与ABC成簇,配置相应资源,从而提高信息共享效率。 李一鹏博士、王磊博士后
8、Peer网络与Torrent网络的关联性分析 Peer Network Torrent Network 二值网络 加权网络 Peer Network 反应不同用户之间兴趣的相似性 Torrent Network 毫无联系的资源因用户而产生关联性 李一鹏博士、王磊博士后
北邮人BT 数据分析:节点度、权值 vs. Peer & Torrent 在线时间长/较活跃 在线时间短/free riding Power-law like Distribution 该时间段内存在度值较高节点较为流行 研究成果已投《物理学报》
9、聚类指数与节点度值的关系 Peer Network:节点分簇结构清晰,随度值增大抖动明显 Torrent Network:度值大的节点较少,其叶子节点之间连接稀疏 出现原因:流行文件被下载的次数较多,用户下载兴趣广泛使之建立连接 研究成果已投PRE 李一鹏博士、叶王毅硕士
10、簇结构分析 Newman J[04’,05’ PRL] 刻画了一般网络偏离随机网络和全连接网络的程度 Q: 0.3 – 0.5之间,网络呈现明显分簇特性 Q: 0.6 以上,网络分簇效果较好 李一鹏博士、叶王毅硕士
分簇结果 Torrent Network (资源网络) Peer Network (用户网络) 最大簇有3000个用户! 第1簇有 1400个文件 第5簇有 320个文件 第五簇有180个用户! Torrent Network (资源网络) Peer Network (用户网络)
当前工作
1、Demo系统:信息共享网络新结构 (1)动态、树状、多身份代理、多通道的兼容服务模式 汇聚服务器 本地服务器 分布式代理 星级用户 互联网的信息整合到一个中心服务器,然后将信息传给各个本地服务器,最后由本地服务器以广播的方式将信息发送至终端。 中心服务器:网页搜集(爬虫)——网页解析,信息处理(内容提取、冗余检测、内容分类、一定的聚合) 局部服务器:向各个服务器发送同样的内容/ 内容定制/ 有选择接收 (1)动态、树状、多身份代理、多通道的兼容服务模式 (2)Wide-area Brodcasting、Local P2P 10 10
2、代理节点的数量及分布规律 应用层网络与物理网络的双层耦合模型 根据已有的P2P网络用户行为特性的统计和分析,构建了一个应用层网络与物理网络的双层偶合模型。 在此模型中,当用户在应用层开始对某一资源发起访问时,对应着底层物理网络中数据包的传输。 并且,在构建底层物理网络的拓扑时,采用了这样一种改进的二维元胞自动机模型。 空心点表示骨干网络中的核心路由器,而资源节点和核心路由器节点往往通过一条主干链路相互连接,比如图中的A和B。 采用这样的模型更接近无力网络的真实状况,通过结构简单的元胞相互作用,表现出网络整体特征的变化。 构建一个应用层网络与物理网络的双层耦合模型,来呈现应用层的用户自组织网络行为对于物理网络性能的影响 应用层网络与物理网络的双层耦合模型
引入分布式镜像代理 剥离核心资源节点 增加资源节点镜像 引导数据包改变路由 缩短路由路径长度 节点处理负载得到均衡 传输负载被均衡 镜像代理数量: 进一步,在已有工作的基础上对模型进行改进,引入分布式镜像的的手段。 由于实测数据中,10%的资源节点吸引了用户80%的访问。 在实验过程中,选取一定的阈值,将10%的核心资源节点剥离出来,并在物理网络中增加有限的镜像节点。 引导数据包路由到离自己最近的镜像节点,改变了路由方向,同时也缩短了路由路径的长度。 采用这样的策略,原来聚集在一个目的节点的数据包被分散到几个镜像节点,节点的处理能力相对增强; 路由方向改变,使一条链路的数据传输量被分散到几个镜像节点周围的链路,网络传输负载得到了一定程度的均衡; 路由路径缩短,使源端发出的数据包更快的得到处理并离开网络,数据包在网络中的驻留时间减小。 在这样的情况下,网络维持动态平衡的能力较强,其性能得到了一定程度的改善。
问题: 镜像代理怎样分布? 实验结果表明在采用核心资源节点分布式镜像的手段之后, 网络维持动态平衡的能力增强,相变点发生了明显的右移,网络的性能得到了一定程度的改善。 但是问题随之而来,就是分布式镜像引入了什么样的代价,这也是后续研究工作应该着重考虑的一个部分。 问题: 镜像代理怎样分布?
3、P2P成簇算法——用户兴趣指纹识别 港台综艺节目 美剧
Torrent网络分簇——资源条码识别 资源条码 各簇均表现出各类Torrent的相关性 大簇内文件流行度较高,且由于大多数兴趣广泛的用户下载使其包含的文件种类多 小簇内文件流行度不高,但得到具有特殊兴趣的用户的集中下载
4、P2P网络的拓扑失配适配 Peer ? Peer 搜索结果 远程 节点 邻居 路径2 路径1 李一鹏博士
匹配度定义: 匹配度 所需资源的副本总数 C 所需资源距离自己最近的节点 n 所需资源距离自己最远的节点 f 节点i与节点j之间的度量dij:反映节点跳数、延迟,流量
临界点 动态 镜像资源分布 匹配度相变点控制