2013网络科学论坛 4月24-26日 Exploring adaptive proximities to detect possible link and rich club phenomenon 丁义明 ding@wipm.ac.cn 中国科学院武汉物理与数学研究所.

Slides:



Advertisements
Similar presentations
质数和合数 中心小学 顾禹 人教版小学五年级数学下册 一、激趣导入 提示:密码是一个三位 数,它既是一个偶数, 又是 5 的倍数;最高位是 9 的最大因数;中间一位 是最小的质数。你能打 开密码锁吗?
Advertisements

因数与倍数 2 、 5 的倍数的特征
摆一摆,想一想. 棋子个数数的个数 摆出的数 、 10 2 、 11 、 20 3 、 12 、 21 、 30 4 、 13 、 22 、 31 、 40 5 、 14 、 23 、 32 、 41 、

3 的倍数的特征 的倍数有 : 。 5 的倍数有 : 。 既是 2 的倍数又是 5 的倍数有 : 。 12 , 18 , 20 , 48 , 60 , 72 , , 25 , 60 ,
第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
重庆市九龙坡区走马小学 邓华. 一、复习导入,揭示课题 下面哪些数是 2 的倍数?哪些数是 5 的倍数? 2,5的倍数的特征:只看个位上数就能进行判断。 2的倍数:个位上是0,2,4,6,8的数。
练一练: 在数轴上画出表示下列各数的点, 并指出这些点相互间的关系: -6 , 6 , -3 , 3 , -1.5, 1.5.
2 、 5 的倍数特征 集合 2 的倍数(要求) 在百数表上依次将 2 的倍数找出 并用红色的彩笔涂上颜色。
碰撞 两物体互相接触时间极短而互作用力较大
复杂网络局部结构涌现:共同邻居驱动网络演化
10.2 立方根.
《高等数学》(理学) 常数项级数的概念 袁安锋
不确定度的传递与合成 间接测量结果不确定度的评估
探索三角形相似的条件(2).
初中数学八年级下册 (苏科版) 10.4 探索三角形 相似的条件(2).
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
SOA – Experiment 3: Web Services Composition Challenge
全国高校数学微课程教学设计竞赛 知识点名称: 导数的定义.
基于全方位视觉的多人体运动检测跟踪 利用全方位摄像机获取360˚ 的环境信息,在室内对多个人体目标进行实时运动检测。
Online job scheduling in Distributed Machine Learning Clusters
What have we learned?.
数据挖掘工具性能比较.
第十一章 網路訊息傳播.
基于规则抽取的 时间表达式识别.
走进中国科技网 中国科技网 李辉.
4.5 社会网络分析 在社会科学中,以对社会行动者之间的互动研究为基础的结构性方法被称作社会网络 分析(弗里曼,2008)
使用矩阵表示 最小生成树算法.
SOA – Experiment 2: Query Classification Web Service
第4章 非线性规划 4.5 约束最优化方法 2019/4/6 山东大学 软件学院.
实用网络营销基础 冯英健 2006年8月6日 首页.
相似三角形 石家庄市第十中学 刘静会 电话:
3.8.1 代数法计算终点误差 终点误差公式和终点误差图及其应用 3.8 酸碱滴定的终点误差
模型分类问题 Presented by 刘婷婷 苏琬琳.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
Three stability circuits analysis with TINA-TI
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
非流行边的预测 电子科技大学互联网科学中心 朱郁筱 Roger Kahn.
主要内容: 无线局域网的定义 无线传输介质 无线传输的技术 WLAN的架构 无线网络搭建与配置 无线网络加密配置
WPT MRC. WPT MRC 由题目引出的几个问题 1.做MRC-WPT的多了,与其他文章的区别是什么? 2.Charging Control的手段是什么? 3.Power Reigon是什么东西?
12.2全等三角形的判定(2) 大连市第三十九中学 赵海英.
用计算器开方.
Lightweight Data-flow Analysis for Execution-driven Constraint Solving
实体描述呈现方法的研究 实验评估 2019/5/1.
成绩是怎么算出来的? 16级第一学期半期考试成绩 班级 姓名 语文 数学 英语 政治 历史 地理 物理 化学 生物 总分 1 张三1 115
小数的大小比较 仙岩镇第二小学 陈曼丽.
数据集的抽取式摘要 程龚, 徐丹云.
物理化学 复旦大学化学系 范康年教授 等 2019/5/9.
树和图 tree and graph 蔡亚星.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
第4课时 绝对值.
多层循环 Private Sub Command1_Click() Dim i As Integer, j As Integer
第七、八次实验要求.
April, Beijing 全局接种与个体保护对流行病传播的影响 许新建 上海大学数学系 上海大学系统科学研究所.
昆明理工大学先进计算软件技术与应用云南省创新团队昆明理工大学计算机应用重点实验室
分数再认识三 真假带分数的练习课.
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
蔡世民 合作者:禚钊,傅忠谦,张捷 电子科学与技术系 中国科学技术大学 2011/4/29
第二节 函数的极限 一、函数极限的定义 二、函数极限的性质 三、小结 思考题.
Thermodynamics of exotic black hole
欢迎大家来到我们的课堂 §3.1.1两角差的余弦公式 广州市西关外国语学校 高一(5)班 教师:王琦.
基于列存储的RDF数据管理 朱敏
异分母分数加、减法.
XX大学XX学院 多色复古论文答辩PPT模板 X124-2 蓝梦 学号.
Volterra-Lotka方程 1925年, A. Lotka(美)和V. Volterra(意)给出了第一个两物种间的捕食模型。
第十七讲 密码执行(1).
第十二讲 密码执行(上).
位似.
入侵检测技术 大连理工大学软件学院 毕玲.
Presentation transcript:

2013网络科学论坛 4月24-26日 Exploring adaptive proximities to detect possible link and rich club phenomenon 丁义明 ding@wipm.ac.cn 中国科学院武汉物理与数学研究所

目 录 六度分离 节点相似性:局部方法 适应性三度相似:拟局部方法 链路预测:相似度高的结点对连边的可能性大 富人俱乐部 总结

六度分离 Six Degrees of Separation:你和任何一个陌生人之间所间隔的人不会超过六个,也就是说,最多通过六个人你就能够认识任何一个陌生人。 1950s,Manfred Kochen(数学) 、和 Ithiel de Sola Pool(政治)写了数学文章 “Contacts and Influences”,1978年发表. 20世纪60年代,耶鲁大学的社会心理学家米尔格兰姆(Stanley Milgram)就设计了一个连锁信件实验。 1985,电影 Six Degrees:这个世界真是太小了,随便五个人就能永远改变你的未来 In 1998, Duncan J. Watts 、 Steven Strogatz 发表了第一个小世界网络模型. 爱尔兰手创乐队(The Script): Six Degrees of Separation

节点相似性(Node Proximity) 六度之内,都是朋友,哪些是真朋友? 关键:衡量两个节点的相互接近的程度 节点相似度:每对节点都给出一个数来衡量它们的接近程度 两者越接近,该数值越大 在链路预测、社团、富人俱乐部等方面有广泛应用

Why Node Proximity? 衡量一对未连接的节点通过中间结点信息交换的潜力 衡量一对节点接近的程度 发现可能存在的边——链路预测 在社会网络中,有助于预测和跟踪思想、疾病和产品的传播 探测网络中的意外结构

局部相似性和基于路径的相似性 吕琳媛、周涛:2011综述文章 公共邻居: (1)局部相似性指标中表现最好的三种指标 Adamic-Adar指标 : 资源分配指标: (2)基于路径的相似性指标 局部路径指标: Katz指标: LHN指标: 吕琳媛、周涛:2011综述文章

适应的三度相似 Extended RA(ERA) Extended AA(EAA) Extended CN(ECN) 各有一个调节参数

链路预测(Link Prediction) 复杂网络中的链路预测是指基于网络已知的连边结构信以及节点的属性来预测两个节点之间产生连边的可能性。我们给定一种连边预测的算法,每对不存在连边的节点对赋予一个分值,然后将比较分值大小。 AUC:随机从测试集中抽出一条边的分数比随机从不存在连边集合中抽出一条边大的概率 AUC越大,预测效率越高 全集图 训练集 吕琳媛、周涛:2011综述文章

优化链路预测效率得到最优调节参数 链路预测:预测两个节点之间是否存在连边 节点相似性:相似性值大的两个节点存在连边的可能性大 预测效果评价:选训练集和测试集,判断预测效果 给定调节参数——节点相似性指标——链路预测效率 选择效率最好者作为调节参数

采用三度相似进行链路预测 实际网络数据和基本拓扑性质

我们给出的三个“三度相似”指标的预测效率在16个相似性指标中排前三 三度相似在七个网络链路预测效率领先 三度相似性指标ERA在以上所有指标表现得最好,EAA指标表现得第二好,ECN指标和LP指标有着不相上下的预测连边效果。Email和PPI网络的最优参数比其它网络的最优参数相对要大些,而且他们预测精确度AUC被提高得也更多些,因为这两个网络的密度相对更为稀疏些。 我们给出的三个“三度相似”指标的预测效率在16个相似性指标中排前三

为什么三度?? 二度邻居——三度邻居:覆盖率增加29.1% 三度邻居——四度邻居:覆盖率增加13.9% 11.30 11.24 4.92 0.0487 0.0085 0.1399 0.0127 0.0224 0.0041 0.0386 0.5503 0.0955 0.6883 0.056 0.3979 0.0286 0.4057 0.9474 0.4516 0.9468 0.1352 0.8575 0.1267 0.8481 0.9998 0.8559 0.9915 0.2657 0.9869 0.3642 0.9728 1 0.9993 0.6016 0.9999 0.8383 0.7577 0.9357 0.86 0.9763 11.30 11.24 4.92 4.41 17.76 6.98 10.51 1.72 4.73 1.375 2.41 2.155 4.43 2.09 1.055 1.895 1.05 1.965 1.15 2.87 1.00 1.17 1.01 2.26 2.30 1.03 1 1.26 1.12 1.135 1.04 二度邻居——三度邻居:覆盖率增加29.1% 三度邻居——四度邻居:覆盖率增加13.9%

二度邻居——三度邻居:邻居个数的中位数增加28.7% 三度邻居——四度邻居:邻居个数的中位数增加12.6% 三度?????? 13 8 26 5 14 6 171 79 148 17 519 41 120 290 512 193 48 1120 223 309 297 1035 197 91 1217 874 331 1129 198 157 1221 1723 332 1133 244 1222 2166 318 2313 339 2356 359 2368 13.15 9.875 5.69 3.4 37.1 8.2 20 1.696 6.481 1.3 2.82 2.16 5.4 2.58 1.024 2.021 1.02 1.9 1.09 3.9 1.07 1 1.091 1.01 1.73 2 1.004 1.55 1.1 1.06 二度邻居——三度邻居:邻居个数的中位数增加28.7% 三度邻居——四度邻居:邻居个数的中位数增加12.6%

四度相似?? 两个参数

四度相似链路预测AUC随着参数 而变化的趋势 最优参数 都接近于零,四度邻居的贡献可以忽略

小结:为什么采用三度相似 二度邻域中的点的覆盖度不够,导致很多节点对的相似度为0 三度邻域具有较好的覆盖度,信息较充分 从二度到三度扩充的效率高 从三度到四度扩充的效率不到前者的一半 从链路预测的角度来看,三度相似的预测效果优于二度,且计算上可行 而四度邻居太多,计算较复杂,链路预测效率提高不大(除非非常稀疏的网络) 李幼平院士:loglogN~~3

Rich club现象 rich club现象:富人俱乐部是复杂网络中的一种特殊现象,一些度较大的节点(富节点)相对于度小的节点往往更趋向于紧密联系在一起,从而形成一个俱乐部 富人俱乐部现象没有明确的定义,导致很难判别 富人俱乐部现象的出现,表明网络有较高效率,且稳健;网络调控的关键 判断一个网络是否有Rich Club是一个有挑战性的问题,已经有大量文献

三度相似调节参数

USAir,JAZZ网络的三度相似调节参数小于0 对ECN,EAA,ERA,LP都小于0

Rich Club ?? 判断富人俱乐部现象的方法比较多,往往需要与大量度分布相同的随机模型进行对比,判断富人俱乐部现象过程相对比较繁琐,这些方法之间也存在一定的误差,容易引起争论。 参考网络 Colizza等2006 统计检验 江、周 2008 判别 许, 张,Small 2010

三度相似——Rich Club现象 用现有的方法,难以判断右边的网络有Rich Club现象 三度相似指标ERA的最优调节参数为 -0.886,根据我们的方法可知该网络表现出非常明显的富人俱乐部现象

总 结 6度分离 相似性度量 适应性3度相似:拟局部方法——调节参数 链路预测:相似的结点对连边的可能性大——调节参数 总 结 6度分离 相似性度量 适应性3度相似:拟局部方法——调节参数 链路预测:相似的结点对连边的可能性大——调节参数 富人俱乐部探测:——调节参数小于0

致 谢 武汉理工大学:郑汉彬、余旌胡等 中科院武汉物数所:崔鸿飞、蒋杭进、雷皓等 致 谢 武汉理工大学:郑汉彬、余旌胡等 中科院武汉物数所:崔鸿飞、蒋杭进、雷皓等 科技部973计划、 国家数学交叉研究中心、 中科院生物磁共振分析重点实验室 …

谢谢大家!

由随机分块模型生成400个节点,4个类的网络模型: Figure 1(optimal alpha): 左1:lambda=0.6 2 3

LFR benchmark N=500; <k>=20; maxk=40; minc=30; maxc=100 混合参数mu值越小,代表产生的网络社团结构越清晰。 The mixing parameter mu~[0.1, 0.4] 1 2 3 mu=0.1, 0.2时,分类结果完全准确; mu=0.3, 0.4时,分类结果错1~3个节点。

实际网络 Dolphin social network DB_ERA=2.1384; DB_ECN=2.0163; Alpha_ERA=0.036; Alpha_ECN=0.056; Alpha_EAA=0.014; 分类结果一致,较为准确。 实际网络 DB_ERA=0.6531; DB_ECN=0.7305; DB_ERA=0.6845; Alpha_ERA=0.15; Alpha_ECN=0.15; Alpha_EAA=0.15; ECN对应的聚类方法分类结果比另外两种准确。 The karate club network