复杂网络的社团结构分析 Community structure in complex networks

Slides:



Advertisements
Similar presentations
复杂网络动力学的 一般方法论 中国科学技术大学 近代物理系 周 涛
Advertisements

國立交通大學應用數學系 數學建模與科學計算研究所 簡 介. 隨著科技的日新月異,人類為追求完美的生活,其 所面臨的科學與工程問題也日趨複雜,舉凡天氣的 預測、飛機的設計、生物醫學中的神經網路、奈米 材料的研發、衍生性金融產品的定價、甚至交通流 量的監測等問題,透過「數學建模」的量化過程, 再配合以「科學計算」的方式去模擬現象並嘗試尋.
2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
“ 育人 ” 即 “ 育己 ” 的五年 答 辩 人:晏向华 研究方向:动物分子营养学 单 位:动物科技学院 动物营养与饲料科学系 2012 年研究生指导教师 “ 教书育人奖 ” 答辩.
图论与网络 1数学的内容、方法与意义. 组合数学概述 现代数学可以分为两大类:一类是研究连 续对象的,如分析、方程等;另一类就是 研究离散对象的组合数学。 现代数学可以分为两大类:一类是研究连 续对象的,如分析、方程等;另一类就是 研究离散对象的组合数学。 计算机出现以后,由于离散对象的处理是 计算机科学的核心,研究离散对象的组合.
复杂网络节点重要性评估及其应用研究 答 辩 人: 张翼 指导老师: 刘玉华 教授.
粒子物理卓越创新中心优秀青年骨干 选拔报告
十五條佛規 後學:張慈幸
统计物理学与复杂系统 陈晓松 中国科学院理论物理研究所 兰州大学,2013年8月.
第七章 NP问题选讲 邹权(博士) 计算机科学系.
数学建模实践 与学生科研素质培养 报告人:王文娟.
试论网络科学与系统科学的交叉性及挑战性 Fang Jin –Qing(方锦清) 中国原子能科学研究院,北京
邹 权 (博士、副教授) 厦门大学数据挖掘实验室
1. 理想的路由算法 有关路由选择协议的几个基本概念 算法必须是正确的和完整的。 算法在计算上应简单。
都市計畫概論論文概述及評論: 彰化高鐵站區域計畫
复杂网络数学建模概述 南京航空航天大学应用物理系 朱陈平.
Mode Selection and Resource Allocation for Deviceto- Device Communications in 5G Cellular Networks 林柏毅 羅傑文.
Leftmost Longest Regular Expression Matching in Reconfigurable Logic
libD3C: 一种免参数的、支持不平衡分类的二类分类器
An Adaptive Cross-Layer Multi-Path Routing Protocol for Urban VANET
Rate and Distortion Optimization for Reversible Data Hiding Using Multiple Histogram Shifting Source: IEEE Transactions On Cybernetics, Vol. 47, No. 2,February.
Large-Scale Malware Indexing Using Function-Call Graphs
毕业论文报告 孙悦明
Consumer Memory 指導老師 莊勝雄 MA4D0102郭虹汝MA4D0201吳宜臻.
化学生物信息学 -从进化到药物发现 张红雨 (华中农业大学生物信息中心).
On Some Fuzzy Optimization Problems
如何從事論文寫作 2 玄奘大學 林國威
Knowledge Engineering & Artificial Intelligence Lab (知識工程與人工智慧)
Logistics 物流 昭安國際物流園區 總經理 曾玉勤.
Course 9 NP Theory序論 An Introduction to the Theory of NP
Nationality Objective
Network Planning Algorithms in CATV Networks
基于自适应同步的网络结构识别 陆君安 School of Mathematics and Statistics, Wuhan University (复杂网络论坛,北京,April.27-29th,2011)
Formal Pivot to both Language and Intelligence in Science
ZEEV ZEITIN Delft University of Technology, Netherlands
What have we learned?.
第11章 物流系統規劃.
高职申请 申 请 人:孟增 竞聘岗位:副教授 研究方向:结构优化设计及可靠性分析 设岗学科:工程力学 土木与水利工程学院
近期科研汇报 报告人: 纪爱兵.
第十五课:在医院看病.
中国科技大学计算机科学与技术学院 School of Computer Science & Technology
A high payload data hiding scheme based on modified AMBTC technique
Measurement of Magic Wavelengths for the 40Ca+ Clock Transition
第4章 非线性规划 4.5 约束最优化方法 2019/4/6 山东大学 软件学院.
Version Control System Based DSNs
Yu-Chen 嘉義市立北興國民中學 新校舍符合永續建築 廚房新建工程 忠孝、仁愛、中正、至善樓修繕工程.
模式识别与智能系统研究中心介绍 2017年8月.
高性能计算与天文技术联合实验室 智能与计算学部 天津大学
二分网络研究 樊瑛 北京师范大学系统科学系
Guide to a successful PowerPoint design – simple is best
前向人工神经网络敏感性研究 曾晓勤 河海大学计算机及信息工程学院 2003年10月.
复杂网络简介 LiuChang.
Speaker: Wang,Song-Ferng Advisor: Dr. Ho-Ting Wu 2015/7/6
Representation Learning of Knowledge Graphs with Hierarchical Types
精微製造技術實驗室/Precision and Micro Manufacturing Technology Lab (實驗室中英文名稱)
Google Local Search API Research and Implementation
计算机问题求解 – 论题 算法方法 2016年11月28日.
系统科学与复杂网络初探 刘建国 上海理工大学管理学院
Efficient Query Relaxation for Complex Relationship Search on Graph Data 李舒馨
1.非线性规划模型 2.非线性规划的Matlab形式
April, Beijing 全局接种与个体保护对流行病传播的影响 许新建 上海大学数学系 上海大学系统科学研究所.
蔡世民 合作者:禚钊,傅忠谦,张捷 电子科学与技术系 中国科学技术大学 2011/4/29
高效洁净机械制造实验室是 2009 年教育部批准立项建设的重点实验室。实验室秉承“突出特色、创新发展“的宗旨,以求真务实的态度认真做好各项工作。 实验室主任为黄传真教授,实验室副主任为刘战强教授和李方义教授。学术委员会主任为中国工程院院士卢秉恒教授。实验室固定人员中,有中国工程院院士艾兴教授,教育部.
蛋白質交互作用資料庫、 網路拓樸分析與藥物標的搜尋 Protein Interactome, Topological Analysis on Complex Network for Identification of Drug Target
以碎形正交基底和時間情境圖為基礎進行之視訊檢索 Video retrieval based on fractal orthogonal bases and temporal graph 阿凡達 研究生:張敏倫 指導教授:蔣依吾博士 國立中山大學資訊工程學系.
定语从句(4).
Principle and application of optical information technology
Self-Attention huitr
Gaussian Process Ruohua Shi Meeting
Presentation transcript:

复杂网络的社团结构分析 Community structure in complex networks 章祥荪 http://zhangroup.aporc.org 中国科学院 数学与系统科学研究院 全国复杂网络会议,苏州大学, 2010,10, 17

复杂网络的动态性质研究 复杂网络的静态结构研究 小世界(Small world) ,尺度无关(Scale free),聚 类特性 (Clustering) 的确切数学模型。 社团结构 (Community Structure) …………

复杂网络的模块化性质 复杂网络中存在模块或者社区结构 (Module or Community structure) 模块或者社区定义为网络中内部连接稠密,与外部连 接稀疏的节点的集合 (Filippo Radicchi et. al. PNAS, Vol.101, No.9, 2658-2663, 2004). 数学表述: 其中V是子图,K是顶点的度。即子图 V 是模块的条件是模块内 顶点的内部连边的度值之和大于模块内顶点的外部连边的度值之 和。 PNAS ---- Proc. Natl. Acad. Sci. USA 美国科学院院刊

模块划分的重要性 许多复杂网络共有的性质。 研究模块结构有助于研究整个网络的结构和功能 圣塔菲研究所的科学家合作网:模块代表从事相似领域研究的科学家集合 数学生态学 统计物理

自然科学论文引用网络:6128期刊, 约600万次引用, 划分为88个模块和3024条 模块间的连接,刻画了学科之间的联系 Martin Rosvall, Carl T. Bergstrom, PNAS, vol. 105, no.4. 1118-1123, 2007 划分为88个模块和3024条 模块间的连接,刻画了学科之间的联系

一个社会网络的例子 W. W. Zachary, An information flow model for conflict and fission in small groups, Journal of Anthropological Research 33, 452-473 1977 1970年美国大学里的一个空手道俱乐部关系网络:节点是其34名成员,边是他们两年间的友谊关系,边数为78。俱乐部里的矛盾导致其分裂为两个小的俱乐部。问题是能否用网络的模块结构来重现这个过程? 它是模块探测研究中的经典例子。 含义对不对?

Importance of the topic Girvan, M, Newman, M., Proc. Natl. Acad. Sci, 2002 Ravasz, E, Somera, A, Mongru, D, Oltvai, Z, Barabasi, A., Science, 2002 Radicchi, F, Castellano, C, Cecconi, F., Proc. Natl. Acad. Sci, 2004 Guimera, R, Mossa, S, Turtschi, A., Proc. Natl. Acad. Sci, 2005 Guimera, R, Amaral, L., Nature, 2005 Newman, M., Proc. Natl. Acad. Sci, 2006 Rosvall, M, Bergstrom, C., Proc. Natl. Acad. Sci, 2007 Fortunato, S, Barthelemy, M., Proc. Natl. Acad. Sci, 2007 Weinan, E, Li, T, Vanden-Eijnden, E., Proc. Natl. Acad. Sci, 2008 Rosvall, M, Bergstrom, C., Proc. Natl. Acad. Sci, 2008 Peter J. Mucha, et al., Science 2010 Yong-Yeol Ahn, James P. Bagrow & Sune Lehmann,Nature, 2010 生物信息学与最优化方法

社团结构探索方法概述 A large number of methods have been developed for detecting communities, which can be generally categorized into local and global methods. Local methods for community detection identify a subset of nodes as a community according to certain local connection conditions, independently from the structure of the rest of the network. Such methods include clique overlap-based hierarchical clustering, clique percolation method, and sub-graph fitness method. Global methods for community detection optimize certain global quantitative functions encoding the quality of the overall partition of the network, such as information theoretical method, Potts model, and optimization of modularity measures.

我们小组在研究这一问题的早期发展了一些基于图论和矩阵谱分解的模块探测算法 (local method) Shihua Zhang, Rui-Sheng Wang, and Xiang-Sun Zhang. Identification of overlapping community structure in complex networks using fuzzy c-means Clustering. Physica A, 2007, 374, 483–490. Shihua Zhang, Rui-Sheng Wang and Xiang-Sun Zhang. Uncovering fuzzy community structure in complex networks. Physical Review E, 76, 046103, 2007 Rui-Sheng Wang, Shihua Zhang, Yong Wang, Xiang-Sun Zhang, Luonan Chen. Clustering complex networks and biological networks by nonnegative matrix factorization with various similarity measures. Neurocomputing, 2007

衡量网络模块化的指标Q值 设网络为 N=(V,E), Pk = { (V1, E1), …, (Vk, Ek)} 为一个 分划。L(Vi, Vj) =|Eij|, i in Vi, j in Vj. Newman 和 Girvan (Physical Review E, 2004) 提出一种衡量 网络社区结构的指标 Q 值

指标Q的问题 (Resolution limit) Fortunato and Barthélemy, PNAS, 2007 目前很大一部分模块探测的方法集中于利用各种启 发式算法来极大化Q值 ,例如模拟退火、遗传算法 等(Newman, PNAS, 2006; Guimera, Nature, 2005). Resolution limit 现象

极端例子:ring of cliques Fortunato & Barthelemy, Proc. Natl. Acad. Sci. USA 104 (1), 36-41 (2007)

提出新的模块化指标D值 模块化密度函数 D: Zhenping Li, Shihua Zhang, Rui-Sheng Wang, Xiang-Sun Zhang, Luonan Chen, Quantitative function for community detection. Physical Review E, 77, 036109, 2008

D值克服了Q值存在的 resolution limit 问题

结果 D值 划分正确的顶点的比例 Q值

错分现象---Misidentification 用Q或D作优化可能得到不满足定义的模块 Q partitions the network into three communities (two Kn and one K5) when n>=16 (respectively, n>=21), in which K5 is a sub-graph violating all reasonable community definition. Xiang-Sun Zhang, Rui-Sheng Wang, Yong Wang, Ji-Guang Wang, Yu-Qing Qiu, Lin Wang, and Luonan Chen. Modularity optimization in community detection of complex networks. Europhysics Letters (EPL), 87, 2009. 被评为 EPL 2009 best paper 16

该文的主要贡献是用离散凸规划的概念对两个重要问题进行解析分析 Q 值和D 值的最优化模型都是非线性整数规划 目标函数的凸性和凹性无法解析得到 对两个具有特殊结构的网络进行分析 引入离散凸规划(变量是离散的,可以嵌入一个连续的 凸规划)的概念进行分析, 得到解析解

所有对modularity进行研究的论文(指上面所列的 的PNAS,Nature,Sience文章)都是试题论证的,即 没有解析的证明. 为了彻底分析resolution limit和 Misidentification 现象,我们对两类典型网络建 立了优化模型,引入了离散凸分析技术,得到了两类 问题的解析解. 生物信息学与最优化方法

基于特殊结构的凸分析 这两个例子出现在PNAS中几乎所有讨论网络模块 探测的论文里 ring of dense lumps ad hoc network

Finding 1 对

Finding 2 生物信息学与最优化方法

Finding 3 解析解表明,对这两个经典的算例,Q和D都有 Resolution limit和Misidentification的现象产生, 所以Q 和D均只是近似的定量评估函数。 网络社团划分的问题可以用一个优化问题来精确 描述,我们证明了这一模型是NP-hard的。 我们相信用优化理论可以彻底解决网络社团划分 的问题。网络科学是运筹学的下一个热点。

为了彻底解决这些问题 提出一个新的 OR 模型和相应的算法,这一算法不会产生 resolution limit 和 mis-identification 现象 Xiang-Sun Zhang, Zhenping Li, Rui-Sheng Wang, Yong Wang. A combinatorial model and algorithm for globally searching community structure in complex networks Journal of Combinatorial Optimization (JCO), 2010. DOI: 10.1007/s10878-010-9356-0

A new OR model Problem definition: Given a network, the community identification problem is to partition the network into as many non-overlapping sub-networks as possible such that each sub-network satisfies a given community definition. 24

以上文字定义可以用一个整数线性规划来描述 我们证明了这个模型是 NP-hard . 25

A qualified min-cut (QMC) algorithm A heuristic principle is given to find a feasible partition with the largest number of communities. It is realized by a min-cut operation: A min-cut operation is called qualified if the two resulting sub-networks satisfy the module definition. The community identification problem can be solved based on a series of qualified min-cut operations. 26

Experiment results (artificial networks) Rings of cliques Uneven ad-hoc network 27

Experiment results (real networks) Football team network Jazz musician network 28

谢谢大家! 欢迎访问 ZHANGroup, http://zhangroup.aporc.org 本报告可在该网页上下载 29