第六届全国复杂网络学术会议 微观视角下的社会网络站点 中的交友模式 胡 海 波 华东理工大学 2010. 10
在线社会网络 WWW上人与人之间通过在线社会软件建立起来的人际关系网络。这些在线社会软件多运行在Web 2.0互联网模式下。 朋友关系 The emergence of ‘cyberspace’ and the World Wide Web is like the discovery of a new continent. – Jim Gray, 1998 Turing Award address 在线社会网络 WWW上人与人之间通过在线社会软件建立起来的人际关系网络。这些在线社会软件多运行在Web 2.0互联网模式下。 朋友关系 同学关系 亲属关系 商业合作关系 Lazer D, et al. Computational social science. Science, 2009, 323: 721-723. Kleinberg J. The convergence of social and technological networks. Commun. ACM, 2008, 51(11): 66-72.
在线社会网络 在线社会媒体 在线交友网 BBS 在线个人社区 P2P 实时通信系统 Digg Flickr 豆瓣 Youtube 土豆网 CiteULike, del.icio.us, BibSonomy 在线交友网 Facebook(N>2亿) 人人网(原校内网 N>1亿) Myspace(N>2亿) Mixi Cyworld orkut Pussokram BBS 饮水思源BBS 水木清华BBS 在线个人社区 Yahoo! 360° LiveJournal P2P Gnutella 实时通信系统 MSN(N>2.4亿) QQ ICQ
若邻网络 www.wealink.com 一个大型的在线社会网络,注册用户多为职业人士。
互惠性及互惠时间分布 在若邻网中,一位用户若邀请另外一位用户作为他的好友,那么只有当被邀请的用户接受邀请之后,二人之间的好友关系才能确立,从而在两位用户之间产生一条新的连边。每位用户的度值,即好友数,将显示在其个人简介的页面上,并可被所有的网络用户浏览。用户的互惠性是指某用户向另一用户发出邀请从而导致该邀请被接受。 Data format (triples) <From, To, When> <U1, U2, T1> Invite <U1, U3, T2> Invite <U3, U1, T3> Accept <U4, U2, T4> Invite <U2, U4, T5> Accept <U2, U1, T6> Accept …… U3 U1 U3 U1 Network evolution U3 U1 U2 U2 U4 U4 T3 T5 T6
用户往往快速地响应并接受邀请,近似地,时间间隔分布以 指数衰减。事实上,67.04%的请求在一天(24小时)内接受, (a)发出与接受邀请之间的时间间隔分布,(b)发出邀请之后在第i天被接受的比例 用户往往快速地响应并接受邀请,近似地,时间间隔分布以 指数衰减。事实上,67.04%的请求在一天(24小时)内接受, 84.25%的连接请求在一个月(30天)内接受。
接受邀请的速度是否与邀请者或接受者的度值有关? 平均互惠时间<t>与邀请者/接受者的度值的关系 互惠时间与邀请者/接受者的度值的Pearson相关系数为-0.02/-0.05, 几乎是不相关的。另外,我们发现,对于某些大度值的邀请者/接受者, 他们的平均互惠时间<t>很短,从而导致了上述的弱的负相关性,这些 用户构成了该网络中最活跃的用户。
用户行为的时间特性 用户发出邀请之间、接受邀请之间或任意两个事件之间的时间间隔分布 三个分布都满足指数约为1.89的幂律分布。分布的尾部在时间间隔为整数天的位置上出现尖峰,表明了人的生活习惯中所出现的每天的周期性。
用户的优先选择特性 测试方法 正反馈效应:发出好友邀请的次数越多,再次发出邀请的可能性也就越大;接受邀请的次数越多,再次接受的可能性也越大。 <From, To, When> <U1, U2, T1> Invite <U1, U3, T2> Invite <U3, U1, T3> Accept <U4, U2, T4> Invite <U2, U4, T5> Accept <U2, U1, T6> Accept …… <From, To, When> <U1, U2, T1> Invite <U1, U3, T2> Invite <U4, U2, T4> Invite …… Launching sequence: U1, U1, U4, ... Reception sequence: U2, U3, U2, … 正反馈效应:发出好友邀请的次数越多,再次发出邀请的可能性也就越大;接受邀请的次数越多,再次接受的可能性也越大。 测试方法 Jure Leskovec, Lars Backstrom, Ravi Kumar, Andrew Tomkins. ACM KDD’08, pp. 462-470
测试Wealink中用户的优先选择特性 线性优先 回归模型
用户的优先连接特性 优先接受:老用户的度值越大,就越可能接受来自其他老用户的邀请并与之建立连接(U2); <From, To, When> <U1, U2, T1> Invite <U1, U3, T2> Invite <U3, U1, T3> Accept <U4, U2, T4> Invite <U2, U4, T5> Accept <U2, U1, T6> Accept <U5, U4, T7> Invite <U4, U5, T8> Accept …… U3 U1 U3 U3 U1 U1 Network evolution U3 U1 U2 U2 U2 U4 U4 U4 U5 T3 T5 T6 T8 优先接受:老用户的度值越大,就越可能接受来自其他老用户的邀请并与之建立连接(U2); 优先创建:老用户的度值越大,他/她的邀请就越可能被其他的老用户接受(U1); 优先依附:新用户倾向于跟度值大的老用户建立连接(U4)。
测试不同类型连接的优先性 线性优先性 现实中的社会网络具有明显的亚线性优先性β<1。现实社会网络中, 每个人的人脉关系基本上是不透明的,而在线社区则不同,每位用户有 多少好友甚至这些好友是谁都标识的一清二楚,这使得网络明星在在线 社区中的吸引力,相对于现实中的人际关系,更为显著。
谢谢! 欢迎批评指正