精华内容
下载资源
问答
  • 复杂网络

    千次阅读 2018-09-06 13:54:36
    NetworkX是一个用Python语言开发的图论与复杂网络建模工具,内置了常用的图与复杂网络分析算法,可以方便的进行复杂网络数据分析、仿真建模等工作。networkx支持创建简单无向图、有向图和多重图(multigraph);内置...

    NetworkX是一个用Python语言开发的图论与复杂网络建模工具,内置了常用的图与复杂网络分析算法,可以方便的进行复杂网络数据分析、仿真建模等工作。networkx支持创建简单无向图、有向图和多重图(multigraph);内置许多标准的图论算法,节点可为任意数据;支持任意的边值维度,功能丰富,简单易用。

    1.安装networkx包

    2.

    G = nx.Graph()                 #建立一个空的无向图G
    G.add_node(1)                  #添加一个节点1
    G.add_edge(2,3)                #添加一条边2-3(隐含着添加了两个节点2、3)
    G.add_edge(3,2)                #对于无向图,边3-2与边2-3被认为是一条边
    print "nodes:", G.nodes()      #输出全部的节点: [1, 2, 3]
    print "edges:", G.edges()      #输出全部的边:[(2, 3)]
    print "number of edges:", G.number_of_edges()   #输出边的数量:1

    有向图:

    G = nx.DiGraph()
    G.add_node(1)
    G.add_node(2)
    G.add_nodes_from([3,4,5,6])
    G.add_cycle([1,2,3,4])
    G.add_edge(1,3)
    G.add_edges_from([(3,5),(3,6),(6,7)])

    有向图转无向图与无向图转有向图:

    • Graph.to_undirected()
    • Graph.to_directed()

    加权图:

    有向图和无向图都可以给边赋予权重,用到的方法是add_weighted_edges_from,它接受1个或多个三元组[u,v,w]作为参数,其中u是起点,v是终点,w是权重

     

     

    3.以中医方向为例

    例如构建中医方剂网络:方剂学是研究中药方剂租房、变化和临床应用规律的一门学科,主要包括方剂组成的原则、使用及变化等。中药方剂学网络的构建主要有中药-中药、中药-方剂以及方剂-方剂三种。中药-中药网络中将方剂中每一味药抽象为节点,根据是否在同一方剂中确定各味药节点之间是否存在边关联,因此由不同方剂抽象出的完全图相互关联,进而形成中药复杂网络。

    中药-方剂网络构建则将单味药及方剂分别作为节点,根据单味药与方剂的从属关系进行关联。

    方剂-方剂网络则视方剂为节点,根据不同方剂间是否存在同味药进行关联

     
























     

    展开全文
  • 复杂网络综述

    万次阅读 多人点赞 2016-11-05 09:44:55
    本人毕业设计是关于复杂网络的,之前完全没听说过的概念,于是就在网上找了一些论文来看,顺便做下笔记,这篇文章主要讲了复杂网络的一些基础概述。 这里的网络不是(不仅仅是)计算机网络这门课中的网络,它表示的...

    本人毕业设计是关于复杂网络的,之前完全没听说过的概念,于是就在网上找了一些论文来看,顺便做下笔记,这篇文章主要讲了复杂网络的一些基础概述。
    这里的网络不是(不仅仅是)计算机网络这门课中的网络,它表示的是任何一个可以用节点和节点之间连线来代表的一个系统,如:神经系统可以看做是大量神经细胞通过神经纤维相互连接形成的网络。

    • 拓扑结构
      拓扑结构就是们把网络不依赖于节点的具体位置 和边的具体形态就能表现出来的性质叫做网络的拓扑性质 ,相应的结构叫做网络的拓扑结构。
      通俗点说就是任何网络结构不管他的节点是什么,边是怎样的,把节点当做点,把点当做线,只关心它是怎样连接的,这就是网络的拓扑结构。

    • 复杂网络的由来
      科学家们企图用一种通用的拓扑结构来将真实世界中的各种系统表示出来,期间经历了三个阶段:

      • 1 用一种固定的规则的结构表示:如二维平面上的欧几里得网格
      • 2 节点之间的边不再是确定的,而是用一个概率决定,也就是随机网络
      • 3 真实网络既不是规则的也不是随机的,而是一种与前两种不同的统计特征网络,即复杂网络。
    • 复杂网络概念
      百度百科给出的复杂网络的定义是:复杂网络(Complex Network),具有自组织、自相似、吸引子、小世界、无标度中部分或全部性质的网络称为复杂网络。

      下面先给出小世界效应和无标度网络的概念:

    • 小世界效应
      在给出小世界概念效应之前,先说一下什么是簇系数和网络的平均距离:

      • 平均距离
        两点间的距离被定义为连接两点的最短路所包含的边的数目,把所有节点对的距离求平均就是网络的平均距离。
      • 簇系数
        对于某个节点,它的簇系数被定义为它所有相邻节点之间连边数目占可能的最大连边数目的比例。(比如一个节点和三个节点相连,则它相邻的这三个节点的最大连边数目为3,加入实际只有其中两个节点相连,则该节点簇系数为1/3)。网络的簇系数是所有节点簇系数的平均值。

      这里写图片描述
      规则网络具有大的簇系数和大的平均距离(任何一个节点的度都相同)
      随机网络具有小的簇系数和小的平均距离(ER随机图的许多重要特性都是突然涌现的,也就是说给定边相连的概率P,要么几乎所有图都有某个性质,要么几乎所有图都不具有该性质)
      小世界网络具有大的簇系数和小的平均距离
      (小世界网络是在规则网络不改变原有边的基础上,以一个小的概率在原有网络上添加新边)
      小世界效应:大的簇系数和小的平均距离两个统计特征合在一起称为小世界效应。具有这种效应的网络就是小世界网络。
      (真实网络几乎都具有小世界效应)
      这里写图片描述
      (该图就是小世界网络的构造方法)

    • 无标度网络
      节点度服从幂律分布就是说, 具有某个特定(出/入)度的节点数目与这个特定的度之间的关系可以用一个幂函数近似地表示。幂函数曲线是一条下降相对缓慢的曲线 ,这使得度很大的节点可以在网络中存在。对于随机网络和规则网络 ,度分布区间非常狭窄 ,几乎找不到偏离节点度均值较大的点 ,故其平均度可以被看作是其节点度的一个特征标度.
      在这个意义上 ,我们把节点度服从幂律分布的网络叫做无标度网络, 并称这种节点度的幂律分布为网络的无标度特性.
      无标度网络构造方法:
      这里写图片描述

      网络的拓扑结构决定了网络所拥有的特性。 复杂网络表现出了与经典的随机图模型理论不同的特性。

      下面用实际生活中的例子说明小世界效应和无标度网络:
      小世界效应:小世界模型反映了朋友关系网络的一种特性, 即大部分人的朋友都是他们日常生活中经常接触的。 另外, 也有一些朋友离得很远, 甚至异国他乡。 正是由于这种不同朋友圈之间的长程连接, 导致了网络具有较小的平均路径长度。著名的“六度分离(Six degrees of separation) ”实验, 在某种程度上反映了人际关系的“小世界”特征。

      无标度网络:幂律分布的形成, 主要是由于节点的偏附依好(preferential attachment),即新加入网络的节点倾向于与那些具有较大度的节点相连, 这种现象也称为“马太效应(M atthew effect)”, 主要反映了人们的从众心理。

    • 复杂网络的鲁棒性和脆弱性
      对网络节点的攻击主要有随机攻击和针对重要节点的攻击。
      复杂网络对于随机攻击具有较强的鲁棒性,即使众多节点被摧毁也不一定导致网络的瘫痪崩溃;然而众多重点节点被攻击的话,整个网络将会崩溃。

    • 复杂网络的社区结构
      社区就是网络中节点的集合, 社区中的节点之间具有紧密的连接, 而社区之间则为松散的连接。 它体现了复杂系统的层次和模块结构。(如同大学校园里的抱团行为)

    • 复杂网络的基本拓扑结构与图论
      复杂网络的基本拓扑结构可以用图论的方法表示成 G =(V , E), V 中元素称为节点或顶点(Vertex 或 Node), E 中元素称为边(Edeg或Link)。 在图论框架下, 可用不同的全局参量来表示复杂网络的特征, 最基本特征包括度分布 P(k)、平均路径长度L和聚类系数C。

      • 度分布
        节点的度指的是与该节点连接的边数。
        所有节点的度的平均值称为网络的平均度。
        网络中度分布函数的含义是:任意选择的节点恰度为K的概率;也就是网络中度为K的节点与总节点的个数比值。
      • 平均路径长度
        网络中两个节点 i 和 j 之间的距离d ij 定义为连接这两个节点的最短路径上的边数。 网络直径定义为网络中任意两个节点之间的距离的最大值, 记为 D : 这里写图片描述
        网络的平均路径长度 L 定义为两个节点之间的距离的
        平均值:这里写图片描述
        式中, N 为网络节点数。 网络的平均路径长度也称为网络的
        特征路径长度。 一般来说, 真实网络有较短的平均路径长度。

      • 聚类系数
        节点 i 的聚类系数为与它相连接的k i 个节点彼此之间也相连的概率:
        这里写图片描述
        式中, Ei是这ki个节点之间实际存在的边数。这ki个节点之间最多可能有k i(ki-1)/2条边。
        网络的平均聚类系数为:这里写图片描述

      以上是一些关于复杂网络的部分基础概念,后面一篇博客将介绍复杂网络中重要节点挖掘的相关方法算法复杂网络中重要节点挖掘方法综述,如果有大神愿意指点我最好不过了^-^
      Q:386284750

      注:转载请注明原文出处:
      作者:CUG_UESTC
      出处:http://blog.csdn.net/qq_31192383/article/details/53043606


    参考文献:
    [1]周涛,柏文洁,汪秉宏,刘之景,严纲. 复杂网络研究概论. 物理. 2005年01期:31-35
    [2]赫南,李德毅,淦文燕,朱熙. 复杂网络中重要性节点发掘综述. 计算机科学. 2007年12期:1-5
    [3]陈端兵,黄晟,尚明生. 复杂网络模型及其在疫情传播和控制中的应用研究. 计算机科学. 2011年06期:118-121

    展开全文
  • 复杂网络分析总结

    万次阅读 多人点赞 2018-04-08 15:31:40
    复杂网络的特点2. 社区检测3. 结构平衡4. 影响最大化5. 网络传播6. 补充7. 参考文献 在我们的现实生活中,许多复杂系统都可以建模成一种复杂网络进行分析,比如常见的电力网络、航空网络、交通网络、计算机网络...

      在我们的现实生活中,许多复杂系统都可以建模成一种复杂网络进行分析,比如常见的电力网络、航空网络、交通网络、计算机网络以及社交网络等等。复杂网络不仅是一种数据的表现形式,它同样也是一种科学研究的手段。复杂网络方面的研究目前受到了广泛的关注和研究,尤其是随着各种在线社交平台的蓬勃发展,各领域对于在线社交网络的研究也越来越火。研究生期间,本人的研究方向也是一直与复杂网络打交道,现在马上就要毕业了,写一篇博文简单介绍一下复杂网络特点以及一些有关复杂网络研究内容的介绍,希望感兴趣的博友可以一起讨论,一起学习。

      下图分别是一个航空网络(上图)和Facebook网络全球友谊图(下图)。


    1. 复杂网络的特点

      钱学森对于复杂网络给出了一种严格的定义:具有自组织、自相似、吸引子、小世界、无标度中部分或全部性质的网络称之为复杂网络。言外之意,复杂网络就是指一种呈现高度复杂性的网络,其特点主要具体体现在如下几个方面:

      1.1 小世界特性

      小世界特性(Small world theory)又被称之为是六度空间理论或者是六度分割理论(Six degrees of separation)。小世界特性指出:社交网络中的任何一个成员和任何一个陌生人之间所间隔的人不会超过六个,如下图所示:

      在考虑网络特征的时候,通常使用两个特征来衡量网络:
      特征路径长度(characteristic path length):在网络中,任选两个节点,连通这两个节点的最少边数,定义为这两个节点的路径长度,网络中所有节点对的路径长度的平均值,定义为网络的特征路径长度。这是网络的全局特征。
      聚合系数(clustering coefficient):假设某个节点有kk条边,则这kk条边连接的节点(kk个)之间最多可能存在的边的条数为k(k1)/2k(k−1)/2,用实际存在的边数除以最多可能存在的边数得到的分数值,定义为这个节点的聚合系数。所有节点的聚合系数的均值定义为网络的聚合系数。聚合系数是网络的局部特征,反映了相邻两个人之间朋友圈子的重合度,即该节点的朋友之间也是朋友的程度。
      对于规则网络,任意两个点(个体)之间的特征路径长度长(通过多少个体联系在一起),但聚合系数高(你是朋友的朋友的朋友的几率高)。对于随机网络,任意两个点之间的特征路径长度短,但聚合系数低。而小世界网络,点之间特征路径长度小,接近随机网络,而聚合系数依旧相当高,接近规则网络。
      复杂网络的小世界特性跟网络中的信息传播有着密切的联系。实际的社会、生态、等网络都是小世界网络,在这样的系统里,信息传递速度快,并且少量改变几个连接,就可以剧烈地改变网络的性能,如对已存在的网络进行调整,如蜂窝电话网,改动很少几条线路,就可以显著提高性能。

      1.2 无标度特性

      现实世界的网络大部分都不是随机网络,少数的节点往往拥有大量的连接,而大部分节点却很少,节点的度数分布符合幂率分布,而这就被称为是网络的无标度特性(Scale-free)。将度分布符合幂律分布的复杂网络称为无标度网络。

      下图为一个具有10万个节点的BA无标度网络的度数分布示意图:

      无标度特性反映了复杂网络具有严重的异质性,其各节点之间的连接状况(度数)具有严重的不均匀分布性:网络中少数称之为Hub点的节点拥有极其多的连接,而大多数节点只有很少量的连接。少数Hub点对无标度网络的运行起着主导的作用。从广义上说,无标度网络的无标度性是描述大量复杂系统整体上严重不均匀分布的一种内在性质。

      其实复杂网络的无标度特性与网络的鲁棒性分析具有密切的关系。无标度网络中幂律分布特性的存在极大地提高了高度数节点存在的可能性,因此,无标度网络同时显现出针对随机故障的鲁棒性和针对蓄意攻击的脆弱性。这种鲁棒且脆弱性对网络容错和抗攻击能力有很大影响。研究表明,无标度网络具有很强的容错性,但是对基于节点度值的选择性攻击而言,其抗攻击能力相当差,高度数节点的存在极大地削弱了网络的鲁棒性,一个恶意攻击者只需选择攻击网络很少的一部分高度数节点,就能使网络迅速瘫痪。

      1.3 社区结构特性

      人以类聚,物以群分。复杂网络中的节点往往也呈现出集群特性。例如,社会网络中总是存在熟人圈或朋友圈,其中每个成员都认识其他成员。集群程度的意义是网络集团化的程度;这是一种网络的内聚倾向。连通集团概念反映的是一个大网络中各集聚的小网络分布和相互联系的状况。例如,它可以反映这个朋友圈与另一个朋友圈的相互关系。

      下图为网络聚集现象的一种描述:


    2. 社区检测

      社区检测(community detection)又被称为是社区发现,它是用来揭示网络聚集行为的一种技术。社区检测实际就是一种网络聚类的方法,这里的“社区”在文献中并没有一种严格的定义,我们可以将其理解为一类具有相同特性的节点的集合。近年来,社区检测得到了快速的发展,这主要是由于复杂网络领域中的大牛Newman提出了一种模块度(modularity)的概念,从而使得网络社区划分的优劣可以有一个明确的评价指标来衡量。一个网络不通情况下的社区划分对应不同的模块度,模块度越大,对应的社区划分也就越合理;如果模块度越小,则对应的网络社区划分也就越模糊。

      下图描述了网络中的社区结构:

      Newman提出的模块度计算公式如下:



    其中mm为网络中总的边数,A是网络对应的邻接矩阵,Aij=1Aij=1代表节点ii和节点jj之间存在连边,否则不存在连边。kiki为节点ii的度数,CiCi为节点ii属于某个社区的标号,而δ(Ci,Cj)=1δ(Ci,Cj)=1当且仅当Ci=CjCi=Cj

      上述的模块度定义其实很好理解,我们可以根据一个网络的空模型去进行理解。网络的空模型可以理解为只有节点的而没有连边,这时候一个节点可以和图中的任意其他节点相连,并且节点iijj相连的概率可以通过计算得到。随机选择一个节点与节点ii相连的概率为kj/2mkj/2m,随机选择一个节点与节点jj相连的概率为kj/2mkj/2m,那么节点ii和节点jj相连的概率为pipj=kikj/(4m2)pipj=kikj/(4m2),边数的期望值Pij=2mpipj=kikj/(2m)Pij=2mpipj=kikj/(2m)所以模块度其实就是指一个网络在某种社区划分下与随机网络的差异,因为随机网络并不具有社区结构,对应的差异越大说明该社区划分越好。

      Newman提出的模块度具有两方面的意义:

      (1)模块度的提出成为了社区检测评价一种常用指标,它是度量网络社区划分优劣的量化指标;

      (2)模块度的提出极大地促进了各种优化算法应用于社区检测领域的发展。在模块度的基础之上,许多优化算法以模块度为优化的目标方程进行优化,从而使得目标函数达到最大时得到不错的社区划分结果。

      当然,模块度的概念不是绝对合理的,它也有弊端,比如分辨率限制问题等,后期国内学者在模块度的基础上提出了模块度密度的概念,可以很好的解决模块度的弊端,这里就不详细介绍了。

      常用的社区检测方法主要有如下几种:

      (1)基于图分割的方法,如Kernighan-Lin算法,谱平分法等;

      (2)基于层次聚类的方法,如GN算法、Newman快速算法等;

      (3)基于模块度优化的方法,如贪婪算法、模拟退火算法、Memetic算法、PSO算法、进化多目标优化算法等。


    3. 结构平衡

      结构平衡(Structural Balance)主要是针对社交网络的研究而被提出的,它最早源于社会心理学家Heider提出的一个结构平衡理论。

      3.1 网络平衡的发展

      网络平衡有时也称社会平衡(Social Balance),就网络平衡的发展来说,我们可以将其分为三个发展阶段。
      3.1.1 网络平衡理论的提出
      “网络平衡”一词最早是由Heider基于对社会心理学的研究而提出的,Heider在1946年的文章Attitudes and cognitive organization[1]中针对网络平衡的概念提出了最早的平衡理论:
      (1)朋友的朋友是朋友;
      (2)朋友的敌人是敌人;
      (3)敌人的朋友是敌人;
      (4)敌人的敌人是朋友。
      用常见的三元组合来表示上述的Heider理论如下:

      上述的平衡理论是有关网络平衡提出的最早的理论,它后来也被称为是强平衡理论。

      1956年,Cartwright和Harary对Heider的平衡理论进行了推广,并将其用在了图理论中(STRUCTURAL BALANCE: A GENERALIZATION OF HEIDER'S THEORY[2])。Cartwright和Harary指出对于一个符号网络而言,网络平衡的充要条件是网络中的所有三元组都是平衡的,该结论也可以陈述为一个符号网络平衡的充要条件是它所包含的所有回路(cycles)都是平衡的(“-”号的个数为整数个)。而且,在这篇文章中,他们还提出了著名的结构平衡理论:如果一个符号网络是平衡的,那么这个网络就可以分为两部分子网络,其中每个子网络内部中节点的连接都是正连接,网络之间的连接均为负连接。

      在这各阶段网络平衡的发展的重心主要在于构建网络平衡的心理学和社会学模型。

      3.1.2 网络平衡的数学模型

      在有了Heider等人的奠基工作后,有关网络平衡的发展主要是构建其数学模型,比如网络的动态表现,一个网络连接如何随时间的变化而变化,网络中节点之间的朋友或者敌人的关系如何演化等等。

      3.1.3 网络平衡的应用

      最新关于网络平衡方面的研究大都是研究一些在线网络,比如对某个网站用户属性的分析等等。而且,目前我们身处大数据时代,我们所要研究的网络规模也变为了大型甚至可以说是超大型网络,这这个背景下,如何计算一个网络是否平衡便成为该领域的主要热点问题。

      3.2 网络平衡的基本理论

      (1) Heider理论(强平衡理论SBT)。

      (2) 结构平衡理论(Structural Balance Theroem):在完全符号网络中,网络平衡的充要条件是其所有的三元组(回路)都平衡。

      结构平衡的推论:一个完全符号网络平衡的充要条件是它可以被分为两部分X和Y,X和Y内部的节点连接均为正连接,X和Y之间的连接均为负连接。

      (3) 弱平衡理论(A weaker form of structural balance,WSBT):如果完全符号网络中不存在这样的三元组:两个边为正,一边为负,则该网络称为是弱平衡网络。

      对于弱平衡理论而言,上图的三元组中,三边均为负连接的三元组也属于平衡三元组,也就是三元组的四种情况有三种属于平衡状态,一个属于不平衡状态(两边为正,一边为负)。

      弱平衡网络推论:如果一个网络为弱平衡理论,那么它可以分为多个部分,每部分内的连接为正,部分之间的连接为负。

      (4) 对任意网络平衡的定义.

      1) 对于一个任意网络而言,如果我们可以将它所缺失的边填充使它成为一个平衡的完全符号网络,那么原网络就是平衡网络;
      2) 对于一个任意网络而言,如果我们可以将它分为两部分,使得每个部分内的连接均为实线,部分之间的连接均为虚线。
      以上的两种定义是等价的。
      一个符号网络平衡的充要条件是它不包括含有奇数个负连接的回路。

      (5) 近似平衡网络(略)。

      3.3 网络平衡的计算(A spectral algorithm for computing social balance)
      命题1:节点i参与的三元组数目

      A为邻接矩阵,元素取值可能为:1,-1,0;
      G为邻接矩阵,元素取值可能为:0,1.
      命题2:对于节点i而言,bi为其参与的平衡三元组数目,ui为其参与的不平衡三元组数目,则

      理论1:对于完全符号图而言,

      平衡三元组所占的比例为

      理论2:对于任意符号网络,平衡三元组所占的比例为

      
      注:以上两个计算网络平衡的公式中,特征值可以随大到小选择前几个比较大的,就像PCA那样,这样可以使得计算的复杂度大大减小。


    4. 影响最大化

      随着各种在线社交平台的发展,社交平台(比如QQ、微博、朋友圈等)已经不仅仅是一种用户进行沟通的社交平台,它们更是社会信息产生和传播的一种主要的媒介。影响最大化(Influence Maximization)同结构平衡一样,也是针对社会网络的研究而被提出的,它来源于经济学的市场营销。2001年,影响最大化被Domins首次以一种算法问题的形式被提出。而影响最大化受到广泛的关注是在2003年Kempe等人在当年的KDD会议上发表的一篇有关影响最大化的论文之后,随后各种影响最大化算法被迅速提出,最近的十几年里,影响最大化的相关文章达到了上千篇,可见这个问题还是很值得关注的。

      影响最大化问题可以这样来描述:一个商家或者企业利用一种社交平台(比如为新浪微博)为自己的新产品或者新服务进行推广,如何在资金有限的情况下雇佣微博达人来做推广可以使得推广范围达到最大?

      我们再给出影响最大化的一般定义:

      给定一个网络GG和一个整数KK(一般小于50),如何在GG中找出KK个节点,使得这KK的节点组成的节点集合SS的影响传播范围σ(S)σ(S)达到最大。

      根据上述影响最大化的定义我们很容易可以知道,影响最大化本身属于一种组合优化问题。常用的影响最大化传播模型有独立级联传播模型(ICM)和线性阈值传播模型(LTM)。

      影响最大化方面的主要算法可以分为如下几类:

      (1)基于网络中心性的启发式方法:比如最大度方法、最短平均距离方法、PageRank方法等;

      (2)基于子模块性的贪婪方法:比如最经典的Greedy算法,CELF算法以及后来的NewGreedy和CELF++等;

      (3)基于社区结构的方法:比如CGA算法、CIM算法等;

      (4)基于目标函数优化的方法:比如模拟退火算法等。

    5. 网络传播

       网络传播领域涉及很多方面,比如网络节点重要性排序、网络鲁棒性分析、网络信息爆发阈值优化等。这些领域都很有意思,感兴趣的博友可以好好深入研究一下。

    6. 补充

      6.1 网络可视化工具

      首先在这里推荐两款我常用的网络可视化工具:Pajek (点击进入官方网站)、Gephi(点击进入官方网站)。

      下边为pajek可视化窗口下的一个网络拓扑结构图:

     

      这是Gephi的一个可视化效果:


      6.2 网络数据集

      常用的一些公开数据集整理:

      Pajek(可视化工具)数据集:http://vladowiki.fmf.uni-lj.si/doku.php?id=pajek:data:index;

      Newman(复杂网络科学领域大牛)个人数据集:http://www-personal.umich.edu/~mejn/netdata/

      Stanford大学大规模网络数据集:http://snap.stanford.edu/data/

      复旦大学网络数据集整理:http://gdm.fudan.edu.cn/GDMWiki/Wiki.jsp?page=Network%20DataSet

      KONECT数据集整理:http://konect.uni-koblenz.de/


    7. 参考文献

      [1] Grivan and Newman. Community structure in social and biological networks. PNAS, 2002.

      [2] Newman and Grivan. Finding and evaluating community structure in networks. PRE, 2004.

      [3] Newman. Networks: an introduction. 2010.

      [4] Cartwright and Harary. Structural balance: a generalization of Heider's theory. 1956.

      [5] Facchetti et al. Computing global structural balance in large-scale signed social networks. 2011.

      [6] Kempe et al. Maximizing the spread of influence through a social network. 2003.

      [7] Chen et al. Efficient influence maximization in social networks. 2009. 

      [8] 任晓龙,吕琳媛. 网络重要节点排序方法综述. 2014.


    出处:http://www.cnblogs.com/maybe2030/p/4665847.html#_labelTop


    展开全文
  • 复杂网络的研究常常是和实际的复杂系统紧密结合的。从小世界和无尺度现象的发现开始,人们就逐渐认识到,包括社会网络中人与人之间的交际网络和Internet, web等大量现实网络在内的系统中隐含了大量的秘密等待人们去...

    原文出处:http://blog.sciencenet.cn/home.php?mod=space&uid=237587&do=blog&id=228595


    复杂网络的研究常常是和实际的复杂系统紧密结合的。从小世界和无尺度现象的发现开始,人们就逐渐认识到,包括社会网络中人与人之间的交际网络和Internet, web等大量现实网络在内的系统中隐含了大量的秘密等待人们去发现。这里总结了复杂网络研究的常用载体的集合,这些载体大部分是在复杂网络的论文中使用频度很高的。当然,很多时候,我们的网络研究也许会针对某一项特定的实证研究展开,而且这些实证研究的网络是需要自己根据实际情况抽取、构建的。但是无论怎么样,公用的载体集总是可以为我们提供一些帮助的,比如Mark Newman, Barabasi等人的个人网页上就提供了一些载体集合。这里将复杂网络的载体分成四大类:社会学网络,生物学网络,计算机网络,人造技术网络,最后列举了网络上公开的其他一些网络研究载体集。

    [特别提醒]每一个特定载体集合的出处均标明,正常引用这些资料的时候需要尊重原始作者的知识产权。


    1. 社会学网络


    1.1 ZACHARY空手道俱乐部成员关系网络


    【简介】Zachary空手道俱乐部成员关系网络是复杂网络、社会学分析等领域中最常用的一个小型检测网络之一。从1970到1972年,Wayne Zachary用三年时间观察了美国一所大学空手道俱乐部成员间的社会关系,并构造出了社会关系网(Zachary’s karate club network)。网络中的每个节点分别表示某一个俱乐部成员,节点间的连接表示两个成员经常一起出现在俱乐部活动(如空手道训练、俱乐部聚会等)之外的其他场合,即在俱乐部之外他们可以被称为朋友。调查过程中,该俱乐部因为主管John A.(节点34)与教练Mr. Hi(节点1)之间的争执而分裂成2个各自为核心的小俱乐部,不同颜色与形状的节点代表分裂后的小俱乐部成员。规模:34个节点,78条边
    【数据集】zarchary
    【出处】Zachary W W. An information flow model for conflict and fission in small groups. Journal of Anthropological Research, 1977, 33:452–473

    1.2美国政治书网络


    【简介】由V. Krebs从Amazon上销售的美国政治相关书籍页面上建立起来的网络。其节点代表在Amazon在线书店上销售的美国政治相关图书,边代表一定数量的读者同时购买了这两本图书(由抽取网页上的“购买了这本书的读者同时也购买了一些图书”指示得到)。节点分成了三类:l, n和c, 分别代表“自由派”、“保守派”和“中间派”。这些派别的划分是由Mark Newman根据Amazon上对于图书观点以及评价情况的人工分析得到的。规模:105个节点,441条边
    【数据集】polbooks

    【出处】Mark Newman,http://www-personal.umich.edu/~mejn/, and V. Krebs website。


    1.3演员合作网络


    【简介】国内学者构建了一个2006年中国电影演员合作网络:该数据来自国内著名的网络电影社区——MTime网站,网络中每个节点代表一个演员,边代表两个演员共同出演过同一部电影,即存在合作关系。规模:网络共有587个节点1725条边。
    【数据集】暂无
    【出处】赫南, 淦文燕, 李德毅. 一个小型演员合作网的拓扑性质分析[J]. 复杂系统与复杂性科学. 2006, vol.3(4):1-10.
    淦文燕,数据场方法及其在网络化数据挖掘中的应用研究,清华大学博士后研究报告,2007年6月

    1.4高能物理学理论文献引文网络


    【简介】高能物理学理论文献引文网络这是规模较大的、同时也是非常有名的合作网络实证载体,不少有影响力的文献里面曾经对它进行过研究。KDD CUP2003竞赛的数据源之一。其数据来源于arXiv.org,涵盖的论文入库(arXiv数据库)时间从1993年1月到2003年4月. 网络边的构建方式是:如果一篇论文i引用了另一篇论文j,在两者之间加上一条从i指向j的有向边。(如果被一篇数据库之外的论文引用或者引用了一篇数据库之外的文献,不做任何处理)。附件提供了300个节点规模的网络,这是按照时间排序,从1993年1月开始添加进arXiv数据库的最初的300篇高能物理理论文献。规模:网络共有29,555个节点,352,807条边。

    【数据集】HEPCitation 300
    【出处】KDDCUP2003


    1.5悲惨世界人物关系网络


    【简介】D. E. Knuth根据Victor Hugo(维克多.雨果)的小说Les Misèrables,《悲惨世界》,整理了其中的人物关系网络。网络中的节点表示小说中的角色,边表示两个角色同时出现在一幕或多幕中。网络中有六个主要人物,主人公Jean Valjean(冉阿让),探长Javert(贾维),神父Bishop Myriel(米里哀),女工Fantine(芳汀)及其女儿Cosette(珂赛特)。研究人际网络中关键的边(即人物之间的联系)对网络整体性能的影响,发现网络内关键的边,将对舆情和疾病等的传播具有非常重要的意义。规模:网络共有77个节点,508条边。
    【数据集】lesmis

    【出处】Knuth D E, The Stanford Graph Base: A Platform for Combinatorial Computing. Addison-Wesley, Reading, MA,1993


    1.6卓越亚马逊手机在线销售网络


    【简介】根据Amazon-joyo的手机在线销售数据整理而得,具体统计时间为2008年10月到2009年4月,后续的数据正在收集中。手机在线销售数据的节点为手机(由“品牌+型号+颜色”三个属性加以区别)。边由“查看此商品的顾客也查看了(下列商品)”的属性得到。取每天销售量前20名的手机进行统计。规模:每天小于20个,随着天数不断演变。
    【数据集】mobilephone
    【出处】张海粟,复杂网络研究常用载体集,http://www.sciencenet.cn/m/user_content.aspx?id=228595


    1.7美国大学足球俱乐部网络


    【简介】【数据集】【出处】


    1.8美国南部妇女活动网络


    【简介】美国南部“Old City”市18位妇女参加被当地报纸所报道的社会活动(诸如俱乐部集会、教会晚宴等)的数目。图中蓝色方块节点为事件,红色圆圈为妇女,这是一个二模图。规模:18个节点,边数根据二模向一模转化的结果而定。
    【数据集】暂无
    【出处】Davis, A. Gardner B. B. and Gardner, M. R. 1941, Deep South: A social anthropological study of caste and class. Chicago: University of Chicago Press.

    Martin Kilduff and Wenpin Tsai 著,王凤彬等译,社会网络与组织,中国人民大学出版社,2007.1.


    2.生物学网络


    2.1海豚家族关系网络


    【简介】D. Lusseau等人对栖息在新西兰Doubtful Sound峡湾的一个宽吻海豚群体(该群体由2个家族共62只宽吻海豚组成)进行长达7年的观察所构造出的海豚关系网。图中节点代表一个海豚,边表示两个海豚之间接触频繁,图不同颜色与形状的节点代表属于不同家族的海豚成员。规模:共有62个节点159条边
    【数据集】dolphins

    【出处】Lusseau D, Newman M E J. Identifying the role that animals play in their social networks, Proceedings of the Royal Society of London Series B-biological Sciences, 2004,271:477-481


    2.2新陈代谢网络


    [简介]
    [数据集]

    [出处]


    3.计算机网络


    3.1AS级网络


    [简介]
    [数据集]
    [出处]


    3.2mushups应用网络


    [简介]
    [数据集]
    [出处]

    3.3服务描述单词网络


    [简介]
    [数据集]

    [出处]


    4.人造技术网络


    附:网络上其他一些可用的网络数据:
    科学家合作网: 
    http://www-personal.umich.edu/~mejn/


    展开全文
  • 复杂网络概述

    千次阅读 2017-11-28 09:47:46
    复杂网络概述 1研究背景 通信网络、电力网络、生物网络、和社会网络等分别是通信科学、电力科学、生命科学、和社会学等不同学科的研究对象,而复杂网络理论所要研究的则是各种看上去互不相同的复杂网络之间的共性...
  • 复杂网络研究及其前沿概述

    千次阅读 2019-02-22 21:25:26
    复杂网络研究及其前沿概述1 引言2 复杂网络研究史2.1 七桥问题2.2 随机图理论2.3 小世界网络、无标度网络3 复杂网络的研究特点3.1 网络规模大3.2 网络结构具有复杂性和多元性3.3 网络具有时空复杂性3.4 复杂网络存在...
  • 复杂网络概括

    千次阅读 2014-09-11 17:20:18
    通信网络、电力网络、生物网络、和社会网络等分别是通信科学、电力科学、生命科学、和社会学等不同学科的研究对象,而复杂网络理论所要研究的则是各种看上去互不相同的复杂网络之间的共性和处理它们的普适方法。...
  • 复杂系统与复杂网络

    千次阅读 2009-11-02 17:57:00
    复杂系统与复杂网络 20世纪90年代以来,以Internet为代表的信息技术的迅猛发展使人类社会大步迈入了网络时代。从Internet到WWW,从大型电力网络到全球交通网络,从大脑神经网络到各种新陈代谢网络,从科研合作网络到...
  • 复杂网络和社会网络

    万次阅读 2015-01-31 23:22:03
    很好的入门介绍 关于复杂网络(complex network)和社会网络(social network)。 第一次从学术意义上接触这两个词儿还是...已经记不得是谁的presentation里面有一幅很经典的复杂网络的图了(当时学到的东西太多
  • 咳咳,复杂网络建模project,哈工大深圳课程的项目作业。
  • 复杂网络入门读物

    千次阅读 2015-11-22 10:09:18
    综合类专著中目前最全面的当属Newman的《网络引论》[1],最简洁的则是Dorogovtsev的《复杂网络讲义》[2]。2006年普林斯顿大学出过一本三巨头的专著,名字也很大气,叫做《网络结构与动力学》[3],但是不要有太高期望...
  • 一文读懂复杂网络(应用、模型和研究历史)

    万次阅读 多人点赞 2018-05-02 09:40:05
    摘要:随着近几年关于复杂网络(Complex network)理论及其应用研究的不断深入,已有大量关于复杂网络的文章发表在Science,Nature,RL,NAS等国际一流的刊物上,侧面反映了复杂网络已经成为物理界的一个新兴的研究...
  • 前言 igraph的安装还是有点麻烦,折腾了整整一天,才装好出图了。 只是装好igraph,没有cairo是出不来图的。 ...igraph是免费的复杂网络(graphs)处理包,可以处理百万级节点的网络(取决于...复杂网络处理算法...
  • 本文是11月17日大数据杂谈群分享的内容。...大家好,我来自天云大数据公司,我叫马敬涛,主要从事数据科学应用方面的工作。今天我给大家分享的主题是...复杂网络概念及价值在开始之前,我先澄清一个概念,那就是“复杂网络
  • 复杂网络研究常用载体集

    千次阅读 2013-10-21 10:24:14
    复杂网络的研究常常是和实际的复杂系统紧密结合的。从小世界和无尺度现象的发现开始,人们就逐渐认识到,包括社会网络中人与人之间的交际网络和Internet, web等大量现实网络在内的系统中隐含了大量的秘密等待人们去...
  • 对于复杂网络解决现实的网络问题

    千次阅读 2018-11-26 22:02:20
    关于复杂网络的应用与发展 复杂网络(Complex networks) 在以往,我们认为网络是通过随机的方式形成的,并且将这些网络成为随机网络,例如在一次马拉松比赛里,参赛人员之间从互相不认识到相互认识,这就是一个随机...
  • 复杂网络上的传播动力学

    千次阅读 2017-01-15 22:36:51
    复杂网络复杂网络是指具有复杂阔普结构和动力学行为的大规模网络,它是由大量的节点通过边的相互连接而构成的图。 经典传播模型: SIR模型、SIS模型 其中,S指Susceptible,易感者;I指Infective,感染者;R...
  • 复杂网络数据网站+程序代码网站

    千次阅读 2016-04-25 20:32:26
    复杂网络测试数据集
  • NetworkX是一款Python的开源软件包,用于创造、操作复杂网络,内置了常用的图与复杂网络分析算法,可以方便的进行复杂网络数据分析、仿真建模等工作。功能丰富、简单易用。一、安装pip install networkx二、数据构造...
  • 复杂网络模型总结

    千次阅读 2020-10-27 16:09:31
    非均匀网络(如BA无标度网络) 度数分布极度不均匀 关联性分类 无关联网络:任何一个节点的度与它的邻居节点的度是相互独立的 关联网络:节点的度与它的邻居节点的度不是相互独立的 一些基础 WS、NW小世界模型...
  • 文章目录小世界网络复杂网络的特性平均路径长度L聚集系数C度及度分布小世界效应规则网络随机网络小世界网络无标度网络python 代码生成小世界网络规则网络 小世界网络 [百度百科]:小世界网络模型是一类具有较短的...
  • 复杂网络环境模拟工具软件

    千次阅读 2016-03-01 22:32:58
    复杂网络环境模拟工具软件
  • 复杂网络分析以及networkx学习

    万次阅读 2017-05-06 11:51:46
    原文地址:陈关荣老师整理的复杂网络的资源作者:zhengw789 http://www.ee.cityu.edu.hk/~gchen/ComplexNetworks.htm http://mrvar.fdv.uni-lj.si/sola/info4/programe.htm 原文地址:NetworkX的...
  • Network Analysis]复杂网络分析总结

    万次阅读 2015-12-23 17:05:43
    ...1. 复杂网络的特点2.... 在我们的现实生活中,许多复杂系统都可以建模成一种复杂网络进行分析,比如常见的电力网络、航空网络、交通网络、计算机网络以及社交网络等等。复杂网络不仅是一种
  • 复杂网络MATLAB工具箱

    万次阅读 多人点赞 2016-12-30 14:37:01
    Node Degree Distribution:度分布(度分布是复杂网络的最重要的一个需要分析的属性) h1 = figure; % incoming: 入度 [y x] = hist(Degrees(:,2),unique(Degrees(:,2))); loglog(x,y/sum(y),'*r...
  • 复杂网络软件

    千次阅读 2013-11-04 10:14:27
    As so far, 最广为人知+被使用最多的网络分析软件 可以免费使用60天。 数据格式:矩阵形式 一个数据集通常包含两个文档:1、实际的数据;2、数据的相关信息。 数据集: 1)可以直接导入 2)可以在UCINET编辑 3)...
  • 模块度Q——复杂网络社区划分评价标准

    万次阅读 多人点赞 2016-07-27 18:35:25
    复杂网络进行社区划分,需要有一些评价指标,来评判算法对网络划分结果的好坏优劣。如果我们预先知道网络的真实划分结果,那么我们可以用NMI(归一化互信息)去衡量算法划分结果和真实结果的重合程度,这个会在...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 598,376
精华内容 239,350
关键字:

复杂网络包括