精华内容
下载资源
问答
  • 好不容易从国外网站找到的复杂网络的matlab源程序,供致力于复杂网络仿真研究的同仁参考!!由于获取不久,如有应用心得,记得分享哦!!
  • 复杂性思维第二版 一、复杂性科学

    万次阅读 2017-10-27 21:44:26
    一、复杂性科学 原文:Chapter 1 Complexity Science 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译 这本书的论点是,复杂性科学是一种“新型科学”,我借鉴自 Stephen Wolfram。2002年,Wolfram ...

    一、复杂性科学

    原文:Chapter 1 Complexity Science

    译者:飞龙

    协议:CC BY-NC-SA 4.0

    自豪地采用谷歌翻译

    这本书的论点是,复杂性科学是一种“新型科学”,我借鉴自 Stephen Wolfram。

    2002年,Wolfram 发表了 “新科学”一文,在这里介绍了他和其他人在细胞自动机上的工作,并描述了一种用于计算系统研究的科学方法。在之后的章节中,我们会回顾 Wolfram,但是现在我打算将他的标题用于更广泛的东西。

    我认为复杂性是新的,不是因为它将科学工具应用到一个新的主题,而是因为它使用不同的工具,允许不同种类的工作,并最终改变了我们认为是“科学”的东西。

    为了证明差异,我将从经典科学的一个例子开始:假设有人问你为什么行星轨道是椭圆形的。你可以引用万有引力的牛顿定律,并用它来写出描述行星运动的微分方程。然后,你可以求解微分方程,并展示出解是椭圆。证明完毕!

    大多数人发现这种解释令人满意。它包括一个数学推导 - 所以它有一些严格的证明 - 它解释了具体的观察,椭圆轨道,通过诉诸一般的原则,引力。

    让我用另一种解释来对比一下。假设你搬到像底特律这样种族隔离的城市,你想知道为什么这样。如果你做一些研究,你可能会发现 Thomas Schelling 的一篇文章,称为“分离动态模型”,它提出了一个简单的种族隔离模型:

    这里是我对这个模型的描述:

    • 城市的谢林模型是一个单元格数组,每个单元格代表一个房子。这些房子被两种“智能体”占据,标有红色和蓝色,数量大致相等。大约10%的房子是空的。

    • 在任何时间点,智能体可能会高兴或不高兴,这取决于附近的其他智能体。在模型的一个版本中,如果智能体至少有两个邻居像自己一样,则智能体很高兴,如果邻居是一个或者零个,则智能体不高兴。

    • 这个模拟通过随机选择一个智能体来运行,并检查它是否快乐。如果是的话,没有任何反应 如果不是,智能体随机选择一个未占用的单元格并移动。

    如果你从一个完全未分离的模拟城市开始,并在短时间内运行该模型,类似的智能体会聚集到一起。随着时间的流逝,这些社区会增长和合并,直到存在少量的大型社区,大多数智能体都生活在均匀的社区中。

    模型中的分离程度令人惊讶,这是真实城市的分离的解释。也许底特律是分离的,因为人们不喜欢人数太多,并且如果他们的社区的组成使他们不开心,将会搬走。

    这个解释与行星运动的解释是一样的吗?许多人会说不是,但为什么?

    最明显的是,谢林模型是非常抽象的,也就是说不现实的。我们很容易假设,人比行星更复杂,但是当你想想看,行星就像人一样复杂(特别是拥有人的行星)。

    这两个系统都很复杂,而且这两个模型都是基于简化的;例如,在行星运动的模型中,我们包含了地球与太阳之间的力,并忽略行星之间的相互作用。

    重要的区别是,对于行星运动,我们可以展示,我们忽略的力小于我们包含的力,来捍卫我们的模型。并且我们可以扩展模型,来包含其他相互作用,并显示这种效果很小。对于谢林模型,它难以合理简化。

    更糟糕的是,谢林模型不符合任何物理规律,它只使用简单的计算,而不是数学推导。谢林模型不像经典科学,许多人发现它们不那么引人注目,至少一开始是这样。但是,我将尝试演示,这些模型做了大量的实用工作,包括预测,解释和设计。本书的目标之一是解释如何这样做。

    1.1 范式转变

    当我向人们介绍这本书时,别人经常问我,这种新型科学是不是一种范式转变。我不这么认为,并且这里是解释。

    Thomas Kuhn 在 1962 年的“科学革命结构 ”中介绍了“范式转变”一词。它是指科学史上的一个过程,其中一个领域的基本假设改变,或者一个理论被另一个理论取代。他列举了哥白尼革命,燃烧的氧气模型取代了燃素说,以及相对论的出现。

    复杂性科学的发展不是取代旧的模型,而是(在我看来)标准模型的逐渐转变,它们是各种种类的可接受的模型。

    例如,经典模型倾向于以定律为基础,以方程式的形式表示,并通过数学推导求解。复杂性不足的模型通常是基于规则的,表示为计算,而不是由分析来模拟。

    不是每个人都认为这些模型令人满意。例如,在 Sync 中,Steven Strogatz 写道了他的萤火虫自发同步模型。他展示了一个演示该现象的仿真,但是写道:

    对于其它随机的初始条件和其他数量的振荡器,我重复模拟了几十次。每次都会同步 […] 现在的挑战是证明它。只有可靠的证明才能演示,同步是不可避免的,这种方式计算机都做不到;最好的证明就是澄清为什么它是不可避免的。

    Strogatz 是一位数学家,所以他对证明的热情是可以理解的,但他的证明并不能解决这个现象中最有趣的部分。为了证明“同步是不可避免的”,Strogatz 做了几个简化的假设,特别是每个萤火虫可以看到所有其他的萤火虫。

    在我看来,解释整个萤火虫族群为何可以同步,尽管事实上他们不能看到彼此,是更有趣的事情。这种全局行为,如何从局部交互中产生,是第(?)章的主题。这些现象的解释通常使用基于智能体的模型,它探索(以难以或不可能使用数学分析或的方式)允许或阻止同步的条件。

    我是一名计算机科学家,所以我对计算模型的热情可能并不奇怪。我不是说 Strogatz 是错误的,而是人们对于提出什么问题,和用什么工具来回答他们,有不同的看法。这些意见基于价值判断,所以没有理由能够达成一致。

    然而,科学家们对于哪些模型是好的科学,其他哪些是边缘科学,伪科学,或者是非科学,已经有了很大的共识。

    我声称,这是本书的核心论点,即这种共识是基于时间变化的标准,复杂性科学的出现反映了这些标准的逐渐转变。

    1.2 科学模型的轴线

    我将经典模型描述为基于物理定律,以方程式表示,并通过数学分析求解的模型;相反,复杂系统的模型通常基于简单的规则并以计算实现。

    我们可以将这一趋势看作是沿着两个轴线的转变:

    基于方程式 → 基于 模拟

    分析 → 计算

    这种新的科学方式在其他几个方面是不同的。我在这里介绍他们,所以你知道即将会发生什么,但是在你看到本书后面的例子之前,有一些可能没有任何意义。

    连续 → 离散

    经典模型倾向于基于连续数学,如微积分;复杂系统的模型通常基于离散数学,包括图和细胞自动机。

    线性 → 非线性

    经典模型通常是线性的,或者使用非线性系统的线性近似; 复杂性科学对非线性模型更为友好。一个例子是混沌理论。

    混沌理论在这本书中没有涉及,但是你可以在 http://en.wikipedia.org/wiki/Chaos 上阅读它。

    确定性 → 随机

    经典模型通常是确定性的,这可能反映了底层哲学的确定性,它在第(?)章中讨论。复杂模型往往具有随机性。

    抽象 → 具体

    在经典模型中,行星是质点,飞机是无摩擦的,牛是球形的(见 http://en.wikipedia.org/wiki/Spherical_cow)。像这样的简化通常对于分析是必要的,但是计算模型可能更加现实。

    译者注:真空中的球形鸡

    一,二 → 很多

    在天体力学中,两体问题可以通过分析求解;而三体问题不能。经典模型通常限于少量相互作用的元素,复杂性科学作用于较大的复合体(这是名称的来源)。

    单一 → 复合

    在经典模型中,元素往往是可互换的;复杂模型更经常包含异质性。

    这些是概括性的,所以我们不应该过于认真地对待它们。而我并不意味着弃用经典科学。更复杂的模型不一定更好;实际上通常更糟。

    此外,我并不是说这些变化是突然的或完全的。相反,它们向着被认为是可接受的,值得尊重的工作的前沿逐渐迁移。过去被怀疑的工具现在很普遍,一些被广泛接受的模型现在受到审查。

    例如,当 Appel 和 Haken 在 1976 年证明了四色定理时,他们使用电脑列举了 1,936 个特殊情况,在某种意义上说,这些特例是其证明的前提。当时很多数学家没有把这个定理当成真正的证明。现在计算机辅助证明是常见的,一般(但并非普遍)是可接受的。

    相反,大量的经济分析基于人类行为的模型,称为“经济人”,或者一个有逼格的词:“Homo economicus”。基于这种模型的研究数十年间受到高度重视,特别是如果涉及到数学技巧的话。最近,这种模型受到怀疑,而包含不完整信息和有限理性的模型是热门话题。

    1.3 一种新的的模型

    复杂模型通常适用于不同的目的和解释:

    预测 → 解释

    谢林的分离模型可能揭示了一个复杂的社会现象,但对预测没有用。另一方面,一个简单的天体力学模型可以预测日食,在未来几年内可以精确到秒。

    现实主义 → 工具主义

    经典模型依赖于现实主义的解释;例如,大多数人接受电子是存在的真实事物。工具主义一种观点,即使他们假设的实体不存在,模型也可以有用。乔治·皮特写道:“所有模型都是错误的,但有些是有用的。”它可能是工具主义的座右铭。

    简化论 → 整体论

    简化论是一种观点,通过理解其组件来解释系统的行为。例如,元素的周期表是简化论的胜利,因为它用原子中的简单电子模型来解释元素的化学行为。整体论认为,系统层面出现的一些现象不存在于组件层面,不能在组件层面上解释。

    我们在第(?)章会回到解释模型,第(?)章会回到工具主义,第(?)章会回到整体论。

    1.4 一种新的工程

    我一直在科学背景下谈论复杂系统,但复杂性也是工程中的变化和社会系统的组织的一个原因和影响:

    中心化(集权) → 去中心化(放权)

    中心化系统在概念上简单并易于分析,但去中心化系统可能更加强大。例如,万维网中的客户端向中心化服务器发送请求;如果服务器关闭,则这个服务不可用。在对等网络中,每个节点都是客户端和服务器。要取消服务,你必须删除每个 节点。

    隔离 → 互动

    在经典工程中,大型系统的复杂性通过隔离组件和最小化相互作用进行管理。这仍然是一个重要的工程原理;然而,廉价计算能力的普及,使得组件之间复杂交互的系统的设计变得越来越可行。

    一对多 → 多对多

    在许多通信系统中,广播服务正在由一些服务扩展,有时是替换。这些服务允许用户彼此通信,并创建,共享和修改内容。

    自上而下 → 自下而上

    在社会,政治和经济系统方面,许多通常是集中组织的活动现在都是草根运动。即使是分层结构的典范,军队,指挥和控制的也开始下放。

    分析 → 计算

    在经典工程中,可行的设计空间受到我们分析能力的限制。例如,设计艾菲尔铁塔成为了可能,因为 Gustave Eiffel 开发了新颖的分析技术,特别是用于处理风压负载。现在,用于计算机辅助设计和分析的工具,可以构建几乎可以想象的任何东西。弗兰克·盖里(Frank Gehry)的毕尔包古根汉美术馆(Guggenheim Museum Bilbao)是我最喜欢的例子。

    设计 → 搜索

    工程有时被描述为,在可行的设计空间中寻找解决方案。越来越多的搜索过程可以自动化。例如,遗传算法在大型设计空间中探索,并发现人类工程师不会想像(或喜欢)的解决方案。最终的遗传算法,演变,不可避免地生成违反人类工程规则的设计。

    1.5 一种新的思维

    我们现在正在深入一个领域,但是我所假设的,科学建模中的标准转变,有关 20 世纪中逻辑和认识论的发展。

    亚里士多德逻辑 → 多值逻辑

    在传统逻辑中,任何命题都是真或假。这个系统适用于类似数学的证明,但对于许多现实世界的应用而言是失败的(以一种戏剧化的方式)。替代方案包括多值逻辑,模糊逻辑和其他旨在处理不确定性(indeterminacy),模糊性和不确定性(uncertainty)的系统。Bart Kosko 在《模糊思维》(Fuzzy Thinking)中讨论了一些这种系统。

    频率论的概率 → 贝叶斯主义

    贝叶斯概率已经存在了几个世纪,但直到最近才被广泛使用,这是由于廉价计算能力变得可用,以及概率性声明中勉强接受了主观性。莎朗·贝尔奇·麦格雷恩(Sharon Bertsch McGrayne)在《不会死亡的理论》(The Theory That Would Not Die)中介绍了这一历史。

    客观 → 主观

    启蒙运动和现代主义哲学,建立在对客观真理的信仰上。也就是说,独立于持有他们的人的真理。20 世纪的发展,包括量子力学,哥德尔不完备定理和库恩的科学史研究,都引起了人们对“看似不可避免的主观性”的关注,甚至在“自然科学”和数学中。丽贝卡·戈德斯坦(Rebecca Goldstein)介绍了Gödel对不完备性的证明的历史背景。

    物理定律 → 理论 → 模型

    有些人区分了定律,理论和模型,但我认为这是一回事。使用“定律”的人很有可能认为,它在客观上是真实的,不可改变的;使用“理论”的人承认它可以修改;而“模型”承认它是基于简化和近似的。

    一些被称为“物理定律”的概念是真正的定义;实际上,其他的只是模型的断言,它很好预测或解释了系统的行为。我们在第(?)章中会回到屋里定律的本质。

    确定性 → 不确定性

    确定性是一个观点,所有事件都是由之前事件导致,不可避免。不确定性的形式包括随机性,概率因果和基本不确定性。我们在第(?)章再回到这个主题。

    这些趋势并不普遍或完整,但核心观点正沿着这些轴线转变。作为证据,考虑对托马斯·库恩(Thomas Kuhn)的《科学革命的结构》(The Structure of Scientific Revolutions)的反应 ,公布后受到谴责,现在被认为几乎毫无争议。

    这些趋势是复杂性科学的因和果。例如,高度抽象的模型现在更容易接受,因为人们预期,每个系统都应该有一个独特的,正确的模型。相反,复杂系统的发展挑战了确定性,和物理定律的相关概念。

    本章概述了本书中出现的主题,但在看到示例之前,并不是全部都是有意义的。当你读到本书的最后,你可能会发现,再次阅读本章会有帮助。

    展开全文
  • 复杂网络笔记

    千次阅读 2020-07-03 09:38:47
    空间上网络 很容易形成高聚集性 存在距离上三角不等式 两边之和大于 第三边 你两个邻居跟你靠近 他们彼此之间也会靠近 (因为上述) 但是并不短 现实是无标度世界。攻击那些度大的点,会有特别大的攻击性。 弱连接就...

    空间上网络 很容易形成高聚集性

    存在距离上三角不等式 两边之和大于 第三边

    你两个邻居跟你靠近 他们彼此之间也会靠近 (因为上述)

    但是并不短

    现实是无标度世界。攻击那些度大的点,会有特别大的攻击性。

    弱连接就有强关系
    √ 找工作要找那些有过一面之缘 weak tie 因为这种人恰恰可能是桥节点;
    √ 如果去找爸妈 亲密朋友 很难从小集团走出去

    网络上的动力学

    传染疾病模型
    (1)SIR模型
    Infected 感染
    Suspectible 疑似
    Resistant 恢复并且免疫

    (2)SEIR模型
    S(Susceptible)易感染状态
    E(Exposed ) 潜伏期状态
    I(Infected) 感染状态
    R(Removed) 免疫状态

    所有个体都处于易感染状态,当与感染个体接触后会变为潜伏状态,随后又将处于感染状态,个体最终将会产生免疫力,从而不再传染或被传染。

    图结构:尺寸很大,把图转化成向量,给每个节点赋予一个vector ,这样一下子网络数据变的很规整,然后用神经网络等等。
    Graph network
    脸书上的推荐其实就是关系预测一种很重要的应用
    社区检测很重要

    Graph learning lifecycle
    图数据
    节点特征
    学习算法
    最终模型

    特征学习 :将图结构和节点属性映射到一个低维空间

    拆开来 拼回去 怎么损失最小 ?

    网络的拓扑性质: 不依赖节点的具体位置、边的具体形态 就可以表现出来的性质

    网络拓扑结构发展结构:
    最初100年: 认为是规则网络
    19世纪50年代末: 认为是随机网络
    2005年左右: 真实网络具有与前两者都不同的统计特征的网络,叫复杂网络

    用矩阵描述网络

    描述一个网络:最简便就是用矩阵

    (1)无权无向网络在这里插入图片描述

    1号 跟2、4有连接,记作1;其余记作0
    2号 跟1/3/4/5均有连接,记作1;其余记作0
    3号只跟2有链接,第二个位置记作1
    ···
    ···

    (2)无权有向网络在这里插入图片描述

    1号对别的没有,故全为0
    2号指向1/3/4,记作1
    3号没有指向别人,全0
    4号指向1/2/5,记作1
    5号指向2,记作1

    (3)加权网络

    在这里插入图片描述
    3号指向自己,权重为1,
    2号指向4号,权重为5
    4号指向2号,权重为4
    两个不同指的方向,权重不同。。

    复杂网络研究的基本问题: 复杂网络拓扑结构的不确定性

    复杂网络的特性:

    (1) 度

    在一个无向型的网络中一个节点i的度Ki就是和节点i相连的边的数目
    在这里插入图片描述在这里插入图片描述

    (2) 平均路径长度

    描述了节点间的分离程度,即网络有多小。
    两节点间的距离:连接两者最短路径的边的数目【从a到b最短中间经过个c,则节点间距离为2,因为有两条边】
    网络直径:任意两点间的最大距离
    平均路径长度:所有节点间距离的平均值
    在这里插入图片描述

    在这里插入图片描述
    N(N-1)=Cn2 选任意两点,是可能的距离,在这里求一个归一化。所以除以它
    人们研究复杂网络发现:绝大多数大规模真实网络的平均路径长度比想象的小得多, 称之为 “小世界效应”

    (3) 聚类系数

    侧重描述节点的近邻之间的关系
    我有10个朋友,但是谁都不认识谁,那么我的集聚系数为0
    我有10个朋友,他们几乎都认识,那么我的集聚系数就接近于1

    计算方法:
    假如节点a 有k条边与其他节点连接,那么这k个节点之间互相连接最多可能有k(k-1)/2条边。
    节点a的聚类系数Ca=这k个节点实际形成的边/ 最多可能的边数k(k-1)/2
    整个网络的聚类系数C=所有节点的聚类系数的平均值

    小世界网络

    小世界网络:近年来研究发现,很多实际的复杂网络既不完全规则也不完全随机,而是介于完全规则和完全随机这两个极端之间,
    既具有类似规则网络的较大集聚系数,又具有类似于随机网络的较小平均路径长度

    小世界网络经典例子:人际关系网络中的“六度分离”
    【社会心理学家斯坦利·米尔格拉姆做了一个实验:他要求300 多人发信把他的一封信寄到某市一个“ 目标” 人。于是形成了发信人的链条, 链上的每个成员都力图把这封信寄给他们的朋友、家庭成员、商业同事或偶然认识的人, 以便尽快到达目标人。实验结果是, 一共60 个链条最终到达目标人, 链条中平均步骤大约为6 。人们把这个结果说成“ 六度分离” 】

    小世界:大多网络尽管规模很大,但是任意俩节点间都有一条很短的路径
    集聚度:网络有内聚倾向
    幂律分布:对一件事情起决定作用的,往往是少数几个因素,而其它大部分的因素都无关紧要。
    在这里插入图片描述
    小世界网络模型【small world network / SWN】 【watts和strogatz 于1998提出】
    Watts定义了小世界网络的三个特性
    #1# 连接各个节点之间最短的路径长度, 这是整个网络中所有节点对路径长度的平均值。
    #2# 集聚程度, 它代表了两个节点之间通过各自的相邻节点连接在一起的可能性, 当然它们之间可能直接连接, 即网络的集聚度。
    高度结构化的网络有长路径和大的聚合度,
    随机网络则有短路径长度和很小的集聚度。
    小世界网络有与随机网络相近的路径长度, 但却拥有高聚合度。
    在这里插入图片描述
    #3# 对数路径, 所以对任何规模的网络都会随着网络图形变得越来越巨大而网络却保持相对短的路径长度

    完全图 就是 两两之间都有相关。 没有实际意义。

    展开全文
  • 复杂网络分析总结

    万次阅读 多人点赞 2018-04-08 15:31:40
    复杂网络的特点2. 社区检测3. 结构平衡4. 影响最大化5. 网络传播6. 补充7. 参考文献 在我们的现实生活中,许多复杂系统都可以建模成一种复杂网络进行分析,比如常见的电力网络、航空网络、交通网络、计算机网络...
    
    

      在我们的现实生活中,许多复杂系统都可以建模成一种复杂网络进行分析,比如常见的电力网络、航空网络、交通网络、计算机网络以及社交网络等等。复杂网络不仅是一种数据的表现形式,它同样也是一种科学研究的手段。复杂网络方面的研究目前受到了广泛的关注和研究,尤其是随着各种在线社交平台的蓬勃发展,各领域对于在线社交网络的研究也越来越火。研究生期间,本人的研究方向也是一直与复杂网络打交道,现在马上就要毕业了,写一篇博文简单介绍一下复杂网络特点以及一些有关复杂网络研究内容的介绍,希望感兴趣的博友可以一起讨论,一起学习。

      下图分别是一个航空网络(上图)和Facebook网络全球友谊图(下图)。


    1. 复杂网络的特点

      钱学森对于复杂网络给出了一种严格的定义:具有自组织、自相似、吸引子、小世界、无标度中部分或全部性质的网络称之为复杂网络。言外之意,复杂网络就是指一种呈现高度复杂性的网络,其特点主要具体体现在如下几个方面:

      1.1 小世界特性

      小世界特性(Small world theory)又被称之为是六度空间理论或者是六度分割理论(Six degrees of separation)。小世界特性指出:社交网络中的任何一个成员和任何一个陌生人之间所间隔的人不会超过六个,如下图所示:

      在考虑网络特征的时候,通常使用两个特征来衡量网络:
      特征路径长度(characteristic path length):在网络中,任选两个节点,连通这两个节点的最少边数,定义为这两个节点的路径长度,网络中所有节点对的路径长度的平均值,定义为网络的特征路径长度。这是网络的全局特征。
      聚合系数(clustering coefficient):假设某个节点有kk条边,则这kk条边连接的节点(kk个)之间最多可能存在的边的条数为k(k1)/2k(k−1)/2,用实际存在的边数除以最多可能存在的边数得到的分数值,定义为这个节点的聚合系数。所有节点的聚合系数的均值定义为网络的聚合系数。聚合系数是网络的局部特征,反映了相邻两个人之间朋友圈子的重合度,即该节点的朋友之间也是朋友的程度。
      对于规则网络,任意两个点(个体)之间的特征路径长度长(通过多少个体联系在一起),但聚合系数高(你是朋友的朋友的朋友的几率高)。对于随机网络,任意两个点之间的特征路径长度短,但聚合系数低。而小世界网络,点之间特征路径长度小,接近随机网络,而聚合系数依旧相当高,接近规则网络。
      复杂网络的小世界特性跟网络中的信息传播有着密切的联系。实际的社会、生态、等网络都是小世界网络,在这样的系统里,信息传递速度快,并且少量改变几个连接,就可以剧烈地改变网络的性能,如对已存在的网络进行调整,如蜂窝电话网,改动很少几条线路,就可以显著提高性能。

      1.2 无标度特性

      现实世界的网络大部分都不是随机网络,少数的节点往往拥有大量的连接,而大部分节点却很少,节点的度数分布符合幂率分布,而这就被称为是网络的无标度特性(Scale-free)。将度分布符合幂律分布的复杂网络称为无标度网络。

      下图为一个具有10万个节点的BA无标度网络的度数分布示意图:

      无标度特性反映了复杂网络具有严重的异质性,其各节点之间的连接状况(度数)具有严重的不均匀分布性:网络中少数称之为Hub点的节点拥有极其多的连接,而大多数节点只有很少量的连接。少数Hub点对无标度网络的运行起着主导的作用。从广义上说,无标度网络的无标度性是描述大量复杂系统整体上严重不均匀分布的一种内在性质。

      其实复杂网络的无标度特性与网络的鲁棒性分析具有密切的关系。无标度网络中幂律分布特性的存在极大地提高了高度数节点存在的可能性,因此,无标度网络同时显现出针对随机故障的鲁棒性和针对蓄意攻击的脆弱性。这种鲁棒且脆弱性对网络容错和抗攻击能力有很大影响。研究表明,无标度网络具有很强的容错性,但是对基于节点度值的选择性攻击而言,其抗攻击能力相当差,高度数节点的存在极大地削弱了网络的鲁棒性,一个恶意攻击者只需选择攻击网络很少的一部分高度数节点,就能使网络迅速瘫痪。

      1.3 社区结构特性

      人以类聚,物以群分。复杂网络中的节点往往也呈现出集群特性。例如,社会网络中总是存在熟人圈或朋友圈,其中每个成员都认识其他成员。集群程度的意义是网络集团化的程度;这是一种网络的内聚倾向。连通集团概念反映的是一个大网络中各集聚的小网络分布和相互联系的状况。例如,它可以反映这个朋友圈与另一个朋友圈的相互关系。

      下图为网络聚集现象的一种描述:


    2. 社区检测

      社区检测(community detection)又被称为是社区发现,它是用来揭示网络聚集行为的一种技术。社区检测实际就是一种网络聚类的方法,这里的“社区”在文献中并没有一种严格的定义,我们可以将其理解为一类具有相同特性的节点的集合。近年来,社区检测得到了快速的发展,这主要是由于复杂网络领域中的大牛Newman提出了一种模块度(modularity)的概念,从而使得网络社区划分的优劣可以有一个明确的评价指标来衡量。一个网络不通情况下的社区划分对应不同的模块度,模块度越大,对应的社区划分也就越合理;如果模块度越小,则对应的网络社区划分也就越模糊。

      下图描述了网络中的社区结构:

      Newman提出的模块度计算公式如下:



    其中mm为网络中总的边数,A是网络对应的邻接矩阵,Aij=1Aij=1代表节点ii和节点jj之间存在连边,否则不存在连边。kiki为节点ii的度数,CiCi为节点ii属于某个社区的标号,而δ(Ci,Cj)=1δ(Ci,Cj)=1当且仅当Ci=CjCi=Cj

      上述的模块度定义其实很好理解,我们可以根据一个网络的空模型去进行理解。网络的空模型可以理解为只有节点的而没有连边,这时候一个节点可以和图中的任意其他节点相连,并且节点iijj相连的概率可以通过计算得到。随机选择一个节点与节点ii相连的概率为kj/2mkj/2m,随机选择一个节点与节点jj相连的概率为kj/2mkj/2m,那么节点ii和节点jj相连的概率为pipj=kikj/(4m2)pipj=kikj/(4m2),边数的期望值Pij=2mpipj=kikj/(2m)Pij=2mpipj=kikj/(2m)所以模块度其实就是指一个网络在某种社区划分下与随机网络的差异,因为随机网络并不具有社区结构,对应的差异越大说明该社区划分越好。

      Newman提出的模块度具有两方面的意义:

      (1)模块度的提出成为了社区检测评价一种常用指标,它是度量网络社区划分优劣的量化指标;

      (2)模块度的提出极大地促进了各种优化算法应用于社区检测领域的发展。在模块度的基础之上,许多优化算法以模块度为优化的目标方程进行优化,从而使得目标函数达到最大时得到不错的社区划分结果。

      当然,模块度的概念不是绝对合理的,它也有弊端,比如分辨率限制问题等,后期国内学者在模块度的基础上提出了模块度密度的概念,可以很好的解决模块度的弊端,这里就不详细介绍了。

      常用的社区检测方法主要有如下几种:

      (1)基于图分割的方法,如Kernighan-Lin算法,谱平分法等;

      (2)基于层次聚类的方法,如GN算法、Newman快速算法等;

      (3)基于模块度优化的方法,如贪婪算法、模拟退火算法、Memetic算法、PSO算法、进化多目标优化算法等。


    3. 结构平衡

      结构平衡(Structural Balance)主要是针对社交网络的研究而被提出的,它最早源于社会心理学家Heider提出的一个结构平衡理论。

      3.1 网络平衡的发展

      网络平衡有时也称社会平衡(Social Balance),就网络平衡的发展来说,我们可以将其分为三个发展阶段。
      3.1.1 网络平衡理论的提出
      “网络平衡”一词最早是由Heider基于对社会心理学的研究而提出的,Heider在1946年的文章Attitudes and cognitive organization[1]中针对网络平衡的概念提出了最早的平衡理论:
      (1)朋友的朋友是朋友;
      (2)朋友的敌人是敌人;
      (3)敌人的朋友是敌人;
      (4)敌人的敌人是朋友。
      用常见的三元组合来表示上述的Heider理论如下:

      上述的平衡理论是有关网络平衡提出的最早的理论,它后来也被称为是强平衡理论。

      1956年,Cartwright和Harary对Heider的平衡理论进行了推广,并将其用在了图理论中(STRUCTURAL BALANCE: A GENERALIZATION OF HEIDER'S THEORY[2])。Cartwright和Harary指出对于一个符号网络而言,网络平衡的充要条件是网络中的所有三元组都是平衡的,该结论也可以陈述为一个符号网络平衡的充要条件是它所包含的所有回路(cycles)都是平衡的(“-”号的个数为整数个)。而且,在这篇文章中,他们还提出了著名的结构平衡理论:如果一个符号网络是平衡的,那么这个网络就可以分为两部分子网络,其中每个子网络内部中节点的连接都是正连接,网络之间的连接均为负连接。

      在这各阶段网络平衡的发展的重心主要在于构建网络平衡的心理学和社会学模型。

      3.1.2 网络平衡的数学模型

      在有了Heider等人的奠基工作后,有关网络平衡的发展主要是构建其数学模型,比如网络的动态表现,一个网络连接如何随时间的变化而变化,网络中节点之间的朋友或者敌人的关系如何演化等等。

      3.1.3 网络平衡的应用

      最新关于网络平衡方面的研究大都是研究一些在线网络,比如对某个网站用户属性的分析等等。而且,目前我们身处大数据时代,我们所要研究的网络规模也变为了大型甚至可以说是超大型网络,这这个背景下,如何计算一个网络是否平衡便成为该领域的主要热点问题。

      3.2 网络平衡的基本理论

      (1) Heider理论(强平衡理论SBT)。

      (2) 结构平衡理论(Structural Balance Theroem):在完全符号网络中,网络平衡的充要条件是其所有的三元组(回路)都平衡。

      结构平衡的推论:一个完全符号网络平衡的充要条件是它可以被分为两部分X和Y,X和Y内部的节点连接均为正连接,X和Y之间的连接均为负连接。

      (3) 弱平衡理论(A weaker form of structural balance,WSBT):如果完全符号网络中不存在这样的三元组:两个边为正,一边为负,则该网络称为是弱平衡网络。

      对于弱平衡理论而言,上图的三元组中,三边均为负连接的三元组也属于平衡三元组,也就是三元组的四种情况有三种属于平衡状态,一个属于不平衡状态(两边为正,一边为负)。

      弱平衡网络推论:如果一个网络为弱平衡理论,那么它可以分为多个部分,每部分内的连接为正,部分之间的连接为负。

      (4) 对任意网络平衡的定义.

      1) 对于一个任意网络而言,如果我们可以将它所缺失的边填充使它成为一个平衡的完全符号网络,那么原网络就是平衡网络;
      2) 对于一个任意网络而言,如果我们可以将它分为两部分,使得每个部分内的连接均为实线,部分之间的连接均为虚线。
      以上的两种定义是等价的。
      一个符号网络平衡的充要条件是它不包括含有奇数个负连接的回路。

      (5) 近似平衡网络(略)。

      3.3 网络平衡的计算(A spectral algorithm for computing social balance)
      命题1:节点i参与的三元组数目

      A为邻接矩阵,元素取值可能为:1,-1,0;
      G为邻接矩阵,元素取值可能为:0,1.
      命题2:对于节点i而言,bi为其参与的平衡三元组数目,ui为其参与的不平衡三元组数目,则

      理论1:对于完全符号图而言,

      平衡三元组所占的比例为

      理论2:对于任意符号网络,平衡三元组所占的比例为

      
      注:以上两个计算网络平衡的公式中,特征值可以随大到小选择前几个比较大的,就像PCA那样,这样可以使得计算的复杂度大大减小。


    4. 影响最大化

      随着各种在线社交平台的发展,社交平台(比如QQ、微博、朋友圈等)已经不仅仅是一种用户进行沟通的社交平台,它们更是社会信息产生和传播的一种主要的媒介。影响最大化(Influence Maximization)同结构平衡一样,也是针对社会网络的研究而被提出的,它来源于经济学的市场营销。2001年,影响最大化被Domins首次以一种算法问题的形式被提出。而影响最大化受到广泛的关注是在2003年Kempe等人在当年的KDD会议上发表的一篇有关影响最大化的论文之后,随后各种影响最大化算法被迅速提出,最近的十几年里,影响最大化的相关文章达到了上千篇,可见这个问题还是很值得关注的。

      影响最大化问题可以这样来描述:一个商家或者企业利用一种社交平台(比如为新浪微博)为自己的新产品或者新服务进行推广,如何在资金有限的情况下雇佣微博达人来做推广可以使得推广范围达到最大?

      我们再给出影响最大化的一般定义:

      给定一个网络GG和一个整数KK(一般小于50),如何在GG中找出KK个节点,使得这KK的节点组成的节点集合SS的影响传播范围σ(S)σ(S)达到最大。

      根据上述影响最大化的定义我们很容易可以知道,影响最大化本身属于一种组合优化问题。常用的影响最大化传播模型有独立级联传播模型(ICM)和线性阈值传播模型(LTM)。

      影响最大化方面的主要算法可以分为如下几类:

      (1)基于网络中心性的启发式方法:比如最大度方法、最短平均距离方法、PageRank方法等;

      (2)基于子模块性的贪婪方法:比如最经典的Greedy算法,CELF算法以及后来的NewGreedy和CELF++等;

      (3)基于社区结构的方法:比如CGA算法、CIM算法等;

      (4)基于目标函数优化的方法:比如模拟退火算法等。

    5. 网络传播

       网络传播领域涉及很多方面,比如网络节点重要性排序、网络鲁棒性分析、网络信息爆发阈值优化等。这些领域都很有意思,感兴趣的博友可以好好深入研究一下。

    6. 补充

      6.1 网络可视化工具

      首先在这里推荐两款我常用的网络可视化工具:Pajek (点击进入官方网站)、Gephi(点击进入官方网站)。

      下边为pajek可视化窗口下的一个网络拓扑结构图:

     

      这是Gephi的一个可视化效果:


      6.2 网络数据集

      常用的一些公开数据集整理:

      Pajek(可视化工具)数据集:http://vladowiki.fmf.uni-lj.si/doku.php?id=pajek:data:index;

      Newman(复杂网络科学领域大牛)个人数据集:http://www-personal.umich.edu/~mejn/netdata/

      Stanford大学大规模网络数据集:http://snap.stanford.edu/data/

      复旦大学网络数据集整理:http://gdm.fudan.edu.cn/GDMWiki/Wiki.jsp?page=Network%20DataSet

      KONECT数据集整理:http://konect.uni-koblenz.de/


    7. 参考文献

      [1] Grivan and Newman. Community structure in social and biological networks. PNAS, 2002.

      [2] Newman and Grivan. Finding and evaluating community structure in networks. PRE, 2004.

      [3] Newman. Networks: an introduction. 2010.

      [4] Cartwright and Harary. Structural balance: a generalization of Heider's theory. 1956.

      [5] Facchetti et al. Computing global structural balance in large-scale signed social networks. 2011.

      [6] Kempe et al. Maximizing the spread of influence through a social network. 2003.

      [7] Chen et al. Efficient influence maximization in social networks. 2009. 

      [8] 任晓龙,吕琳媛. 网络重要节点排序方法综述. 2014.


    出处:http://www.cnblogs.com/maybe2030/p/4665847.html#_labelTop


    展开全文
  • ERP并不复杂

    千次阅读 2012-07-18 15:44:33
    还有的是企业本身就职责不清晰、流程不清晰、自己到底是什么问题自己到底要解决什么问题都不清晰。还有的企业根本没有愿景没有目标没有战略,只是今年10亿销售额明年再增长20%,有啥问题就解决啥问题,就这样一年...
    ERP并不复杂。是人为搞复杂了。有的ERP设计是从顶层设计的,有的ERP是来自于现实客户业务的照猫画虎。企业有自己的所处内外环境所限,有自己组织人布局的历史包袱,所以就把问题弄复杂了。还有的是企业本身就职责不清晰、流程不清晰、对自己到底是什么问题自己到底要解决什么问题都不清晰。还有的企业根本没有愿景没有目标没有战略,只是今年10亿销售额明年再增长20%,有啥问题就解决啥问题,就这样一年过一年,还埋怨是中国企业受中国政府调控太大,所以只能看着政策风向走。更有的企业只是借机随风而起也随风停而降,逐水草而居,根本没打算风雨无阻的扎根经营。


    ERP并不复杂,ERP只是管理工具是手段,而核心是管理。而管理的核心是人和利益的布局,却把ERP当枪使了。ERP是透明化、过程管控化、量化,这给不少人失去了浑水摸鱼找理由的机会。ERP软件难实施,就是领导者难以对现状进行下手开刀,于是讨论开讨论去搞个谁也能接受的和稀泥方案,因而流程十分怪异,当然需要定制化,当然ERP不满足企业需求


    ERP并不复杂,也有可能是被官僚秒杀的。一群管理者不驻扎现场了解真实问题和问题根源,而是关在会议室里听二手报告做讨论做决策,搞分工搞流程搞考核,简单问题复杂化。于是弄出来个很怪异也不解决问题的业务处理方法,让ERP软件匹配实现。


    ERP被人为搞复杂,也和ERP厂商的人有关。1、一些人觉得技术挑战没有互联网应用这样人流量大数据量大安全要求高,甚至有不少人去追逐电子商务、移动应用、网游开发,所以不爱做传统软件,所以技术高手不多,没高素质高能力人才干个屁啊;2、中国高速发展、客户需求增多,于是进入大量新人,但企业培养人的能力没有跟上;3、ERP软件的本质是管理。但大部分从业者(产品设计\开发、一线咨询\培训\实施\服务)是执行层并非公司管理者,对公司管理没有理论体系基础,对公司管理也没有实践体会,这如何去让整天战斗在一线的客户管理层实践者信服呢?


    ERP并不复杂,是人为搞复杂了。现实企业业务处理是组织岗位业务流程协同联动,到了ERP就成了一个个的功能。这就是映射失真模式不匹配。


    ERP主干流程并不复杂,就是被多种处理方法业务开关、被日周月季年期初期末特殊业务处理、逆向悔改处理、人工突然要自由随意干预、集团层层管控数据权限问题、没有为审计预留接口、没有为过程管控预留接口,就被这些人为弄复杂了


    ERP并不复杂,是人为搞复杂了。工作流和业务处理的解耦、组织结构和业务处理的解耦、门户的集成、主数据的独立与数据规范、模块的解耦\模块的向下兼容、接口专门精心设计,这是架构级的关键。如果ERP厂商没有在起初建立这些基础,这就人为搞复杂了。


    ERP并不复杂,但是从理念到产品设计到产品开发到实施到培训到客户应用,层层衰减,钻石也变成砖头了。也有可能把问题从筷子传成大象腿。不少项目就是这样被叹息的。


    什么是企业级什么是部门级?什么是企业资源规划(计划)什么是业务处理软件?企业级是:1、从企业的愿景出发, 2、推导到近三年的战略方向, 3、再推导到今年的战略目标, 4、战略目标分解到行动方案,5、行动方案为了达成目标,整体审视整个企业的资源,联合达成。里面包含行动目标、要解决的问题、行动产物、行动组织、行动职责、行动各团队流程、如何考核和衡量行动成功。 6、行动方案分解到计划日程,专项项目制\项目经理管理、监控、报告。这样方为企业资源规划(计划)


    集团管控,不外乎主控住产品和运维服务;抓住子公司的战略、计划;抓住子公司的管理层人和考核;抓住子公司的财务预算、成本费用、销售额;抓住子公司的组织岗位职责流程\做事标准动作规范的制定、培训、督导。ERP的管理对象和范畴也不外乎如此


    各部门业务处理全息信息收集一查到底,就可以做到可知;事前目标识别\问题识别\方案制定\计划制定的把控、事中管控关键节点关键产物、事后审计,就可以做到可控;


    想做到可预测不容易,首先要有一套算法模型,然后日常业务处理就是构筑在这套算法模型之上的,日常积累的现实数据就形成经验值。给模型各个调节参数灌入目标值,再对比经验值,才能做到可预测。问题是:算法模型需要前提具备。这是大部分ERP厂商没有的
    展开全文
  • 复杂问题简单化以及简单问题复杂化并不矛盾,而是在项目的不同阶段。  在项目设计阶段,要考虑的是“简单问题复杂化”。说的通俗点,就是在给定需求的基础上尽量扩展,考虑更多的可能,做尽可能大的设计,来...
  • sql复杂嵌套查询

    万次阅读 2016-05-01 04:01:38
    最近在做各类小应用,用到了MYSQL,有时候会用到一些比较复杂的嵌套查询,在研究怎么通过SQL实现这些。 假设下面这张表(stu)描述学生的基本信息: id name grade 1 Jim 7 2 Tom 8 3 Cake 9 … … …...
  • Windows密码复杂性要求

    千次阅读 2019-11-08 19:44:19
    "密码必须满足复杂性要求" 策略设置确定密码是否必须满足一系列强密码重要的指南。 启用此策略设置需要密码才能满足以下要求: 在更改或创建密码时, 将强制执行复杂性要求。 Windows Server 密码复杂性要求中包含...
  • Mybatis的复杂属性,Mybatis的这个特点很少被提及,但是有些时候确实又有用。Mybatis的复杂属性指的什么呢? 有如下两个对象: 在User对象中有一个字段password,类型是EncryptedString,这
  • 软件系统的复杂

    千次阅读 2012-12-27 09:29:44
    软件系统的本质是复杂的,开发团队的任务就是制造出简单的假象。 软件的复杂性是其根本特征,原因在于: 问题域的复杂性:软件系统一般都是处理逻辑或业务规则比较复杂的问题。 管理开发过程的困难性:不存在...
  • 一文读懂复杂网络(应用、模型和研究历史)

    万次阅读 多人点赞 2018-05-02 09:40:05
    摘要:随着近几年关于复杂网络(Complex network)理论及其应用研究的不断深入,已有大量关于复杂网络的文章发表在Science,Nature,RL,NAS等国际一流的刊物上,侧面反映了复杂网络已经成为物理界的一个新兴的研究...
  • 复杂网络社区划分方法综述

    千次阅读 2018-01-30 20:04:17
    摘 要:复杂网络在现实网络表现为多种形式,本文将从2002年以来经典社区划分方法入手,对复杂网络社区划分的研究现状进行一个综合简单的描述和概括,试图为社区划分研究描绘出一个较为全面和清晰的轮廓,为该领域的...
  • MySQL查询语句之复杂查询_day04

    万次阅读 2017-06-29 21:57:56
    MySQL复杂查询 今天写的内容是在昨天的基础... BY 语句用于结合合计函数 (比如 SUM) ,根据一个或多个列结果集进行分组,合计函数常常需要添加 GROUP BY 语句。   下面的给了两张表 一张是emp,一张是dept,下面的查
  • 使用Gson解析复杂的json数据

    万次阅读 多人点赞 2014-06-25 18:48:53
    Gson解析复杂的json数据
  • 复杂网络和社会网络

    万次阅读 多人点赞 2015-01-31 23:22:03
    很好的入门介绍 关于复杂网络(complex network)和社会网络(social network)。 第一次从学术意义上接触这两个词儿还是...已经记不得是谁的presentation里面有一幅很经典的复杂网络的图了(当时学到的东西太多
  • CISC(复杂指令集)与RISC(精简指令集)的区别

    万次阅读 多人点赞 2018-08-20 09:36:56
    复杂指令集计算机(CISC) Complex Instruction SetComputer 长期来,计算机性能的提高往往是通过增加硬件的复杂性来获得.随着集成电路技术.特别是VLSI(超大规模集成电路)技术的迅速发展,为了软件编程方便和...
  • 号称最复杂简单几何题的扩展

    千次阅读 2017-11-08 16:36:13
    号称最复杂简单几何题的扩展源起​ 曾经有这么两道简单几何题让我困惑已久,虽然用暴力数值求解的方式很容易得出答案,可是出于一种古典几何推演的崇拜,不通过全等相似等方法得出答案的方式都是耍流氓。...
  • 复杂性话题之总结

    千次阅读 2006-10-14 14:29:00
    我想在开始其它话题之前,先对复杂性话题(包括SOAP和REST的比较)的讨论做一个总结。我仍然觉得拿一个XML示例作尝试会比较有趣,我希望不久可以去做。感谢所有发表评论参与讨论的朋友们。我期望进行讨论,我...
  • 其实近似熵就是时间序列下增加一个维度后熵的减少!!!...近似熵和样本熵都是非稳定时间序列的复杂型的度量,其思想都是检测时间序列中的新的子序列产生概率。 近似熵: 是数据是否有规...
  • AJAX - 使用JSON传输复杂数据

    千次阅读 2014-02-19 22:19:43
    字符串的形式能解决不少简单的应用需要,但是涉及到复杂的JS对应的时候,字符串就比较难以承担这样的任务。 XML是个很好的表示方式,但是在JS层面的对象转换和传输,XML毕竟要借助第三方提供的包。 而JSON
  • 容易转型管理的4类程序员,你喜欢的是?

    千次阅读 多人点赞 2019-02-18 09:23:49
    程序员是典型的技术饭,...管理者可以撬动公司内的各种资源,管理层级越高,可撬动的资源越多,撬动的资源越多,可以完成的事情就越重要越复杂,完成的事情越重要越复杂,收益也就越高。这个高点,会比一般的程序员...
  • 复杂网络分析工具及其比较(…

    万次阅读 2013-02-25 18:40:03
    原文地址:复杂网络分析工具及其比较(转)作者:zhengw789转自:...作复杂网络研究离不开各种实际或模拟网络的统计、计算、绘图等工作。对于一般性的
  • “大型复杂IT项目管理实践”一文将以电子政务领域为背景,结合“市民卡项目”深入分析大型复杂IT项目的特点和管理难点,分享项目管理实践的成功经验,并谈一些个人的思考和体会。本篇是该文的第一部分。
  • 简洁代码一定比复杂代码效率高吗?

    万次阅读 热门讨论 2011-03-10 23:38:00
    简洁代码一定比复杂代码效率高吗?
  • 关于C++复杂性的零碎思考

    万次阅读 热门讨论 2004-10-23 23:48:00
    ------------------------------------------------------------------------------------------C++的表面困境来自两方面,一是开发效率低,而是容易犯错,维护难度大。此二者俱是表象,本质就是一个——过度复杂。...
  • 为什么要把手机的名字取得很复杂

    千次阅读 多人点赞 2012-12-22 00:38:23
    所以凡是把名字搞得很复杂的,就是有不可告人的目的。凡是把名字取得简洁的,就是光明磊落的。那么怎样取名才能让消费者明明白白呢?最能表现出阶梯和层次的莫过于用阿拉伯数字,1,2,3这样命名,2比1好,3比2好,...
  • 随着近几年关于复杂网络(Complex network)理论及其应用研究的不断深入,已有大量关于复杂网络的文章发表在Science,ature,RL,NAS等国际一流的刊物上,侧面反映了复杂网络已经成为物理界的一个新兴的研究热点。...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 1,175,059
精华内容 470,023
关键字:

容易对复杂