精华内容
下载资源
问答
  • 幂律分布

    千次阅读 2019-10-27 19:19:17
    幂律分布 统计学意义 幂律分布就是常说的马太效应,二八法则,它是统计学中的概念。它的分布图如下1: 图1 幂律分布曲线 这种幂律分布概率密度可以表示成以下的形式: f(x)=αx−γ f(x)=αx^{-γ} f(x)=αx−γ ...

    幂律分布

    统计学意义

    幂律分布就是常说的马太效应,二八法则,它是统计学中的概念。这种幂律分布概率密度可以表示成以下的形式:
    y=αxγ y=αx^{-γ}
    其中,x,y是正的随机变量,α, γ均为大于零的常数。可见,在这种幂律概率分布上,概率越高,占比越小,大占比的分布位于那条长长的尾巴上。

    例如:y=5x2y=5x^{-2}的分布图如下:
    Alt

    图1 幂律分布

    通俗解释1

    按照相关统计资料,假设99个成年男性的平均身高为167.1厘米。姚明身高226厘米,若将其纳入样本,则100人的平均身高约为167.7厘米。姚明的个子固然很高,但其身高与167.1厘米的平均身高相比,并不是那么悬殊,故把他纳入样本不会显著提高平均身高。

    人类身高服从正态分布,绝大多数人的身高均处于平均值左右,很矮与很高的人在人群中的占比均很小。因此,基于样本的平均身高来估计个体的身高很“靠谱”。换言之,平均身高是一个典型值。若个体的身高等于平均身高,则从身高角度看,其属于“标准人”。

    按照相关统计资料,假设99个成年男性的平均财富为15万元。根据2018年福布斯中国富豪榜的数据,某位商界精英身价2387.4亿元。若将其纳入样本,则100人的平均财富约为23.9亿元。亦即,一旦把他加入样本,则每个人都被“平均”成了亿万富翁。

    财富平均值23.9亿元当然不是一个典型值,因为除了那位商界精英之外,其余99人的财富均远远小于这个平均值。换言之,从财富角度来看,拥有高达23.9亿元财富的个体不是“标准人”,而是属于人群中占比很少的富豪。对此,19世纪意大利经济学家帕累托很早就发现,人类的财富分布存在“可预料的不均衡”——少数人拥有的财富要远多于大多数人拥有的财富。一般而言,20%的人口几乎拥有80%的社会财富。

    就统计推断而言,上述分析表明,计算身高的平均值是有意义的,而计算财富的平均值只会带来误导。究其根源,是因为人类身高服从正态分布,而财富拥有量不服从正态分布。那么,后者到底服从什么分布呢?请再看一则故事。

    语言学家齐普夫在1932年发现,绝大多数词很少被使用,只有极少数英文单词被经常使用。实际上,经过长期演化的人类语言符合“最小努力原则”,基本上都具有“使用较少的词汇来表达尽可能多的语义”这一特点。齐普夫的发现被命名为齐普夫定律,成为文献计量学的一大重要定律。显然,与财富分布一样,单词使用频率也表现出很强的集中性。

    有趣的是,人们还发现,人口中的姓氏、城市人口规模、论文引用次数、网站访问量、书籍及唱片的销量、战争规模等,其分布无不具有集中性。实际上,它们均服从幂率分布,亦称“长尾”分布。在此分布中,绝大多数个体的尺度都很小,而少数个体的尺度相当大。在数学上,幂律分布是唯一满足无标度特征的概率分布形式。简单理解就是,虽然20%的人口拥有80%的社会财富,但80%的社会财富的80%,又由20%的人口中的20%所拥有。由此推知,极少数超级富翁所拥有的财富很容易超出我们的想象。

    幂率分布形成于一种正反馈机制,包括马太效应与网络效应。在日常生活中,幂率分布多呈现为帕累托法则、二八定律、关键少数法则等,其重要的启示是:对一件事情起决定作用的,往往是少数几个因素。因此,我们应抓住“关键少数”,优化决策。


    1. 幂律分布 ↩︎

    展开全文
  • 我们的世界和社会大部分,都是面向基于所谓的逆幂律而分布的,我对这样的经验事实尤为感兴趣,即许多分布曲线的形状都是曲线从中央峰值俯冲而下,沿着一条长长的尾巴渐渐地抱住水平轴的。逆幂律至雅至简,深不可测,...

    鲁迪·拉克(Rudy Rucker):数学家,计算机科学家,赛博朋客(cyberpank)先驱,科幻小说家,著有《穿梭于有序与无序的杂乱间》(Surfing the Gnarl)。

    我们的世界和社会大部分,都是面向基于所谓的逆幂律而分布的,我对这样的经验事实尤为感兴趣,即许多分布曲线的形状都是曲线从中央峰值俯冲而下,沿着一条长长的尾巴渐渐地抱住水平轴的。

    逆幂律至雅至简,深不可测,但离至臻至美还甚远。逆幂律能够自我组织与自我维持。基于尚未探明的原因,逆幂律自发地突现在平行计算的广泛范围中,同时出现在社会科学和自然科学中。

    社会科学家中第一个留意到逆幂律的是语言学家乔治·金斯利·齐普夫(George King Sley Zipf),他对如今被称为齐普夫定律的观察结果作出了阐释。他所陈述的事实是,在大多数文件中,一个词的使用频率与它的普及排名名次成反比。所以,出现频率位居第2的单词,其出现频率是频率最高单词的一半,而出现频率第10位的单词则是最高单词的1/10。

    在社会中,类似的逆幂律支配了社会的报酬分配。比如,身为作家,我留意到名次为第100位畅销作家的销售书籍,是首位畅销作家的1/100。如果第1名作家出售了100万,像我这样的作者可能就卖一万本。

    心怀不满的文人们有时会幻想乌托邦市场,其中自然产生的逆幂律分布会强行用线性分布来取代。也就是其销售明细会是平滑的斜线,而不是如现实中的逆幂律曲线那样,从一个很离谱的高峰俯冲而下,一瞬间就贴着水平轴缓慢而行。

    但是没有明显的方式可以改变作家的销售曲线。让某些组织强行介入,使销售曲线产生不同的分布显然是行不通的,毕竟买什么书的选择权在读者手中。社会是一种平行计算的系统,某些方面是我们无法控制的。

    逆幂律在收入分配方面特别让人寝食不安。因此社会中第二富有的人可能拥有最富有的人一半的财富,第10富有的人可能只有1/10,然后排在第1 000的人的财产就只有首富的千分之一。

    同样的现象可以说得更加赤裸,某家公司的CEO可能年薪为一亿美元,同一家公司的软件工程师的年薪可能只会有十万美元,该公司海外组装工厂的工人年薪为一万美元,仅是最高主管收入的万分之一。

    这种幂律分布也可以在周末首映电影票房收入、网页点击量、电视节目收视率中发现。是不是有某种原因,导致了排名靠前的人做得太好,而排名垫底的人似乎被极度不公平地惩罚?答案是否定的,没有任何真正的理由,不存在任何阴谋诡计扭曲了报酬。虽然这让人感到不舒服,但逆幂律的分布是系统行为的基本自然法则。它们无处不在。

    逆幂律不仅不会被社会所局限,它还主宰着自然界的统计数据。面积排名第十的湖可能是最大湖面积的1/10;一片森林中体积排名第100的树可能是最大树的1/10,海滩上体积排名在第1 000的石头是最大石头的千分之一大小。

    无论我们是否喜欢,逆幂律就如激流、熵或是万有引力定律那样无法规避。话虽如此,但在我们的社会中,我们多少能够缓和逆幂律的影响,如果说我们完全无法控制任何贫富之间的差距,也未免也太过于绝望了。

    但逆幂律曲线的基本架构永远不会改变。我们要么接受我们必定会处在对逆幂律加以抱怨的状态下的这个事实;要么接受,或许这是将严苛的定律弯曲为不那么陡峭直冲而下这个现实。

    以上是我要请假网为大家整理的“逆幂律曲线的基本架构永远不会改变”,如您想了解更多关于“冷门知识”的信息,欢迎访问www.woyaoqingjia.com查看更多相关信息。

    转载请注明:我要请假网https://www.woyaoqingjia.com/zhishi/18604.html

    展开全文
  • 后来我们拿大多数人最关心的财富来举例,但它符合正态分布符合对数正态分布,这是以人数做统计,但如果按照各个资产量统计人数的话,就会出现今天要讲的幂律分布。除了财富,与人类社会相关的分布大多都是符合幂律...

    上篇关于正态分布的内容中提到了自然界中许多事物的概率分布都近似的符合正态分布,后来我们拿大多数人最关心的财富来举例,但它符合正态分布符合对数正态分布,这是以人数做统计,但如果按照各个资产量统计人数的话,就会出现今天要讲的幂律分布。

    除了财富,与人类社会相关的分布大多都是符合幂律分布的。例如,某书店如果按销量排列,就能发现主要销量都集中在少量热门书籍上,而其余大部分书籍的销量只占总销量剩下的其他部分;又比如,英文的学习中,只有20%的词汇会经常用到,而剩下80%的词汇可能用得比较少,学习的时候可以优先把常用词汇先搞定,其它词汇用日常的时间来不断消化。看到这里相比大家会问,这不就是二八法则么?是的,我们常能听到的二八法则其实就是幂律分布思维模型使用方式的一种。

    定义

    什么是幂律分布

    想要知道什么是幂律分布,首先要了解什么是幂律法则。幂律法则指在任何一件事物中,极少数的关键事物带来绝大多数的收益,其他大多数普通事物只获得少量收益。平时经常能见到的马太效应,长尾理论,帕累托法则(上面所说的二八法则)其实就是和幂次法则的意思差不多。

    而符合幂律法则的事物体现在图表上则会呈现出幂律分布,例如,水变成冰的临界状态,各个城市的人口分布,投资回报现象等。通过幂律分布图表的形态我们能够的看出,对一件事情起决定作用的,往往是少数几个因素,而其它大部分的因素都无关紧要。

    正态分布 vs 幂律分布

    某事物符合正态分布还是幂律分布的一个重要评判条件在于:各个因素之间的关系是否有联系。正态分布的各个因素之间是没有联系,也就是互不影响,例如身高,智商等;而符合幂律分布的事物各个因素之间是相互联系,相互影响的。例如社会财富,网络传播效应等(一些详细的内容已经在正态分布那篇文章中提过,不明白的可以看一下,这里就不重复再解释了)。

    非线性的世界

    不论是正态分布还是幂律分布,其根本原因是因为我们所处的世界是一个复杂系统,现实中的生活远比我们记忆中的生活更加错综复杂,但是我们的头脑更倾向于将历史以更平稳和更线性的状态呈现出来,所以如果我们没有意识到这种复杂性,按照本能的线性去思考现实,就非常容易出现偏差。例如,我们希望今天花了2个小时复习功课,明天考试就能多考10分;给女朋友送个钻戒,她就愿意嫁给你;希望通过增加货币的供给量,刺激经济增长等等。

    当然,这种线性的思维方式也是因为我们在感性上害怕不确定性,这个在之前的不确定思维模型中解释过人类需要一些确定性的原因在于生存压力。另外还有一个需要确定性的理由是,如果没有确定性,我们很难给当下的理由找一个合理的理由。但我们不能就认为现实就是跟我们大脑理解的一样,这就像地图不是疆域思维模型所揭示的道理一样。

    启示

    把最基本的事情做对

    在《Signal and Noise》这一书中提到过:当我尝试使用帕累托法则时,我发现:我们把最基本的事情做对,就可以让我们走很远 —— Nate Silver

    这就好比在玩德州扑克时,你只要学习在牌不好的时候弃牌,在你牌好的时候下注,和尝试考虑一下对手握着什么牌就能够大大提高你的收益。这也说明了为什么生活中更应该将心思放在一些更为平常基本的事情,例如读书,写作,锻炼身体,规律作息等,你可能就过上你想要的生活。并不是说其它事情不重要,而是只有那么几件最基本的事情,对于结果的影响,比其它所有事情所产生的影响总和要大。

    学会放弃

    事情是有重要性之分的,其背后对应的价值存在着幂律分布,对于那些不重要或价值低的事情要勇于舍弃。这就像我们常能听到这句话“有所舍,才会有所得”一样,不要想着获得所有,当我们把精力平均分的时候,也就意味着最后的结果可能就是一个平均数,而且现实的平均并不容易达到。重要的事情只占少数,其它的都是次要的,不论是在生活中还是工作中,我们应该把80%的精力投入到极少数重要的事件中,剩下的再分给其它。

    学会学习

    当我们接触一门新学科或新技能时,往往会觉面面对的是一个非常庞大的知识库,而产生畏惧心理。这些新的知识点背后的重要性也是不同的,也是符合幂律分布的,而每个学科或技能都有核心概念或核心技能,剩下其他很多知识点都可能是在这些核心概念或核心技能延伸出来的,优先把这些内容都掌握好其它的知识点会更容易理解。任何学科都是同样如此,思维模型也不例外。一个人只要掌握大约八十至九十个思维模型就足以解决90%的问题,让你成为一个够智慧的人 —— 查理·芒格《穷查理宝典》

    总结

    幂律分布告诉我们,对一件事情起决定作用的,往往是少数几个因素,而其它大部分的因素都无关紧要。自然界的一些现象常出现正态分布,而人类社会中会常出现幂律分布。幂律分布与正太分布不同的原因是因为,它的各个因素之间是相互联系。现实世界是非线性的,而我们的大脑更容易使用线性思维去解读,如何能更准确地了解世界,首先要做的就是意识到这点。

    幂律分布带来的启示主要有3点,第一,把最基本的事情做对就能够走得很远;第二,学会放弃,按照事情背后的价值程度来分配精力,而不是平均分配。第三,优先学习核心概念和核心技能,可能就能解决大部分问题。

    展开全文
  • 我是你的专属评论员,“每年读300本书、读书不挑食”的轩辕。今天我们继续来评论《模型思维》这本书。昨天和前天,我们分别为...答案答案就是——幂律分布。观点正态分布可以描述能力高低学了这么多年的统计学,相...

    我是你的专属评论员,“每年读300本书、读书不挑食”的轩辕。

    今天我们继续来评论《模型思维》这本书。

    昨天和前天,我们分别为“人脉”和“股价”进行了建模。

    今天我们要为“成功”建立一个模型。

    今天的书评继续按照一问一答一观点的方式进行,带你享受“评论式读书法”的高效和乐趣!

    问题

    那我们今天的问题就是——

    成功的模型到底是什么样子的?

    答案

    答案就是——幂律分布。

    观点

    正态分布可以描述能力高低

    学了这么多年的统计学,相信大家对正态分布一定非常熟悉。

    但貌似我们的教科书当中,对于幂律分布却是只字不提,这个就很让人奇怪了。

    其实在自然界当中最常见的两种分布就是正态分布和幂律分布。

    比如人类的身高就完全可以用正态分布来描述。

    人与人之间的能力高低,也可以使用正态分布来做模型。

    正态分布的曲线画出图来就类似于一个倒扣的钟,所以也叫钟形曲线。

    如果身高服从幂律分布,人间将变成美好的童话世界

    相比之下,幂律分布的曲线就类似于一条躺倒的、开口比较大的c型曲线。

    我们刚才说人类的身高可以归为正态分布,大多数人属于中等身材。

    但如果人类的身高遵循幂律分布的话,就会出现一些特别的事情。

    我们假设美国人的平均身高是1米75,那么美国人当中,将会有一个人的身高会比帝国大厦还要高,有1万人的身高会超过长颈鹿,然后,身高小于18厘米的人也将超过1.8亿。

    整个人类世界就变成了一个童话世界了。

    公式来了,大家快跑啊!

    幂律分布的公式其实非常简单,类似于幂指数的样子。

    外观很像2的3次方的这样一个形式。

    当然,如果你把它变成计算概率的公式的话,就需要把这个2变成变量x,然后3次方变成负数。

    因为在幂律分布里,这个幂指数是一个负数,而且这个指数要小于-1。

    (下面三行完全可以跳过)

    一个定义在区间[x的最小值,无穷大)上幂律分布可以写成如下形式:

    P(x)=Cx^-a

    其中,指数a>1决定了尾部的长度,同时常数项C为(a-1)乘以x的最小值的(a-1)次方,C用来确保概率之和为1。

    “成功”模型

    好,那我们接下来为成功建立模型。

    关于成功我们最能接受的衡量标准就是财富,也就是成功人士相对拥有更多的金钱。

    幂律是可以描述财富的分布的。

    所以使用幂律分布来为成功建立模型的话,你应该会发现,在这条曲线上面,越是成功的人拥有的财富越多,少数的成功人士占有着大量的财富。

    这个模型和实际情况是相对符合的。

    根据2017年1月15日发表在《卫报》上发表一篇《世界八大富豪的财富总和等于50%贫困人口的财富总和》文章,我们就能够看出来,99%的人都属于普通人,而那些被大家认为是成功的超级明星们只占不到1%。

    那你可能会说仅仅用财富去衡量一个人是不是成功的话,可能不够全面。

    而我要告诉你的是——即使把成功的衡量标准变为影响力、出镜率、拥有观众的多少,或者是受人崇拜的程度,都不会影响成功的幂律分布模型——因为这些指标也都遵循幂律分布!

    优先连接的优势

    很多同学可能还记得之前书评当中提到过《巴拉巴西成功定律》,书中有个公式:

    初始的成功×社会适应度=未来的成功。

    其中,初始的成功就可以使用幂律分布来描述。

    有一个非常著名的实验,就是邀请大学生下载音乐。

    第1组的人,并不知道其他人下载了一些什么样的音乐,所以歌曲的下载量相对比较均衡,没有出现下载量超过200次的歌曲;下载量比较少的,比如说少于30次的歌曲,也只有一首。

    而第2组,大家知道别人下载了哪些歌曲,所以学生们看到有一些歌曲已经被下载了几次,而这些初始下载量本来就比较高的歌曲,就具有一定的初始优势,最终的结果就是,有一首歌曲下载量超过了300次,而且超过一半的歌曲的下载量都不超过30次。

    总之,第2组的歌曲的下载量,就明显遵循幂律分布。

    我还要告诉你的是,不仅仅是成功,包括城市人口的分布,物种灭绝,互联网的链接数,企业规模,视频下载量,书籍销量,学术论文的引用数量,战争中死亡的人数,洪水和地震的分布,这些通通都服从幂律分布!

    相互关联+正反馈

    最重要的是要产生幂律分布,那么事件与事件之间必须相互关联,而非相互独立。

    这种相互关联性,又常常是以正反馈的形式出现的。

    什么意思呢?

    就比如说你订阅了(关注了)我们轩辕书评,那你是一定是一位好学的、高端的、有品位的人,(老板,我的彩虹屁吹得好不?),所以你会愿意,把我们的专辑和专栏推荐给,和你认知程度一样高的朋友。

    而你的朋友因为,受你的推荐,订阅轩辕书评这个事件,与你订阅轩辕书评这个事件之间,就相互不独立,他们是有关联的。

    而订阅的人越多,我们也更愿意,更频繁的、更新更高质量的书评,专栏的数量和质量也会进一步提高,从而吸引更多的人订阅。

    这就是一个正反馈。

    回到成功这个话题,根据我们的幂律分布模型,为了达成自己的成功目标,你要确保做的每一件事情都相互有关联,也就是要不断地叠加你的社会适应度。

    另外,你要及早地建立起自己成长的增长飞轮,也就是我们刚刚说的正反馈。

    关于这些,你可以去再听一下,我们讲《巴拉巴西成功定律》的那几期书评,还有讲《人工智能的未来》那一期里面,提到的关于增长飞轮的评论。

    总结

    好,那我们简单总结一下,不管是用金钱衡量成功,还是用其他什么指标来衡量成功,我们都可以使用幂律分布来对成功建立模型。

    如果你想成功的话,一定要获取优先连接的优势,也就是我们所说的初始的成功。

    如果想获得未来的成功的话,你所做的每一件事情要相互关联,而且最好能够建立起一个正反馈循环来加速你的成功。

    好,今天的轩辕书评就到这里就要结束啦。

    期待你的订阅,并且期待你能够,把这样一个倡导“评论式读书法”的书评专栏,推荐给你的好朋友。

    那谢谢你喽!

    书单/参考书目(文献)

    书名:模型思维 作者:斯科特·佩奇书名:巴拉巴西成功定律 作者:【美】艾伯特-拉斯洛·巴拉巴西咱们明天的轩辕书评接着聊。

    展开全文
  • ​说起幂律分布,很多人都会觉得陌生,但你一定听说过它的应用---20-80法则。我国大学阶段概率统计教科书中很少讲到它,这是因为当前人们对幂律分布的了解还在不断深入之中。因而今次也只作浅谈。生活中,我们经常会...
  • Internet AS幂律建模及其参数估计
  • 复杂网络幂律分布

    2014-05-01 21:02:34
    学习复杂网络时,设计到幂律分布问题,计算幂律分布的有效代码,可运行
  • 基于幂律的快速盲图像复原算法
  • 首先,采用统计分析的方法对电力数据中的用电量、售电量和发电量几个核心指标在地域上的分布规律进行统计分析,经验证,这些指标不符合正态分布,并且得到其幂律分布特性;然后,验证了细分行业的用电量符合对数正态...
  • 幂律分布公式: 对公式两边同时取以10为底的对数: 所以对于幂律公式,对X,Y取对数后,在坐标轴上为线性方程。 2、可视化 从图形上来说,幂律分布及其拟合效果: 对X轴与Y轴取以10为底的对数。效果上就是X轴...
  • 幂律分布_百度百科

    2019-10-05 23:35:12
    幂律分布_百度百科 幂律分布_百度百科 幂律分布 编辑 自然界与社会生活中存在各种各样性质迥异的幂律分布现象,因而对它们的研究具有广泛而深远的意义。借助于有效的物理和数学工具以及强大的计算机运算...
  • FLUENT模拟幂律

    2012-11-09 15:50:18
    fluent模拟幂律流动的方法指导,详细介绍了模型的创建与设置
  • 我们在非规范标量场的框架内研究通货膨胀。 在这种情况下,我们获得诸如标量光谱指数,张量与标量... 然后,我们将这些结果应用于指数和逆幂律势。 我们的调查表明,尽管完全规范了标准正则通货膨胀中这些潜能的预测,
  • 对数周期幂律模型

    2011-10-19 15:14:02
    对数周期幂律模型
  • 幂律型燃料/空气气液两相爆轰的数值计算,胡洪波,翁春生,为研究幂律型非牛顿流体燃料/空气混合物两相燃烧转爆轰过程,建立了幂律燃料和空气混合物气液两相爆轰控制方程,并运用守恒元与�
  • matlab开发-幂律指数与对数拟合。在对数刻度上绘制时,查找并绘制与某些数据点的线性拟合。
  • matlab开发-幂律和宾汉流体的非牛顿流体模型测定。幂律与宾汉流体管道流动模型的确定
  • 从Internet拓扑的幂律特征(度分布律)出发,定义了主干子图的相关概念,证明了主干子图的若干性质,并在此基础上给出了基于主干子图的聚类算法。该算法可应用于有幂律特征的大型图的混合布局,也可为幂律特征网络的...
  • 基于对数周期幂律奇异性模型的个股价格走势分析,牟擎天,熊熊,本文选取了A股市场上比较有代表性的4只股票作为样本,截取泡沫从形成至破裂的一个完整的周期,利用对数周期幂律奇异性模型进行拟�
  • 为了精确建模Internet自治系统层面上的拓扑结构,提出了基于最小节点度和最大节点度的拓扑幂律模型及其参数估计新算法。针对Internet自治系统层拓扑实际测量数据,利用新算法对拓扑幂律模型中的最小节点度、最大节点...
  • 这是一个用于进行大规模社交网络图绘制幂律分布曲线的python代码
  • 我们评估了Sachdev–Ye–Kitaev(SYK)模型的有限温度分区总和和相关函数。... 也许,我们分析的最不期望的结果是,在与粒子数量成比例的时间尺度上,失序的相关函数从指数衰减机制转变为通用的t-6幂律行为。
  • 考虑迁移率幂律参数的有机TFT的1 / f噪声分析
  • 考虑迁移率幂律参数的多晶硅TFT的1 / f噪声分析
  • matlab下的幂律拟合函数 先构造函数 然后验证是否拟合效果好
  • 实证数据的幂律分布matlab程序

    热门讨论 2011-07-17 18:58:40
    实证数据的幂律分布,使用matlab拟合幂律分布,并且提供下载资源

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 1,209
精华内容 483
关键字:

幂律