精华内容
下载资源
问答
  • 中心化和标准化

    千次阅读 2018-09-03 20:55:01
    1 为什么会谈到中心化和标准化呢? 因为在阅读《推荐系统》一书,学习“改进余弦相似度”和“Pearson”相关系数时,都谈到了减去均值(当然两者中用到的,是不同的均值)。这便是“中心化”,至于标准化,是在搜索...

    1 为什么会谈到中心化和标准化呢?

    因为在阅读《推荐系统》一书,学习“改进余弦相似度”和“Pearson”相关系数时,都谈到了减去均值(当然两者中用到的,是不同的均值)。这便是“中心化(Zero-centered或者Mean-subtraction(subtraction表示减去)),至于标准化(Standardization或Normalization),是在搜索中心化的内容附带学习的,以这种比较的方式拓展知识面,也是比较有效的。

    2 中心化和标准化是什么?—— 定义

    中心化
    根据侯杰泰的话:所谓中心化, 是指变量减去它的均值(即数学期望值)。对于样本数据,将一个变量的每个观测值减去该变量的样本平均值,变换后的变量就是中心化的。[3]

    标准化
    数值减去均值,再除以标准差

    处理结果
    (1)中心化(零均值化)后的数据均值为零。
    (2)z-score 标准化后的数据均值为0,标准差为1(方差也为1)。

    3 为什么要提出中心化和标准化的方法?

    • 中心化
      1 变量单位 —— 统一单位
      在是为了统一单位,例如有数据集1, 2, 3, 6, 3,其均值为3,那么中心化之后的数据集为1-3,2-3,3-3,6-3,3-3,即:-2,-1,0,3,0。数据中心化是为了消除量纲对数据结构的影响,因为不同变量之间单位不一样,会造成各种统计量的偏误。
      2 模型构建 —— 多重共线
      中心化可以解决模型运行不稳定,最重要的是解决交互项变量和主变量之间的多重共线问题。[4]
      3 增加基向量的正交性
      举例分析
      以PCA为例说下中心化的作用。
      下面两幅图是数据做中心化(centering)前后的对比,可以看到其实就是一个平移的过程,平移后所有数据的中心是(0,0)。
      这里写图片描述
      在做PCA的时候,我们需要找出矩阵的特征向量,也就是主成分(PC)。比如说找到的第一个特征向量是a = [1, 2],a在坐标平面上就是从原点出发到点(1,2)的一个向量。如果没有对数据做中心化,那算出来的第一主成分的方向可能就不是一个可以“描述”(或者说“概括”)数据的方向了。还是看图比较清楚。
      这里写图片描述
      黑色线就是第一主成分的方向。只有中心化数据之后,计算得到的方向才能比较好的“概括”原来的数据。
    • 标准化
      数据标准化(归一化)处理是数据挖掘的一项基础工作,不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性。原始数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比评价。
      对数据进行标准化,消除特征之间的差异性,也便于一心一意学习权重
      举例分析
      在一些实际问题中,我们得到的样本数据都是多个维度的,即一个样本是用多个特征来表征的。比如在预测房价的问题中,影响房价的因素有房子面积、卧室数量等,我们得到的样本数据就是这样一些样本点,这里的样本点又被称为特征。很显然,这些特征的量纲和数值得量级都是不一样的,在预测房价时,如果直接使用原始的数据值,那么他们对房价的影响程度将是不一样的,而通过标准化处理,可以使得不同的特征具有相同的尺度(Scale)。简言之,当原始数据不同维度上的特征的尺度(单位)不一致时,需要标准化步骤对数据进行预处理。
      .
      下图中以二维数据为例:左图表示的是原始数据;中间的是中心化后的数据,数据被移动到原点周围;右图将中心化后的数据除以标准差,得到标准化后的数据,可以看出每个维度上的尺度是一致的(红色线段的长度表示尺度)。
      这里写图片描述
      图片解释:
    • 左图表示的是原始数据。
    • 中间的是中心化后的数据,可以看出就是一个平移的过程,平移后中心点是(0,0)。同时中心化后的数据对向量也容易描述,因为是以原点为基准的。
    • 右图将中心化后的数据除以标准差,得到为标准化的数据,可以看出每个维度上的尺度是一致的(红色线段的长度表示尺度,右图中的红色横线和竖线,两者长度相等),而没有处理之前的数据是不同的尺度标准。原始数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比评价。

    4 中心化和标准化的实际应用有哪些?

    理论研究:
    回归问题、一些机器学习算法,以及训练神经网络的过程中,通常需要对原始数据进行中心化处理和标准化处理。

    [1] 中心化和标准化_CSDN博客
    [2] 数据的中心化和标准化_CSDN博客
    [3] 怎样进行中心化处理_百度知道
    [4] 数据中心化处理的原因Stata专版经管之家(原人大经济论坛)
    [5] 统计学里面的中心化是什么意思知乎_百度知道
    [6] 数据什么时候需要中心化和标准化处理?- 知乎

    展开全文
  • 标准化、归一化、中心化

    千次阅读 多人点赞 2018-10-01 23:22:52
    标准化、归一化、中心化 数据分析及挖掘中常提到的几个概念(数据的 标准化、归一化、中心化),虽然经常在用,但可能还是有一些比较生僻的知识容易搞混淆,所以在十月国庆大家都出门上高速堵车的时候抽了点时间对...

    标准化、归一化、中心化

    数据分析及挖掘中常提到的几个概念(数据的 标准化、归一化、中心化),虽然经常在用,但可能还是有一些比较生僻的知识容易搞混淆,所以在十月国庆大家都出门上高速堵车的时候抽了点时间对这些概念以我的能力和理解做一个相对系统和浅显的总结。

    本篇文章通过个人以前对这些知识的一个先验理解,然后主要查阅和参考了数篇相关知识文档的介绍后,做了如下的总结。(注:尤其是标准化、归一化极容易混淆两者)

    标准化:

    特点:

    对不同特征维度的数据做伸缩变换(数据按比例缩放,使之落入一个小的特定区间),其目是使不同度量之间的特征具有可比性。并且同时不改变原始数据的分布状态。转化为无量纲的纯数值后,便于不同单位或量级的指标能够进行比较和加权。

    优点:

    1:使得不同度量之间的特征具有可比性;对目标函数的影响体现在几何分布(离散型概率分布)上,而不是数值上

    2:不改变原始数据的分布

    举例:

    根据人的身高和体重预测人的健康指数,假设有如下原始数据是四维:

     

    从上面两个坐标图可以看出,样本在数据值上的分布差距是不一样的,但其几何距离是一致的。而标准化就是一种对样本数据在不同维度上进行一个伸缩变化(而不改变数据的几何距离),也就是不改变原始数据的信息(分布)。这样的好处就是在进行特征提取时,忽略掉不同特征之间的一个度量,而保留样本在各个维度上的信息(分布)

     

    归一化:

    特点:

    对不同特征维度的数据做伸缩变换,其目的是使得各个特征维度对目标函数的影响权重是一致的,即使得那些扁平分布得数据伸缩变换成类圆形。这也就改变了原始数据的一个分布。

    优点:

    1:提高迭代求解的收敛速度

    2:提高迭代求解的精度

    举例:

    从采用大单位的身高和体重这两个特征来看,如果采用标准化,不改变样本在这两个维度上的分布,则左图还会保持二维分布的一个扁平性;而采用归一化则会在不同维度上对数据进行不同的伸缩变化(归一区间,会改变数据的原始距离,分布,信息),使得其呈类圆形。虽然这样样本会失去原始的信息,但这防止了归一化前直接对原始数据进行梯度下降类似的优化算法时最终解被数值大的特征所主导。归一化后,各个特征对目标函数的影响权重是一致的。这样的好处是在提高迭代求解的精度。

    1、 归一化为什么能提高梯度下降法求解最优解的速度?

    当两个特征X1和X2的区间相差非常大,X1区间是[0,2000],X2区间是 [1,5],其所形成的等高线非常尖。当使用梯度下降法寻求最优解时,很有可能走“之字型”路线(垂直等高线走),从而导致需要迭代很多次才能收敛;而右图对两个原始特征进行了归一化,其对应的等高线显得很圆,在梯度下降进行求解时能较快的收敛。因此如果机器学习模型使用梯度下降法求最优解时,归一化往往非常有必要,否则很难收敛甚至不能收敛。

    2、归一化有可能提高精度

    一些分类器需要计算样本之间的距离(如欧氏距离),例如KNN。如果一个特征值域范围非常大,那么距离计算就主要取决于这个特征,从而与实际情况相悖(比如这时实际情况是值域范围小的特征更重要)。

     

    修改总结原作者对提问者的回答如下:

    问题:

    归一化和标准化,都是将点平移然后缩短距离,从这个角度看,二者有什么区别呢?为什么标准化不改变数据分布(几何距离)?

    回答:

    第一,如果把加减看作平移,乘除看作放缩的话,那么从归一化和标准化的公式就能看出两者的区别。平移对于前者以一个最小值为参照,后者以均值为参照。缩放对于前者以最大差值参照,后者以标准差。第二,标准化不改变几何距离是其公式定义的原因,可以进行数学推导,类似于SVM的函数距离到几何距离,由公式可以推导。

    以上对两个容易混淆的概念(标准化、归一化)做了一个解释,但是需要根据实际的数据或场景需求来使用,以免适得其反,如:归一化后虽然平衡了权重,但也会或多或少破坏数据的结构。

     

    常用的标准化方法(z-score标准化):

    需要注意上面的s为n-1,不是n,两者的区别z-score标准化方法适用于属性A的最大值和最小值未知的情况,或有超出取值范围的离群数据的情况

    常用的归一化方法(Min-max normalization、最大最小归一化):

    当然还有对于两种方式其它好的解法,后面链接可以参考。

     

    中心化:

    这里以PCA为例讲述中心化:

    下面两幅图是数据做中心化(centering)前后的对比,可以看到其实就是一个平移的过程,平移后所有数据的中心是(0,0),同时中心化后的数据对向量也容易描述,因为是以原点为基准的。

    在做PCA的时候,我们需要找出矩阵的特征向量,也就是主成分(PC)。比如说找到的第一个特征向量是a = [1, 2],a在坐标平面上就是从原点出发到点(1,2)的一个向量。

    如果没有对数据做中心化,那算出来的第一主成分的方向可能就不是一个可以“描述”(或者说“概括”)数据的方向了。还是看图比较清楚。

    黑色线就是第一主成分的方向。只有中心化数据之后,计算得到的方向才能比较好的“概括”原来的数据。这里通过中心化后主成分组成的基能更好的表示原数据。

    对于中心化与标准化的区别:

    1. 对数据进行中心化预处理,这样做的目的是要增加基向量的正交性

    2. 对数据标准化的目的是消除特征之间的差异性。便于对一心一意学习权重。

    下图中以二维数据为例:左图表示的是原始数据;中间的是中心化后的数据,数据被移动大原点周围;右图将中心化后的数据除以标准差,得到为标准化的数据,可以看出每个维度上的尺度是一致的(红色线段的长度表示尺度)

    常用的中心化方法:

    变量减去它的均值

     

     

    文中若有不足或有误的地方,还请指出。感谢以下资料,本文主要参考:

    https://www.zhihu.com/question/20467170

    https://en.wikipedia.org/wiki/Feature_scaling

    https://www.zhihu.com/question/37069477

    https://blog.csdn.net/bbbeoy/article/details/70185798

    展开全文
  • 【导读】本节通过对比三种数字货币的形式引出“什么是去中心化”,并展示了比特币在去中心化方面的表现如何,最后,向大家阐述了比特币去中心化的原理。 中本聪解决了自己定义的难题“点对点的电子现金”,在这个...

    【导读】本节通过对比三种数字货币的形式引出“什么是去中心化”,并展示了比特币在去中心化方面的表现如何,最后,向大家阐述了比特币去中心化的原理。

    中本聪解决了自己定义的难题“点对点的电子现金”,在这个过程中,他“发明”了区块链技术。比特币系统融合密码学、博弈论和软件工程等三个领域的技术与理论,区块链技术是已有技术巧妙地组合形成的创新。中本聪不是凭空解决“点对点电子现金”这个难题的,他沿着前人的足迹前进,只是他完成了最后一跃。

    接下来,我们来具体地看中本聪是如何解决他定义的难题,创造一个在数字世界中做价值表示的事物的。在讨论中我们会特别关注,他是如何实现“去中心化”的?

    什么是去中心化?
    在说“货币”时,我们讨论的是数字世界中的价值表示。在互联网上的数字世界中,人们曾设计出各种各样的电子现金或数字现金方案,在为《区块链:技术驱动金融》一书撰写前言时,杰里米·克拉克收集了约 100 种支付系统。他写道:“在通往比特币的道路上,布满了无数失败的尝试。”在所列的各种系统中,他认为大众所知道的只有 PayPal。当然,在移动支付超前发展的中国,我们都很熟悉支付宝与微信支付。

    一直以来,数字世界中的“货币”有三种形式(见下图):

    中心化的在线支付;
    中心化的计算机点数或互联网积分;
    去中心化的电子现金。

    在这里插入图片描述

    图1:数字世界中“货币”的三种形式

    第一种形式:中心化的在线支付
    我们常用的 PayPal、支付宝、微信支付都是中心化的在线支付,在这些支付系统中流转的是映射到数字世界的各国的法定货币(也称法币)。

    法币(fiat money)是“法定货币”或“法偿币”的简称,它依靠政府的法令成为合法流通的货币。法币是各国政府发行的纸币,发行者没有将货币兑现为实物(如黄金)的义务。

    法定货币的价值来自拥有者相信货币将来能维持其购买力,本身并无内在价值。历史上,在政府强制规定纸钞为法定货币之前,大多数流通的货币具有一定的内在价值,例如金币、银两,它们又被称为商品货币(commodity money)。

    在布雷顿森林体系中,35美元能兑换1盎司(1盎司=28.35克)黄金,因而当时的美元不是法币。之后,当美元与黄金脱钩后,美元就变成了法币。
    第二种形式:中心化的计算机点数或互联网积分
    中心化的互联网积分/计算机点数是指 Q 币、游戏币、航空里程等,它们还曾有一个更为大众所熟知的名字——虚拟货币。通常,它们不与物理世界的法币对应,而是由商业公司中心化发行,仅可以在一家公司的体系中使用。

    第三种形式:去中心化的电子现金
    去中心化的电子现金已经被计算机密码学家探索了多年,沿着前人的探索路径,中本聪最终将这条路径变成了现实。中本聪设计和开发了比特币系统,并催生了众多加密数字货币和区块链技术项目。

    下面来分别看看这三种形式。三种形式与物理世界中的现金的对比如图 2 所示。

    在这里插入图片描述

    图2:一组对比:是否去中心化与是否自行发行

    第一种形式:PayPal、支付宝、微信支付
    现在,被互联网用户广泛使用的主流支付系统是 PayPal、支付宝,以及后来出现的移动支付 Square、微信支付等。这些第三方在线支付系统依赖于物理世界中的货币系统与金融体系,它们在数字世界中为用户提供支付、转账等服务。在使用它们时,我们所用的钱是物理世界中的法币,如美元、人民币、欧元、日元等,钱从银行账户中被映射到网络支付账户中。

    过去,信用卡、储蓄卡等塑料卡片实现了纸币现金的数字化,把纸币现金变成了卡片账户中的数字现金。现在,在线支付系统将信用卡和储蓄卡的功能转移到互联网数字世界中来了。

    在这些系统中流转的都是与法币一一对应的电子现金,变化的仅仅是“账户”,而非“货币”。这些系统所起的作用是,在账户和货币上连接物理世界与数字世界。

    这些系统都是中心化的。它们背后所依赖的传统金融系统是中心化的,法币是由各国央行发行的。它们自身是完全中心化的,由单一机构运转网络支付系统。它们在交易中担任中心化的中介角色,进行账户的记账,是用户间数字现金流通的中心。当两个用户进行转账时,在线支付系统在中间担任可信第三方的中介角色。这就是为什么称之为“中心化的电子现金”。

    第二种形式:Q币、游戏币等互联网积分或计算机点数
    在互联网上,除了在线支付系统之外,还有一种过去常被称为“虚拟货币”的货币现象。

    比如,用户可以用人民币购买腾讯公司的Q币,腾讯自称它是“统计代码”。Q币可以在腾讯的产品如QQ即时通信工具、网络游戏、音乐文学等中使用,兑换各种在线服务。

    关于“什么是Q币,它有什么用处”的问题,腾讯网站上的解释是,Q币是用于计算机用户使用腾讯网站的各种增值服务的种类、数量或时间等的一种统计代码,并非任何代币、票券,不能用于除腾讯网站增值服务以外的任何商品或服务。
    又比如,在游戏中,用户可以付钱购买道具,也可以通过战斗赢取游戏币。这些道具和游戏币的形态与价值各不相同,在一个游戏中都很难确定价格、进行兑换,在多个游戏之间几乎不可互换。当然,游戏玩家还是可以找到办法进行交换,在一定条件下甚至还可以将它们变现换回法币,例如,曾流行的“游戏打金”就是指有些玩家专门在游戏中获得金币,然后卖出获得现金收入。

    正如腾讯用“统计代码”的说法所表明的,Q币等是中心化机构(通常是一家公司)发行与管理的互联网积分或计算机点数。它们是中心化的,其发行和交易都是中心化的。

    一般来说,在不需要用户付费购买时,它们常被称为“积分”,在需要用户付费购买时,它们常被称为“点数”。

    但近年来出现了很有意思的混合产物。在打车软件中,用户可以存入现金,如存 100 元得 150 元;也可以介绍其他人成为打车软件的用户从而获得奖励,如介绍一个新用户双方各获得 50 元余额。在这种情况下,在打车软件钱包中的余额就变成了一定程度上的点数与积分的混合物。在打车软件钱包中的余额一般是不能提现的,也不能在用户之间直接转账,至多只能帮其他用户代付车费。

    我们还可以进一步对比在线支付系统和计算机点数。

    一个视角是,它们是否映射物理世界中的货币。在线支付系统是映射物理世界中的货币的,电子现金价值就是货币的价值。而对于游戏迷来说,游戏币、游戏道具通常是不映射物理世界中的货币的。对游戏迷而言,游戏道具既有价值也有价格;对其他人而言,游戏道具可能毫无价值。在线支付系统与法币无缝连接,而这些互联网积分/计算机点数系统只与现实世界中的货币系统有很少的连接点,并且由于法律、商业等方面的原因,一般没有畅通的渠道将它们兑换回法币。
    另一个是视角是“电子现金”或“点数/积分”是如何发行的?与在线支付系统不同,点数/积分是由一家公司自行发行的,用户付费获得点数,可被认为是向这家公司购买一种数字商品,用户稍后可用这些点数兑换成该公司体系内的虚拟商品或服务。

    直到最近,与现实世界相连的在线支付系统和不与现实世界相连的互联网积分/计算机点数都是互联网中的主流。变化始于比特币的出现。

    第三种形式:去中心化的电子现金
    在这两个主流之外,一直还有着另外一种探索:能不能创造一种完全去中心化的点对点电子现金?其中最终极的设想是,在数字世界中,货币的发行和交易都不需要中心化机构介入,是由计算机自动执行的:在发行时,无须类似各国央行的中心化机构;两个人在相互转移电子现金时,也无须中心化机构的参与。

    按前面的对比表格,这种理想化的去中心化的电子现金几乎在每个方面都试图进行突破:不映射线下的货币,而在数字世界中自行发行;发行去中心化,不需要一个类似中央银行的角色;像物理世界中的现金交易一样,交易无须中介介入。

    这个问题很难,因为它的要求与数字世界中的技术基础设施的能力相悖。其中重要的一点是,在物理世界中,表示价值的现金纸币是不能复制的。但在数字世界中,数字化文档是可以复制的,每一个复制出来的文档都一模一样。因而过去在数字世界中,要用数字文件表示价值(比如表示一笔电子现金),我们需要一个中心化机构来确保数字文件是唯一的。假设这笔电子现金现在属于我,当我把它转给你时,我们需要一个中介来协助记录所有权的变更,我不能直接把数字文件复制给你。

    计算机密码学家们探索的是,在无须中心化介入的情况下,如何通过密码学的方法,用可复制的数字文件来代表价值。

    这是一个漫长的探索过程,其开端甚至比互联网商业化都还早,最早可追溯到 20 世纪 80 年代。总的来说,由于这种探索是基于加密技术的,因此各种去中心化数字现金也被称为加密数字货币(crypto-currency),其中 crypto 是密码学(cryptography)的词根。

    最终在 2008 年,匿名的中本聪在密码朋克的邮件列表中发布了比特币的设计。他发明的比特币系统几乎集合了第三类探索的所有智慧结晶,他又加入了新的创新,最终在电子现金的发行和交易上都实现了去中心化。

    正如我们所知,中本聪不只是设计和实现了这个最理想化的去中心化电子现金,他还“发明”了区块链技术。区块链的价值表示和价值转移功能让它可能成为新一代互联网的技术基础。

    比特币实现了极致的“去中心化”
    对照前文图表,与现有中心化的电子现金系统(在线支付系统)相比,比特币是与之完全相反的:

    在线支付系统的货币发行是中心化的,比特币的发行是去中心化的;
    在线支付系统的货币流动是中心化的,比特币的交易是去中心化的;
    在线支付系统映射物理世界中的货币,比特币不映射任何现有的货币;
    在线支付系统自己不进行货币的发行,比特币是在数字世界中凭空发行出来的。

    在去中心化的程度上,比特币系统达到了极致。去中心化的初级阶段是自动化(automatic),即根据人设定的规则自动运行,而去中心化的高级阶段是自治(autonomous),也就是完全自治、自发。而比特币系统作为一个电子现金系统,达到了极致的去中心化状态(见图 3):

    作为一个货币应用,它不只交易是自治的,它的发行也是自治的。
    作为一个计算机网络,它是完全去中心化的,而不仅仅是分布式网络。
    作为一个组织,它是完全的社群自治,不需要有一个领导者居中协调。

    去中心化处于区块链的思维模式的最内核,而比特币实现了极致的去中心化。

    在这里插入图片描述

    图3:比特币去中心化的层次

    不过,之后在发展区块链技术和将之应用的过程中,我们又不得不从最极致的理想状态往实用方向调整,比如:

    现在多数区块链项目都是由基金会管理的。以太坊是由创始人维塔利克·布特林(人称“V神”)和以太坊基金会居中协调的,而不像比特币社区那样是完全自治的。
    常在金融系统中使用的联盟链,以及部分节点数量不多的基础公链,如小蚁(NEO)、EOS,更应被视为分布式网络,没有实现完全的去中心网络。
    通过以太坊发行基于 ERC20 标准的通证,通证的发行规则是由项目方确定的,在运行过程中会酌情更改规则。它们的发行不是自动的或自治的。
    常被视为区块链 3.0 代表的 EOS 在智能合约部分引入了李嘉图合约和社区仲裁机制,也即交易部分不再是完全交给机器自动执行,在需要时人可以参与和干涉。

    我们反复讨论比特币系统的设计,是因为它早已经把最极致的情况展现在所有人面前。而在将区块链技术落地应用的过程中,从最极致的去中心化往实用主义方向调整并不是倒退,而是事物发展的必然过程。

    比特币是如何实现去中心化的?
    那么,比特币系统具体是如何实现极致的去中心化的呢?

    在比特币白皮书《比特币:一个点对点电子现金系统》中,中本聪详细地解释了他是如何设计这个系统的。在其中,他确立了此后所有区块链系统的主要设计原则。

    一个真正的点对点电子现金应该允许从发起方直接在线支付给对方,而不需要通过第三方的金融机构。
    现有的数字签名技术虽然提供了部分解决方案,但如果还需要经过一个可信的第三方机构来防止(电子现金的)“双重支付”,那就丧失了(电子现金带来的)主要好处。
    针对电子现金会出现的“双重支付”问题,我们用点对点的网络技术提供了一个解决方案。
    该网络给交易记录打上时间戳(timestamp),对交易记录进行哈希散列处理后,将之并入一个不断增长的链条中,这个链条由哈希散列过的工作量证明(hash-based proof-of-work)组成,如果不重做工作量证明,以此形成的记录无法被改变。
    最长的链条不仅仅是作为被观察到的事件序列的证明,并且证明它是由最大的CPU处理能力池产生的。只要掌控多数CPU处理能力的计算机节点不(与攻击者)联合起来攻击网络本身,它们将生成最长的链条,把攻击者甩在后面。
    这个网络本身仅需要最简单的结构。信息尽最大努力在全网广播即可。节点可以随时离开和重新加入网络,只需(在重新加入时)将最长的工作量证明链条作为在该节点离线期间发生的交易的证明即可。

    威廉·穆贾雅在《商业区块链》一书中对比特币白皮书摘要进行了分析,他总结了四个要点:

    点对点电子交易;
    不需要金融机构;
    加密证据而不是中心化的信用;
    信用存在于网络,而不是某个中心机构。

    而从这个摘要中,我们提炼出了比特币系统设计的五个要点(见图 4):比特币的区块链系统是由分布式账本(即狭义的区块链)和去中心网络(点对点网络)组成的,形成链条的方式是工作量证明共识机制。最长链是由网络中的算力共同决定的,因而它是可信的,节点离开和加入依据的是最长链是可信的这一原则。这些组合起来形成了比特币系统。

    在这里插入图片描述

    图4:比特币系统设计的五个要点

    1. 去中心化的点对点电子现金系统
      比特币要做的是一个“点对点的电子现金系统”,发送方和接收方直接交易,它们之间不需要中介机构的介入。

    要去掉可信第三方等中介机构,就需要解决“双花问题”。在摘要中,中本聪给出了点对点网络的解决方案,并介绍了这个方案的核心——区块链。他并没有提到区块链(blockchain)这个词,但在论文中分别提到了区块(block)和链(chain)这两个概念。

    1. 分布式账本
      比特币的区块链是基于工作量证明形成的带时间戳、存储数据的数据块和由哈希指针连接成的链条。

    这个链条或者说账本以分布式的方式存储在比特币网络的各个节点上,因而也被称为分布式账本。

    1. 工作量证明
      比特币网络中的节点按照规则进行加密哈希计算,以竞争获得生成新区块的权利。节点在竞争获胜后就获得记账权,它生成区块成为最新区块后,就获得与新区块对应的挖矿奖励。

    工作量证明也是区块链账本的安全机制。如果不重做“工作量证明”所需的大量计算则此链条不可修改,这一共识机制保证了区块链上的数据的可靠性。

    1. 最长链原则
      在任何时刻,最长的链条是所有人都接受的最终记录。

    由于最长链是由网络中的主要算力完成的,因而只要它们不都与攻击者合作,那么它们生成的最长链就是可信的。这个原则被称为“最长链原则”。

    1. 去中心网络
      比特币的去中心网络的架构非常简洁,本身需要的基础设施很少。它可以在互联网网络上运行。计算机节点可以随时离开或加入这个去中心网络,在加入时它们只需遵守最长链原则即可。

    相关文章推荐:

    去中心化是什么?它的真正的含义是什么?
    关于“去中心化”,你知道的可能都是错的
    常常被讨论的“去中心化”到底是什么?
    什么是去中心化——搜狐
    什么是去中心化?——爱奇艺视频
    如何理解互联网的去中心化?
    浅谈去中心化应用

    展开全文
  • 中心化及其局限性

    万次阅读 2019-05-13 18:56:53
    中心化及其局限性 这张表总结了一部分新的 P2P 网络中的去中心化工具。区块链就是其中的一个! 本次演讲我将提出三个问题:(1)去中心化是什么?我们真的知道答案吗?(2)我们真的想要去中心化吗?不要...

    去中心化及其局限性

    Devcon - Decentralization and its Discontents-page-001.jpg

    Devcon - Decentralization and its Discontents-page-003.jpg

    这张表总结了一部分新的 P2P 网络中的去中心化工具。区块链就是其中的一个!

    Devcon - Decentralization and its Discontents-page-004.jpg

    本次演讲我将提出三个问题:(1)去中心化是什么?我们真的知道答案吗?(2)我们真的想要去中心化吗?不要想当然地回答说你想要。(3)去中心化是否有自身的局限性?这个问题很重要,因为大多数事物都有自身的限制。

    提出并思考这些问题,远比找到一个标准答案更重要。

    什么是去中心化?

    Devcon - Decentralization and its Discontents-page-008.jpg

    这个图(指右上的网络拓扑图)是问题的答案吗?显然不是。要理解去中心化这个词,我们先从词义上去理解。从词根上说,DE-CENTRALIZATION 的意思仅仅是,去掉 - 中心化,这是一类“反限制性”(anti-limit)名词。“中心化”就是该词的限制,假设这一点是中心化,那“去”中心化,是要往哪去呢?东南西北各不相同的“去”中心化,都是一样的吗?

    Devcon - Decentralization and its Discontents-page-011.jpg

    当我去查 DECENTRALIZATION 一词的出处,我发现该词首词出现在十九世纪中期的法国大革命时代。

    法国著名思想家托克维尔曾经写下过这样一句话:

    “(法国大革命在一开始的时候)一直向着去中心化发展……而最终,只不过是中心化的延伸。”

    “ a push towards decentralization… [ but became] in the end, an extension of centralization.”

    德国出生的犹太政治理论家汉娜 · 阿伦特也曾说过:

    “最激昂的革命者在革命成功的第二天就会变成保守派。”

    "The most radical revolutionary will become a conservative the day after the revolution."

    Devcon - Decentralization and its Discontents-page-012.jpg

    “去中心化”一词仍旧主要在政治或组织形式这类语境中使用,在我定下本次演讲的题目后,我发现了一本书名与本次演讲题目相同的书,它的副标题为:印尼政治中的阶级,政治机构与民族视角。

    下面给大家看两个我谷歌到的定义:

    1. 从中央到地方政府的权利转移。(the transfer of authority from central to local government)
    2. 大型组织中,各部门从单一的管理中心向其他地区转移的行为。(the movement of departments of a large organization away from a single administrative center to other locations.)

    可以看出,这些都是政治或组织形式方面的定义。而我认为略显吊诡的是,我们这些为如此强调去中心化的网络社区工作的人们,却在社区治理方面一再挣扎。值得一提的是,即使是在政治组织领域,去中心化也曾是很多不同运动的组成部分,而这些运动可能相互毫不相关。

    Devcon - Decentralization and its Discontents-page-013.jpg

    这里给大家展示一段用自由市场理论来解释的去中心化的理由,出自一篇关于信息市场的文章。原文中,这段话的前一句引用自亚当 · 斯密,后一句引用自冯 · 哈耶克。全文重点论述了自由市场本质上就是去中心化的,理性的市场行为人在没有统一协作下,独自在自己的国家中创造财富。

    Devcon - Decentralization and its Discontents-page-014.jpg

    我感觉,有非常多的思想家都在某种程度上呼吁过不太一样的“去中心化”,这也是去中心化这一概念的有趣之处吧。

    Devcon - Decentralization and its Discontents-page-015.jpg

    先声明这张图是盗的。每个人可能都由于各种各样不同的原因想要的“去中心化”,也就是说,“去中心化”运动中包含了许多不同甚至是相互竞争的动机,这也许是好事也许不是,你也可以说,这样我们的动机也都去中心化了。

    量化去中心化

    Devcon - Decentralization and its Discontents-page-017.jpg

    我们通常使用劳伦兹曲线或基尼系数来量化某个地区的财富分布,也可以说是衡量某个地区的财富去中心化程度。那么我们来看这张图,图中有几个元素,首先是这条 45° 的直线,我称之为绝对平等线(line of equality),如果某地区财富分布均衡,也就是说 10% 的人享有总财富的 10% ,50% 的人享有总财富的 50%,以此类推,“曲线”就会是这样一条直线。而劳伦兹曲线就是我们根据实际数据测绘出来的曲线,而基尼系数则表示实际曲线与绝对平等线的差别。

    Devcon - Decentralization and its Discontents-page-018.jpg

    本图出自近期一篇 Balaji S. Srinivasan 写的博客文章《量化去中心化程度》(编者注:中文译文可以在此找到),作者取了市值前 100 位的加密货币,作了这张劳伦兹分布图。可以很直观地看出,加密货币的市值分布是非常不平均的。

    同样是在这篇文章中,作者还论述了,一个去中心化系统如何同时拥有不同的去中心化子系统(挖矿、交易所、节点、开发者、客户端等等)。我想这里可以借用一个词——intersectional,交叉去中心化。如图,如果我们把去中心化想象成这样的一个相互重叠的笛卡尔平面,我们就会发现,在任何一项缺失的情况下讨论系统的去中心化程度都是毫无意义的。

    可扩展性三难

    Devcon - Decentralization and its Discontents-page-020.jpg

    在区块链世界中,我们还会提到一个概念叫做可扩展性的三难问题(Scalability Trilemma)。PPT 内容摘自 Ethereum Wiki,去中心化(Decentralization)可扩展性(Scalability) 和 安全性(Security) 这三个属性,区块链系统最多只能三选其二,有点类似分布式系统中的 CAP 定理。这个三难问题对去中心化有个比较明确的定义,就是系统中的每个节点的算力资源都不应该过大,最好是一个笔记本就是一个节点。可扩展性在这里具体指的是整个网络的处理能力应该比单个节点要高(即图中的 $O(N) > O(C)$)。最后,安全性,即成功攻击网络所需的算力资源要求。

    显然,去中心化是这个三难问题的其中一难,我们也可以通过降低去中心化程度来提高网络的可扩展性与安全性。但是我们是否真的有必要去与类似 VISA 这样的网络来比较可扩展性水平呢?VISA 每秒可以处理 24,000 个交易,因为 VISA 把去中心化程度降为零,以求可扩展性的最大化。

    其它问题

    Devcon - Decentralization and its Discontents-page-021.jpg

    所以重新思考一下这个问题,我们真的想要去中心化吗?我想我会将这个问题留给大家思考,至少请不要忘记,这也可以是一个问题,答案并不是理所当然的。如果我们承认,去中心化并没有一个绝对的定义,那么我们想要的是怎样的去中心化呢?

    Devcon - Decentralization and its Discontents-page-022.jpg

    去中心化是否有自身局限性?如果有,又是哪些局限性?当下,人们经常谈论的都是网络或者应用层的去中心化,而我们是否也应该考虑计算机生产或者供应链上的去中心化呢?在众所周知的领域里,到底有哪些是我们想要去中心化的?

    Devcon - Decentralization and its Discontents-page-023.jpg

    最后,这个递归问题,我们是否能将去中心化网络的建造过程也去中心化?对我个人而言,专业性其实与中心化是紧密相连的,一位技术大神通常也是网络中出现单点故障之处。

    Devcon - Decentralization and its Discontents-page-024.jpg

    最后的最后,如果对于权力的追逐本身就是趋于中心化的,我们如何才能阻止这个趋势在我们的网络中发生?而最重要的一点,是我们应该认识到,去中心化有许多不同的体现方式,而没人可以定义出一种“完美的”去中心化方式。

    附:作者在另外一个场合的同题演讲视频:https://www.youtube.com/watch?v=Km6EYsBYAlY

     

    展开全文
  • 中心化的三个维度

    千次阅读 2017-02-15 09:18:27
    作为区块链存在的主要理由,去中心的定义...编者按:去中心化是个热词。但是究竟什么是去中心化却存在很多异议。为此比特币改良版在线系统Ethereum的创始人之一Vitalik Buterin从结构、政治和逻辑三个维度剖析了去中心
  • 【转】量化去中心化

    万次阅读 2019-05-12 08:46:39
    在提高区块链去中心化程度之前,我们必须先知道衡量的标准。 去中心化被普遍认为是比特币和以太坊胜过传统同类方案的主要优势。(编者注:这里有四个超链接。其中第二个为 V神博文《去中心化的意涵》,中译本见文末...
  • 【转】去中心化的含义

    万次阅读 2019-05-13 18:55:54
    在密码学货币的世界里,很少有词语像“去中心化”一样,既令人心潮澎湃,引发经久不衰的传播,同时又那么困惑。一方面,去中心化被当成区块链(尤其是工作量证明系统)最重要的成果;另一方面,也有人认为工作量证明...
  • 【转】 Vitalik:去中心化的意涵

    千次阅读 2019-05-12 08:20:36
    “去中心化”或许是区块链被提到过的最高频的一个词了,但这个词的定义也是最不清楚的。 想想这件事其实挺不可思议的。区块链消耗了计算机大量宝贵的哈希算力,正是为了保证网络的去中心化,但当人们彼此在争论某个...
  • 区块链中的去中心化

    万次阅读 2019-01-22 10:40:46
    “去中心化”是加密经济学领域中使用频率最高的词汇之一,同时也是区块链中最为关键的特性,但是其定义一直模糊不清。 为了实现去中心化,迄今为止,人们已经花费数千小时的研究,投入了数十亿美元的哈希算力,持续...
  • 理解去中心化身份

    万次阅读 2019-05-14 09:19:35
    有传言说,Namecoin 的开发者曾经找谷哥和 ICANN 寻求潜在合作,背离了使用去中心化 DNS 替代中心化管理的最初目标。 Onename , 由 Princeton 研究员 Ryan Shea 和 Muneeb Ali 于 2014 年 3 月推出,是另一个身份...
  • 一、中心化(又叫零均值化)和标准化(又叫归一化)概念及目的? 1、在回归问题和一些机器学习算法中,以及训练神经网络的过程中,通常需要对原始数据进行中心化(Zero-centered或者Mean-subtraction(subtraction...
  • 随着去中心化运动的不断发展,我思考了去中心化的特点和战略意义,以及我们为何要重新将数字世界去中心化,为此我们仍需付出哪些努力。 去中心化已成主流 从蒂姆·伯纳斯·李振臂高呼要重新将网络去中心化,...
  • 在去中心化计算的应用中,有一个激动人心的应用,在过去的一年里引起了相当大的兴趣,那就是受激励的去中心化在线文件存储系统的概念。目前,如果你想你的文件或者数据安全地在云端备份,你有3种选择:(1). 上传它们...
  • 中心化兑换(decentralized exchange)仍处于早期,但是几年后,它很可能会是区块链生态中不可或缺的一环。 首先,去中心化兑换与中心化兑换协议的区别: -EtherDelta, 一个早期的去中心化交易所- 去中心化兑换...
  • 中心化应用:区块链技术概述

    千次阅读 2018-08-01 10:20:03
    在这本实用指南中,作者解释了为什么去中心化应用(dapp)将比现在最流行的 Web 应用得到更广泛的使用以及实现更多盈利,展示了如何使用现有工具来创建可用的 dapp 及其市场,并研究了目前两个成功的 dapp 案例。...
  • 数据预处理-中心化和标准化

    千次阅读 2018-07-13 14:45:16
    一、中心化(又叫零均值化)和标准化(又叫归一化)概念及目的?1、在回归问题和一些机器学习算法中,以及训练神经网络的过程中,通常需要对原始数据进行中心化(Zero-centered或者Mean-subtraction(subtraction...
  • 数据的中心化,标准化及意义

    千次阅读 2019-07-17 19:25:02
    在机器学习回归问题,以及训练神经网络过程中,通常需要对原始数据进行中心化(零均值化)与标准化(归一化)预处理。 目的 通过中心化和标准化处理,最终得到均值为0,标准差为1的服从标准正态分布的数据。 在多...
  • “去中心化”是区块链的目的吗

    千次阅读 2018-07-13 11:55:21
    “去中心化”是区块的一个核心特征,甚至是本质特征,相信对大多数人都会这么认为。
  • 中心化差分隐私与本地化差分隐私

    千次阅读 2018-12-26 22:01:22
    定义区别:在中心化差分隐私保护技术中,算法膨的隐私性通过近邻数据集来定义,因此其要求一个可信的第三方数据收 集者来对数据分析结果进行隐私化处理.对于本地化差分隐私技术而言,每个用户能够独立地对个体数据...
  • 为什么说去中心化很重要

    千次阅读 2018-03-09 00:00:00
    中心化是与中心化相对的一个概念,简单的来说中心化的意思,是中心决定节点。节点必须依赖中心,节点离开了中心就无法生存。去中心化恰恰相反,在一个分布有众多节点的系统中,每个节点都具有高度自治的特征,每一...
  • 一、中心化(又叫零均值化)和标准化(又叫归一化)概念及目的? 1、在回归问题和一些机器学习算法中,以及训练神经网络的过程中,通常需要对原始数据进行中心化(Zero-centered或者Mean-subtraction(subtraction...
  • 3.一个去中心化的数据中心操作系统模型 3.1定义和概念 3.2要求 3.2.1效率要求 3.2.2安全要求 3.2.3其他要求 3.3分布式对象 3.4资源命名 3.5资源管理 3.6永久存储 3.7并发访问 3.8总结 前言 本文是Malte...
  • 中心化(又叫零均值化)和标准化(又叫归一化)

    万次阅读 多人点赞 2018-05-19 12:39:04
    一、中心化(又叫零均值化)和标准化(又叫归一化)概念及目的?1、在回归问题和一些机器学习算法中,以及训练神经网络的过程中,通常需要对原始数据进行中心化(Zero-centered或者Mean-subtraction(subtraction...
  • 一、归一化,标准化和中心化 广义的标准化: (1)离差标准化(最大最小值标准化) (2)标准差标准化 (3)归一化标准化 (4)二值化标准化 (5)独热编码标准化 归一化 (Normalization)、标准化 ...
  • 这篇文章将是尝试描述协议中包含的各种各样权衡的系列文章的第一篇,并且将重点放在具有经济最终化的协议中的去中心化与效率上。 首先,我们将会简短地定义经济最终化(economic finality)(我们将会假设一个 2/...
  • 在机器学习回归问题,以及训练神经网络过程中,通常需要对原始数据进行中心化(零均值化)与标准化(归一化)预处理。 目的 通过中心化和标准化处理,最终得到均值为0,标准差为1的服从标准正态分布的数据。 原理...
  • 摘要 Aragon Network(阿拉贡)是一个由代币控制的数字管理组织,专注于为...Aragon Network的链上组织将会使用Aragon Core进行搭建,它是由一个Solidity语言的去中心化自治组织(DAO)和网页端去中心化应用(dA...
  • 一、中心化(又叫零均值化)和标准化(又叫归一化)概念及目的? 1、在回归问题和一些机器学习算法中,以及训练神经网络的过程中,通常需要对原始数据进行中心化(Zero-centered或者Mean-subtraction(subtraction...
  • 2018年去中心化交易所的状况

    千次阅读 2018-04-16 18:22:16
    加密货币和去中心化技术正在蓬勃发展。市值的飙升,交易量的猛增,这些数据说明了一切。加密货币和去中心化技术在个人、企业和政府中的应用已经在全球范围内得到了发展。借助区块链技术,我们正在向无需信任的经济...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 335,894
精华内容 134,357
关键字:

中心化的定义