精华内容
下载资源
问答
  • 前言 计算的本质,就是在信息的控制下,利用能量实现运算 算盘这种计算机的本质是什么呢? 就是利用人的能量,在珠算口诀这种信息集合的控制下,完成...也就是说,计算的本质是一种机械运动,但它需要信息...

    前言

    计算的本质,就是在信息的控制下,利用能量实现运算

    I 、计算机的本质:【在信息的控制下,利用能量实现运算】

    1.1 计算机的原理

    二进制、数理逻辑、电子学地融合构成了现代计算机的基础。

    1.1.1 Binary

    计算机内部采用二进制,每一个数位只有两种可能"0"和"1",运算规则是"逢二进一"。

    在这里插入图片描述
    在这里插入图片描述

    1.1.2 Logic Gates

    • Logic Gates
      在这里插入图片描述
    • The half-adder

    在这里插入图片描述

    • The full-adder

    在这里插入图片描述

    • A 4-bit adder
      在这里插入图片描述

    1.1.3 Building logic gates from transistors

    • Transistor AND gate
      在这里插入图片描述

    • Transistor NOT gate
      在这里插入图片描述

    • Transistor OR gate

    在这里插入图片描述

    • Building a full-adder
      在这里插入图片描述

    • 4-bit computer input and output circuit schematics
      在这里插入图片描述

    1.2 算盘这种计算机的本质是什么呢?

    • 为什么算盘是计算机?

    它不仅有计算机的硬件,还有能够控制计算的指令集(珠算口诀),相当于是计算机程序的基础。

    就是利用人的能量,在珠算口诀这种信息集合的控制下,完成信息的处理。也就是说,计算机需要有能量才能工作,需要信息的控制才能工作。

    • 帕斯卡的手动计算机

    帕斯卡发明这种能做加减法的计算机,使用起来不用动脑筋,只要把数字旋钮拨到合适的位置,然后转转手柄就可以了。帕斯卡计算机并不比算盘更快,但是使用起来不需要学习。
    从能量的角度讲,它不如算盘有效,但是所需要的控制信息少。也就是用能量换信息

    • 莱布尼茨的计算机

    他通过改进机械,能够做更复杂的计算,因为他通过机械实现了一些本来需要指令才能实现的控制。

    • 到了19世纪机械论盛行的年代,巴贝奇相信任何运算都可以转变为机械运动,于是他发明了能够做微积分的计算机

    巴贝奇使用非常复杂的机械结构,实现了复杂的运算。
    他设计的那个庞然大物包括了上万个齿轮和1.5万个其它的零件,重达好几吨,其实人直接操作起来是很费力气的。
    如果从能量的角度讲,要完成复杂的运算就需要更多的能量。

    II、世界上第一个可编程计算机

    第一个发明可编程计算机的是德国工程师楚泽。

    楚泽发现很多运算道理都是一样的,只是改改其中的数字,这种事情应该能让机器完成。在此之前巴贝奇等人的计算机一次只能做一种运算,而楚泽则希望机器能够按照流程完成一系列的运算。这件事自然就需要用程序控制。

    2.1 纯机械

    • 楚泽发明的第一台计算机,即Z1,也是纯机械的

    它非常复杂,也非常大,因此需要用马达驱动了。由于是纯机械的,一秒钟只能计算一次。也就是说,楚泽的计算机是利用更多的能量、更复杂的信息,完成更复杂的运算。

    到目前为止,计算机虽然能完成越来越多的运算,但是消耗的能量也越来越高。如果按照这个趋势发展下去,人类是无法实现大量的数据计算的。

    比如打算盘进行一次计算只需要一粒芝麻的能量
    摆弄帕斯卡和莱布尼茨的计算机就需要一颗绿豆的能量
    而巴贝奇的计算机需要一粒花生米的能量,
    楚泽的要一个橙子的能量。

    2.2 使用继电器取代机械设备

    楚泽在它第二个计算机中就使用了继电器取代机械设备

    这样不仅消耗的能量低,而且速度快。

    • 为什么继电器的计算机比机械的快呢?

    因为机械运动有惯性,齿轮不可能正着转完了马上反着转。 继电器虽然也有惯性,但是接触和断开的时间间隔可以非常短。
    如果我们把机械计算机看成是纽卡门蒸汽机,每次工作一下都要等气缸冷却,那么继电器的计算机就如同瓦特改进后的蒸汽机,不再需要冷却这个过程,可以连续工作。

    II 、 通用电子计算机

    继电器开关的频率毕竟有限,如果能用电子设备取代继电器,那么计算的速度可以大幅度提升,这就是美国研制电子计算机的初衷。

    • 1946年,世界上第一台通用电子计算机埃尼亚克诞生了,它的速度在当时来讲是飞快的,一秒钟能进行5000次运算。

    不过它的能耗也是巨大的,因为它里面有近18000个电子管,每个电子管相当于一个小灯泡,它的耗电量大约是15万瓦,当时它一启动,周围居民家的灯都会变暗。
    埃尼亚克消耗一度电大约能完成2.5万次运算,

    • 第一台通用电子计算机埃尼亚克用到了图灵在1936年提出的图灵机的理论。

    所谓的图灵机,是一种数学模型,它告诉人们,如何利用信息控制机械,实现计算。也就是说,计算的本质是一种机械运动,但它需要信息(指令)控制。

    • 计算是如何通过机械运动实现的?

    依赖香农的一项发明——开关电路
    今天所有的集成电路里面其实都是各种各样的开关电路。

    III、 提高能量利用率的三个里程碑

    自1946年以来,计算机70多年的发展,从本质上讲就是提高能量利用率的过程。

    • 第一个里程碑是晶体管的诞生,它将计算的能耗降低了两个数量级。这是上个世纪50年代的事情。
    • 第二个里程碑是集成电路的发明,它将计算的能耗又降低了大约两个数量级。这是60年代初的事情。那时消耗一度电量可以完成1亿次的运算了。
    • 第三个里程碑则是1965年摩尔提出摩尔定律,即集成电路的性能每12个月翻一番,1975年摩尔对摩尔定律有所修正,认为1980年起集成电路的性能每两年就会翻一番。

    IV、 IT业发展的方向:提高单位能耗性能

    实际上从十多年前开始,整个半导体产业的努力方向已经从单纯提高性能,转变为提高单位能耗性能了,并且在沿着这个方向取得了不小的进步。

    4.1 怎么提高单位能耗性能?

    • 用信息置换能量:通过在处理器中将信息处理的算法集成进去,来大幅度提高单位能耗的计算能力

    例子1:英伟达公司的人工智能芯片。它其实是一种特殊的图形处理器,并且对很多人工智能的应用作了专门的优化。相比英特尔的通用处理器,它单位能耗的计算能力能提高两个数量级(百倍左右)。
    英伟达其实并没有往处理器里面塞更多的晶体管,而是根据人工智能计算的特点,将计算的精度从64位降低到8位,这样就可以用同样数量的晶体管搭建几十倍的内核了,于是每一个内核的能耗就降低了。而这么做的前提是,需要对人工智能算法的信息处理过程有深刻的了解。

    例子2:Google的人工智能芯片TPU。
    这种TPU只适合进行和深度学习有关的计算,不适合其他的信息处理
    Google是将深度学习算法的特点设计到了处理器中,这样一来相应处理器的应用场景也就受到限制了。
    不过当某一类计算使用的人非常多了以后,这么做还是值得的。

    see also

    “订阅”一次 ,享受终身服务的快乐

    订阅任意专栏,享有全部专栏

    在这里插入图片描述

    1、 iOS进阶

    1.0 自定义相机

    1.1 常用动画

    在这里插入图片描述

    在这里插入图片描述

    在这里插入图片描述

    1.2 蓝牙打印

    在这里插入图片描述

    在这里插入图片描述

    1.3 本地化

    1.4 布局

    例子:入库单详情界面未审核状态时展示审核按钮,否则隐藏审核按钮

    在这里插入图片描述

    1.5 提高开发效率的工具

    磨刀不误砍柴功:编写代替自己工作的自动化工具

    1.6 消息推送后台语言播报(包括app处于杀死状态)

    1.7 收银app必备模块:收银台、电子签名

    iOS计算器:采用NSDecimalNumber 进行表达式的精准计算(计算字符串数学表达式)【案例:折扣计算器(完整demo源码)】
    从csdn资源下载demo源码:https://download.csdn.net/download/u011018979/14038508

    3、iOS安全与逆向

    2.1 iOS逆向

    iOS逆向工程,指通过分析系统的功能、结构、行为,将软件的技术实现或者设计细节推导出来的过程。

    _ivarDescription
    _shortMethodDescription
    nextResponder
    _autolayoutTrace
    recursiveDescription
    _methodDescription

    2.1.1 ASO

    2.1.2 模拟鼠标点击

    例子(定时点击特定位置,来点击保证Mac永远处于活跃状态,达到mac永不不关闭屏幕的目的)

    2.1.3 LUA

    2.1.4 分析网络数据包

    2.1.5 日志分析

    【 iOS设备日志查看工具syslog和socat】(syslogd to /var/log/syslog)

    2.2 iOS安全

    2.2.0 脱敏规范

    2.2.1 接口安全

    在使用NSURLSession时敏感的数据采用ephemeralSessionConfiguration配置,与默认配置相比,这个配置不会将缓存、cookie等存在本地,只会存储在内存里,所以当程序退出时,所有的数据都会消失。

    
    AFSecurityPolicy *securityPolicy = [AFSecurityPolicy defaultPolicy];
    securityPolicy.validatesDomainName = NO;
    securityPolicy.allowInvalidCertificates = YES;
    manager.securityPolicy = securityPolicy;
    
    
    

    3、 JAVA

    4、阅读与写作

    5 、iOS基础

    5.0 上架技巧

    5.1 系统适配

    iOS14 开启 encrypted DNS 提高安全性,防止DNS 劫持

    5.2 基础功能

    在这里插入图片描述

    5.3 自定义视图

    在这里插入图片描述

    在这里插入图片描述

    在这里插入图片描述

    在这里插入图片描述

    在这里插入图片描述

    在这里插入图片描述

    5.4 支付相关基础知识

    6、理解计算机

    6.0 计算机的本质

    6.1 代码管理

    本教材适用于gitlab 和GitHub。 同样最近CSDN推出了基于gitlab的codechina.csdn.net,你赶紧来试试吧

    在这里插入图片描述

    在这里插入图片描述

    展开全文
  • 物联网本质是什么?

    万次阅读 2017-03-20 17:12:43
    物联网的本质是什么? 为何提出这个问题,是始于张利老师的《营销赢思维》的讲坛。 所以才对自己所处的行业做一个剖析,看看到底什么是物联网的本质? 在写这篇之前,如果有人问我自己所处的行业, 我的回答就是...

    物联网的本质是什么?

    为何提出这个问题,是始于张利老师的《营销赢思维》的讲坛。

    所以才对自己所处的行业做一个剖析,看看到底什么是物联网的本质?

    在写这篇之前,如果有人问我自己所处的行业,

    我的回答就是“物联网”,

    如果这个人接着问:“那什么是物联网?”

    我就会简单地回答说是“万物互联,物物互联”;


    研究一个事物的发展,必须需要看清事物的本质!

    所以对于自己所处的行业,也需要观其本质,看其发展方向;

    于是我就“墙内问百度,墙外问谷歌”;


    物联网答案或定义的找寻:


    下面我们来看看我能摆渡到的答案:

    1、百度词条的答案:

    最初在1999年提出:即通过射频识别(RFID)(RFID+互联网)、红外感应器、全球定位系统、激光扫描器、气体感应器等信息传感设备,

    按约定的协议,把任何物品与互联网连接起来,进行信息交换和通讯,以实现智能化识别、定位、跟踪、监控和管理的一种网络。

    简而言之,物联网就是“物物相连的互联网”。


    2、《物联网研究报告连载》

    中国互联网络信息中心分析师  李长江的

    物联网的定义:

    “物联网是通过射频识别(RFID)、红外感应器、全球定位系统、激光扫描器等信息传感设备,按约定的协议,

    把任何物品与互联网连接起来,进行信息交换和通讯,以实现智能化识别、定位、跟踪、监控和管理的一种网络。”
    “物联网是未来互联网的一部分,能够被定义为基于标准和交互通信协议的具有自配置能力的动态全球网络设施,

    在物联网内物理和虚拟的“物件”具有身份、物理属性、拟人化等特征,它们能够被一个综合的信息网络所连接。”


    “物联网是指各类传感器和现有的互联网相互衔接的一个新技术。”


    “很多物体不一定非要连到网上,而且物联网不是网络而是应用和业务。”

    “物联网,本质上是国民经济和社会的深度信息化。”

    3、《物联网白皮书》

    将物联网体系比喻成了一课树:


    4、虎嗅网:《物联网:一个已被用滥的词,真的在酝酿浪潮》

    物联网1.0时代:本质上是传统行业信息化;
    物联网2.0的时代,最关键就是突破孤岛、实现各种应用的互联。

    物联网2.0:

    4.1、任何物之间可互联;
    4.2、物与物相联形成开放的基础物联网络;
    4.3、基础物联网络为上层应用提供开放接口;
    4.4、上层应用独立于基础物联网络。


    5、刘海涛:物联网四大本质特征



    2011年10月20日,第二届中国国际物联网大会开幕式在江苏无锡举行。

    图为无锡物联网产业研究院院长、国家物联网基础标准工作组组长刘海涛博士做主题演讲。

    新华网 陈竞超 摄\
     无锡物联网产业研究院院长、国家物联网基础标准工作组组长、国家传感网标准化工作组组长刘海涛博士在出席第二届中国物联网(传感网)博览会开幕式时说,物联网以感知为目的,它推动的是一个什么时代?
    我们在这里称,它将推动的是一个信息技术的社会化时代。计算机推动着智能化,通信推动着网络化,而物联网是以感知为目的的推动人类的信息技术进入社会化时代。


     首先看一看,三个网络仔细分析一下,通信的网络,手机、固话,通信网络目的是什么?是为了连通,把两个目标连通以后实际上就不管了,是以传输和连通为目的的。那互联网呢?互联网关心的不是联通了,它关心的是共享,咱们上网看新闻、看电影等等,互联网的核心目的是共享。那我们再看看互联网和物联网,物联网关心的是什么?互联网关心的是信息的内容,关心的是内部,最关心的是你存放在互联网内部的信息内容,每条新闻等等。而物联网关心的是什么?物联网关心的是外部的事件、外部的环境和外部的目标。那么这点和互联网差别就很大了,互联网关注内部的信息,这条新闻在那,你看我看他看都在那,是确定的。但物联网关注的外部事件,目标、环境是不可预知的。比如在这个会场我要感知进来了几个人,你不能说那不行,你只能说在8点01分时进来一个男人身高1米82;而外面不能下雨也不能刮风,这是不可能的。物联网关心外部的事件是不可控的,是不可预测的,这就跟互联网之间是有本质差别了,一个内容是固定的,一个是不确定的,是不以你的意志为转移的。咱们说通信的网络带来的是一个网络空间东西的话,那么我们的互联网给我们带来的是一个信息空间的东西,而物联网给我们带来的是一个物理空间的世界,因此这三大网络是有本质差别的。我们的手机是传输的网络,互联网是共享的网络,物联网是感知的网络,但不准确,应该叫感知的信息系统,后面我会讲到这一点,为什么把它叫感知的信息系统。


     大家想物联网是物和物的互联,其实物和物的互联不是物联网独有的特征。互联网连接的是计算机,计算机又不是人,也是物和物的互联。因为物联网特征是以感知为目的的,以全新的社会化体系为特征的,全新的综合信息系统。另外,大家很多说物联网要传感器、数据采集、传输、处理,这是典型的物联网,如果按照这种架构的话,如果物联网规模大了以后是很难实现的。物联网不能靠传感器采集、传输、处理来解决我们对于外部事件、外部目标、外部环境的不确定的感知,这是一定做不到的,因为他需要像人类社会一样的,能够对这些目标,不可预知、不确定的目标环境来感知才能做到这一点,为什么要社会化?因为这些人,我们形成一个团队以后去处理什么事情?突发事件一样的处理,这就是为什么要求物联网是具有社会化的感知体系才能做到,真正对外部、客观物理世界不可预知、不可确定的感知。如果说是采集、传输、处理是大家所说的传统的遥测系统,那么物联网刚才我简要讲了几大特征。物联网有四大本质特征:第一关注外部世界,这个我已经说过;第二正因为关注外部世界,因此它关注的内容是不确定的;第三是不可复现的,刚才说这个大门进来一个身高1米82的男性,是不可能重复出现这个事件,因此物联网感知的目标是不可复现的;第四既然是这样物联网必须有对外部事件、外部东西的高度适应能力,怎么高度适应?是来源于外部驱动性的。因此形成了物联网四大本质特征,就决定了物联网全新体系的诞生。

    6、物联网还原“物”的本质

    深圳物联网技术研究院院长    张晓峰


    7、物联网本质上是超级感知

    《中国人民大学学报》 2011年第4期

    物联网的本质、面临的风险与应对之策 ------刘永谋 吴林海


    物联网本质上是超级感知

    从形而上层面看,物联网的本质可以归结为超级感知。所谓感知,指的是感觉加智能。

    物联网中的物通过感觉层感知,通过计算层获得一定程度的智能,具备了某些类似主体的特性。

    所谓超级,指的是物联网感知的本质属性。


    8、物联网的本质还是互联网

    知乎中有更经典的回答:

    作者:袁karlno
    链接:https://www.zhihu.com/question/19751763/answer/95871992
    来源:知乎

    物联网的本质还是互联网,只不过终端不再是计算机(PC、服务器),而是嵌入式计算机系统及其配套的传感器。

    这是计算机科技发展的必然结果,为人类服务的计算机呈现出各种形态,如穿戴设备、环境监控设备、虚拟现实设备等等。

    只要有硬件或产品连上网,发生数据交互,就叫物联网。不过物联网的概念目前被炒到过热。

    鄙人大概十年前开始学习嵌入式,那个时候还没物联网、智能硬件这么高大上的字眼。相信很多前辈那时跟我一样,学的是单片机编程,大家都用“单片机”来概括这个行业。

    大概2012年左右,很多热钱从房市涌出,投入资本市场。正是这个时候,一大波高大上词汇来袭。

    服务器技术叫“云”,单片机叫“智能硬件”,网络单片机应用叫“物联网”,车载单片机应用叫“车联网”。。。呵呵。

    这种现象是商业进展的必要性,我们搞技术的只能跟着改头换脸,谁叫发薪水的是老板呢,呵呵。

    不过受限于技术上的瓶颈,物联网的发展,其实无法像当初互联网那样爆发。或者换通俗一点的说法,大家有没有发现很多物联网的应用,

    其实是锦上添花的东西,需求性并没有那么强,这也就是为什么很多智能硬件卖得并不是很好的根本原因;

    正是因为需求性原因,所以商业上也不会出现滴滴打车那样的持续性投入,又一定钳制了技术的进一步发展。


    个人认为的物联网的本质:

    通过智能化的设备间的互联、互通、互操作,来满足人们的不同的心理或生理上的需求;

    智能的本质是什么

    智能,目前而言,它是一个用烂了的字眼!厂家为了自己的产品更好卖,于是就在自己的设备前面加了一个“智能”。

    而实际上并不是真正意义上的智能。

    我认为的智能:智能设备的本身,不是为了智能而智能,而应该减少设备相互操作过程中人的参与度。

    比如:自动冲水马桶,我就感觉比较智能,至少当你靠近它的时候,他知道你来了; 当你离开的时候,它知道你走了,它就可以自动冲水。

    而目前的一大堆智能产品中,使用人并没有自动化的感觉,智能产品(ˇˍˇ)向儿童的玩具一样,玩了一次就再也提不起兴趣玩第二次了。。。


    互连、互通已经解决了,而物与物间的操作目前只满足了一小小部分。

    而真正意义上的智能,却没有实现。

    记得有一个做智能家居的讲过一句话:高调做家居,低调做产品。

    意思就是:家居,本身就应该做个高大上的东东,产品则处于第二级,用户看不到你的设备,却能感受到他的存在。

    而处于国情,上来就打价格战,所以家居家居叫了很多年了,还是看不到出路,就如同屋子里那只趴在玻璃上的苍蝇,“前途光明,出路却没有”。


    后来看到曾鸣教授在长江商学院的演讲《何谓互联网的本质》,倍感亲切,确实是道出了物联网的未来趋势那就是以大数据的普及来终结。。


    下面是从其微博上的转载文章《何谓互联网的本质》


    《何谓互联网的本质》 曾鸣教授


         我从99年开始研究互联网,2003年开始做阿里巴巴的战略顾问,2006年正式加入阿里。每一次我觉得对互联网刚有一些了解,就发现很快又困惑了,所以互联网真的是变化非常快。即使经过了14年,我仍然觉得互联网的整个变革才刚刚开始,前面的路很长,但是对大家来说机会依然非常大。所以今天想把这几年的一些心得,跟大家做一个探讨。


         互联网到底是什么?大家听得太多了,而且各种各样的名词也非常多。我觉得大家了解互联网,只需要三个词就够了:第一个是“互、联、网”。我越来越觉得这个词翻译的太美丽了,所有关于互联网的本质都讲完了;第二个词是云计算;第三个词叫做大数据。这个大家可能听得都厌了,但实际上互联网的本质就是这三个词。


    (一)互、联、网

    1、联



         互联网最关键的是什么呢?互联网的起步是“联”。英语的互联网是两个词,一个叫Internet,一个叫Web。Internet更多是指类似思科、华为这些企业它们建的互联网基础通讯架构,它指的是真正让人、让世界连起来的网络设施。最早联通的目的就是把互联网基础设施建起来。所以大家要理解互联网第一个关键是“联”,这个联接是整个我们今天这个世界的基础。


    1)最早大家说的Internet 1.0,指的是PC有线互联网。PC最早的连接只能通过电话,然后再通过宽带,都需要PC、线。

    2)现在比较热门的是Internet 2.0,即无线互联网。最典型的是WiFi、3G、4G这样的通讯网络,与此同时,沟通的重心从PC走向了智能手机。这两年智能手机高速发展,在智能手机上衍生出来了许多服务,大部分人是离不开的,离不开微信、离不开未来的“来往”。

    3)真正的Internet 3.0是什么呢?我现在没想到一个更好的词。但有一个同样也被炒烂的词,叫物联网。



         如果用一句话来定义互联网的未来,就是“任何人、任何物、任何时间、任何地点,永远在线、随时互动”,这才是未来的互联网。有的研究报告提到,今天我们能连起来的东西还不到1%,如果连接的东西翻100倍的话,这是怎样的概念?所以未来的互联网是把所有人、所有的物,在任何时间和地点,都能连接在一起,而且让大家有信息和动作的互动,有上传、有下行,这才是互联网的未来。整个互联网的发展,本质也是让互动变得更加高效、更加方便、更加自然。这个互动也包括人机的交互,像iPhone的出现对人机交互也是一个大的突破。


    2、互



    1)如果我们借用这个架构来讲互动的话,互动1.0就是BBS。我想最早的用户还有印象,当年大家在一个很简陋的技术环境下,以极大的热情参与了这样一个网络社区的建设。

    2)互动2.0是类似新浪微博这样的产品,是个互动的社区,它最大的特征是单向的关注。“关注”是它最主要的一个产品形态及互动模式。

    3)互动3.0是Facebook、微信这样的产品,它们最大的特点是双向互动,任何人跟任何群体之间,都可以在瞬间发生多维的互动。这是“互动”的一个深入。



    3、网



         在“连通”的基础之上,有了这样深入的互动,我们可以看到在Internet之上承载的内容与服务的表现形式,即Web。


    1)Web 1.0,是大家最熟悉的门户概念,

    像新浪、搜狐、网易。在Web的展现即对互联网的应用,在1.0门户阶段虽然有互动的元素,但最本质的沟通模式还是多对一,还是传播,所以大家把它叫做新媒体。这个时侯新浪、网易涌现,大家对互联网的理解是在“新媒体、新传播”。它是从门户这个中心点出发,向比原来受众大得多的一个凹点持续的传输,它有一个中心点,基本是一个单向的互动。



    2)Web 2.0是搜索。

    到了2.0时代,在搜索界面上还是多对一,每个个体跟搜索引擎发生联系,搜索的后台技术,完全利用了互联网的网状结构。谷歌在搜索技术上最早的知识产权,叫PageRank。如何确定互联网上所有内容的相关性?PageRank是根据每个网站跟其他任何一个网站的连接,来判断它的重要性。你的连接越多,说明有越多的人关注你,你的相对重要性就高。它是依靠非常复杂的算法,在后台把网络的优先级做一个排序,然后根据每个用户的输入(即每次点击),再进行优化。所以搜索引擎的核心就两个,第一个是它对网页的Index做的要全,要把全部网页都搜罗过来做一个结构化的处理。谷歌可能有几百亿的网页,并且随时都是在更新的。第二个就是算法,能不能算得出来这么复杂的数据之间的相关性、优先级。所以到了2.0时代,它的后台已经是一个网状的结构了。



    3)Web 3.0是SNS,双向互动的社交网络,

    它是一个多对多,同时包含点对点的天然网络。所以web 3.0是互联网产品进化到今天的一个先进的形态。



         这是我想要给大家讲的第一个主要的观点,就是从“互、联、网”三个字来讲互联网的本质,这三个字是共同演进的。只有随着连接的技术不断发展,互动的手段才更加丰富、高效,才会在Web上产生这样先进的内容和服务。


    (二)云计算

        第二点想跟大家讲的关键词是云计算。


       云计算是一个非常形象的词,更学术的词叫utility computing,我们把计算当做一个公共事业来提供。阿里巴巴十周年的时候(2009)我们成立阿里巴巴云计算公司,当时还有人开玩笑说,是不是因为马云才叫云计算公司?我们说也许马云就是符合这个时代的。云计算的确是表达了这样一个远程的、大计算的概念。


        我自己对云计算的理解,是通过研究对整个工业史,才理解了云计算的社会地位。最好的对比是第二次工业革命。第二次工业革命本质上是电带来的工业革命。电是1893年爱迪生在曼哈顿, 在一平方公里范围内第一次实现了商业化的电的传输跟网络。在一平方公里内,每个街区、每个住家、每个商店都有了电的照明,这是个复杂系统。大家都很熟悉爱迪生发明电灯泡的历史,以及他的电灯泡公司、发电厂,包括全套设备,以及发电的工艺。所以1893年是电的第一次商业化应用。


         当电出现了之后,当时如果工厂需要用电的话,必须雇一个专门的高管,他的责任就是给这个工厂建一个发电厂、要买发电设备、要雇专门的发电运营人员、要买煤。住家同样也没有这种公共服务,J.P.摩根在新泽西的住宅,是全世界最早用电的民用住宅。他那个别墅被烧过两次,就因为早期用电太不稳定,经常用着用着就烧掉了。当然因为他是通用电气最主要的投资商,也是爱迪生最重要的支持者,所以他自己一直在努力的尝试。


         最重要的变化在于1905年,美国在尼亚加拉大瀑布开始建设了第一个大型中央发电厂,然后在尼亚加拉大瀑布跟纽约市之间建了一个高压传输网络。如果没有高压传输的话,电的远程传输损耗很大,于是开始有了电网的概念。到1925年美国通过国家电网供电的比例占到40%。大概到一九三几年这个比例提高到百分之七八十。正是因为国家电网的出现,“电”变成一个公共基础设施,所以很快有了美国在第二次工业革命期间的高速发展。


         我通过两个故事讲一下在新的技术革命当中企业家的选择。第一个是福特公司,我们讲到第二次工业革命期间最典型的形象,就是卓别林在《摩登时代》里面饰演的流水线工人。工业时代最经典的起步,就是福特公司的T型车下线,一般大家都把它当作工业时代真正的到来。福特公司的T型车流水线是全世界第一条用电驱动的流水线。福特本人本来是通用电气的电机工程师,但他没有在GE继续工作下去,却进一步把发电设备进行完善,他把电的理念用在了一个通用制造的领域,创建了现代制造的一个起点。今天我们所讲的流水线、大规模生产、中产阶级的概念也是福特最早创造的。大规模生产是标准化的运作,为了降低成本,他给工人提高工资,依次把工资提高到五块钱,工人有了工资就能买更多的车;买了更多的车,车的成本进一步下降;车更便宜之后,会有更多的人能买车,这是一个正向循环。所以汽车价格在十年之内降了十倍。


         第二个例子也很有意思,当电出现之后,爱迪生把通用电气变成了一个发电设备制造商,但是爱迪生当时的助理坚持认为,整个社会的未来是电网而不是发电设备,所以他从通用电气辞职,出去创建了第一个电网公司,最后这家电网公司变成了美国最大的。在一个新技术革命到来,当新的选择出现之后,企业家的洞察力发挥着重要作用。


         我们再回到主题。100年前最重要变化,是电变成一个通用的公共事业,从而带动整个社会生产力的向前发展。电走入各家各户之后,第一个家电产品是电熨斗,因为它对家庭主妇来说帮助最大,技术难度也是最低的。第二个重大的产品是洗衣机,把人们从繁重的劳动解放出来。第三个是收音机,收音机一出来,家电革命真正的开始了,就是我们今天无处不在的电器。这些都是在通用技术达到一定的社会覆盖率之后才产生的。家用电器诞生的核心,是因为有一个标准的建立,即110伏的标准接口。这样所有的电器只要接到110伏标准插口,跟国家电网就接起来了。


         所以了解这个大变化之后我们就能理解,七十年代以来,在整个美国任何一家企业的固定资产投资当中,50%以上是投在跟IT相关的地方。现在要创建一家公司最起码得买电脑,雇几个IT人员,还得有几个软件。这就像1900年左右,工厂要开工,得先雇人来建发电厂一样。


         现在最大的问题是,绝大部分企业IT投入的实际利用率不到30%,无论是CPU、存储、带宽,还是各种各样的人员投入。所以一方面是越来越重的固定资产投入,另一方面是越来越低的效能。由于技术的积累跟逐步的演进,这个时候云计算诞生了。1946年的第一台计算机,它的计算量还比不上我们今天放“生日快乐”的贺卡的计算量。经过了大型机,小型机,再到PC,笔记本,经过六十多年一步步走到今天,人们终于能够以公用事业的方法来提供计算能力。所以用一句话来总结云计算,就是在任何时候、任何地点,只要接上互联网,就有计算能力的提供。你要多少用多少,用多少记多少,这就是云计算。


         大家可以想想看,当未来再开一个公司,不再需要去雇IT人员,不再去问他们“我们到底要买什么软件”的时候,当你所需要的只是使用你想要的服务的时候,这个世界会发生怎样的变化?因为技术门槛大大降低,所以“创新”以一种前所未有的方式再一次爆发。


         回顾一下过去十年的互联网创业企业,最大的一个壁垒是固定资产投入。一个创业企业家,好不容易有一个非常好的想法,然后去融资,要稀释掉30%-40%的股权,还得预先买服务器。为了未来你可能达到、也可能达不到的事业,你用最昂贵的股权,换来的却是最不值钱的IT固定资产投入。而这个规律正在逐步被打破。


         我再举两个例子,第一个例子是动漫产业。大家都觉得动漫产业是创意产业,后来接触多了我才明白,创意在动漫产业大概只占1/3左右,动漫产业是一个固定资产投入巨大的产业。为什么只有皮克斯这样的动漫企业才能够制作这样的大电影?很简单,在整个动漫变成电影过程中,最大的一个投入叫渲染,就是把原始的画,变成3D的影像。一个像样的动漫公司,至少需要1000台以上的服务器,才能勉强做渲染工作。越大的企业越有这个优势,小的创业团队根本没有办法把创意变成一个相对高质量的产品。


         2009年我们开始做云计算,经过三年的努力,我们给动漫行业提供了一个比较成熟的技术方案。今年上映的一部类似好莱坞的动漫大片叫《昆塔》。如果他们用自己的投资去买服务器做渲染,大概需要两年左右才能完成渲染。但是我们用淘宝的技术,大概两个月时间就把所有渲染都完成了,成本不到原来10%。淘宝的计算机群的计算量是非常大的,每天有将近一亿的人访问淘宝、有几百万的卖家、几亿的商品,高峰的时候占用资源非常大,但是半夜的时候我们可以把这个计算资源释放出来,给这个动漫公司做渲染。所以一下子就把动漫行业的创新周期缩短了。


         第二个例子是双十一,大家都知道去年创造了一个很惊人的数字:190个亿。去年双十一是我们第一次给淘宝卖家提供云计算服务。最经典的一个例子是有一个卖家,在双十一的上午系统崩溃了,我们用了不到一个小时的时间,在云计算的平台上帮他重新启动了全套的服务,卖家基本没有什么损失。这就是云计算的最大好处,可以瞬间扩容,你想要多大的空间,就有多大的空间。去年有个淘宝卖家平时的单量,可能也就一万多单,双十一那天冲到了50万单。50万单是什么规模?是某个电商一天的订单量。而淘宝的一个卖家在没有任何IT投入的情况下,就在淘宝云计算的平台上完成了。大家可以想想看他的成本优势是多大。正是由于这样的一个优势,今年的双十一,80%以上的天猫订单,都会绑在云计算的平台上。去年我们冒着很大的风险做了一个实战演习,有百分之十几的商家用的是云计算的服务,很成功的度过了一个巨大的峰顶。今年我们对于云计算的信心、对它的商业价值都有了根本的认识。


         所以再跟大家总结一下,云计算跟传统的IT自营的思维有所不同。


    1)首先,传统的IT企业,在IT的投入属于固定资产。云计算作为一个公共服务来说,是一个运营费用,一个可控的运营费用,这个费用对整个资产结构、财务状况的优化,产生的价值是不可估量的。

    2)其次,大部分IT设备作为自营的时候,是为了保证最大值时的使用,一定有巨大的浪费,绝大部分企业的平均使用率不到30%。使用云计算的时候,是按照电费的方式每个月结算,实际用了多少计算量,根据账单来付费,这样基本上没有任何的浪费。

    3)最后,传统的IT方式,扩容得周期长、门槛高、投资大,技术门槛越往上越高。大部分企业做到一定程度,投了IT就投不了其它方面。但是用云计算可以享受最先进的技术,比如说安全。一方面大家肯定会关心任何一个公共服务平台的安全性;另一方面由于安全性如此重要,一个公共的平台对安全的投入,一定远远超过任何一家企业。去年一个资源型的网站,发表了对某个IT公司不太有利的言论,结果网站遭到了恶意攻击,两小时就被攻跨下线了。后来这个资源型网站搬到了阿里云计算平台就安全了,因为要攻破阿里整个安全体系,难度就非常大了,但是一个小企业不太可能有这样的安全防护。所以采用这种方式,就不怕顶尖黑客或是这样的恶意攻击了。这就是平台跟一个企业之间的差别。



         瞬间扩容,不用为空置去付额外的代价,这是云计算非常大的商业价值,最后总结一下对云计算讨论,还是刚才那句话,将来在任何时候、任何地点,都能够通过接到互联网获得实时的服务,然后根据实际使用支付费用。


         当云计算成为这个社会基础服务设施的时候,我觉得人类才真正进入了新的时代。如果不是电变成了公共事业,不是福特在电的基础之上创造了第一条流水线的话,也就没有什么工业时代。同样,只有当越来越多的企业,把他们的运营放在公共的云计算平台的时候,一个新的时代才真正到来。


    (三)大数据

         第三个我想跟大家讲一下大数据,这可能是近一年来最时髦的词了。大数据真正的本质不在于“大”,而是在于背后跟互联网相通的一整套新的思维。大数据跟传统的数据最大的差别在哪呢?


    1)在线。

    首先大数据必须是永远是在线的,而且在线的还得是热备份的,不是冷备份的,不是放在磁带里的,是随时能调用的。不在线的数据不是大数据,因为你根本没时间把它导出来使用。只有在线的数据才能马上被计算、被使用。



    2)实时。

    大数据必须实时反应。我们上淘宝输入一个商品,后台必须在10亿件商品当中,瞬间进行呈现。如果要等一个小时才呈现话,我相信没有人再上淘宝。十亿件商品、几百万个卖家、一亿的消费者,瞬间完成匹配呈现,这才叫大数据。



    3)全貌。

    大数据还有一个最大的特征,它不再是样本思维,它是一个全体思维。以前一提到数据,人们第一个反应是样本、抽样,但是大数据不再抽样,不再调用部分,我们要的是所有可能的数据,它是一个全貌。其实叫全数据比大数据更准确。



         这是大数据的三个本质,在线、实时、全貌。


         为了让大家对大数据有更多的理解,我再把它展开跟大家讨论一下。大家做企业,最容易想到的两个数据应用,一个是市场调研,派个市场公司或市场部门做一个调查,去看下各公司什么反馈。第二个就是商业智能BI、数据挖掘,查看数据经营的报表。这是最传统的两个数据应用。

    这样的数据应用有几个典型特征:



    1)要知道准备达成的目标,从而主动收集这些数据。

    由于每个企业的计算能力跟成本不一样,数据数据保留多少时间、哪些数据能用,是有所不同的。而大数据是实时的记录数据。原则上,任何人上任何一个网站、做的任何事情,所有事情都会被记录下来,没有人事先做区分。所以大家不再去问,是数据就记录下来,所以这是第一个差别。


    2)第二个差别:参与的人不再是有意识的参与,而是无意识的参与,你是为自己的利益在做事情。

    你用一次搜索,你就参与了谷歌的大数据搜集,因为你的每次点击就是一个数据来源。如果让你参加一个市场调研,80%的情况下你会拒绝,15%的情况下你可能会要求某种意义上的补偿。很少有人愿意主动的参加市场调研,因为对你来说是个负担。但是线上的大数据对绝大部分人来说,完全是一个无意识的、自利的行为。我上淘宝就是为了买东西,我上微博是为了看新闻,我上百度是为了搜索,你都是为了自己利益而触发的一个无意识的行为,但这个无意识的行为,都为大数据做了贡献。


    3)第三个差别,一个是单向,一个是双向。我们以前做的数据分析也好,都是先假定一个目的,然后拿到现成的数据,分析行为,来测试我的猜测。

    这些都是有一个单向的主导。大数据本质上一定是双向的,就像搜索,你点击搜索引擎点击的时候,你是给它输入了数据,它给你的结果就是它与你的互动,就是它带给你的数据价值。这个大数据本身也在随时为你创造价值,这样的话就变成一个双向互动的正循环,双方都给对方贡献了数据价值。任何大数据应用,如果在设计时就没有这种双向、互利的正循环的话,是跑不起来的,本质上就不是大数据。


    4)最后一点还想强调的是反应速率,大数据的数据价值越大,它的反应速率就要越高。

    比如说谷歌的搜索,你输入一个关键字看到的结果,跟一个小时以后再输入同样的关键字得到的结果,很可能已经不一样了。因为它已经把一个小时内全球所有的点击重新计算了一遍,然后把信息做了结果优化再反馈给你。所以大家可以想想看,反馈的速度越快,它创造的价值越大,消费者参与的动机就越大。数据越跑越大、反应越来越快、结果越来越好、用户参与会越来越大,才能变成一个黑洞效应。这是我想讲的大数据的核心概念。


         互联网的本质,讲完这三个词基本上已经讲完了。我给大家提供的是一些最基本的思考工具。你怎么用这种思考的方法去解决问题?最重要的是有互联网的思维,你先有了互联网的思维,你才能够去用互联网的技术。


         讲完了一些最基本的概念之后,接下来给大家再介绍一下基本的推论。基于互联网的本质,我们会得出一些什么样的结论?


         互联网的精神是什么?什么才叫用互联网的思维做事情?我刚才讲的那三个,已经把评判标准告诉大家了,拿这标准往上一套,基本上就知道是不是大数据的应用。

    那么互联网的精神是什么呢?



    1)平等。

    为什么是平等?这是由技术决定的,就像生产力决定生产关系。一个网状结构的互联网,是没有中心节点的,它不是一个层级结构。虽然不同的点有不同的权重,但没有一个点是绝对的权威。所以互联网的技术结构决定了它内在的精神,是去中心化,是分布式,是平等,是互动。平等是互联网非常重要的基本原则。


    2)开放。

    为什么要开放?你越开放,你跟别人的连接就越多。在一个网状社会,一个“个人”跟一个“企业”的价值,是由连接点的广度跟厚度决定的,。你的连接越广、连接越厚,你的价值越大,这也是纯信息社会的基本特征,是由你的信息含量决定你的价值。所以开放变成一种生存的必须,你不开放,你就没有办法去获得更多的连接。


    3)互动。

    无论是从互联网还是从大数据的角度,一定是双向的,互动才创造价值。其实“来往”本身就是互动,有来有往嘛。


    4)最后一个最实际的,是迭代。

    什么叫迭代?一个想法也好,一个产品也好,得先有原型,扔出去、用起来、别人给你反馈、你把坏处修正,这是一个实时互动的过程,而不再是理论。无论是研发产品还是提供服务,各个方面不再是原来那样通过一个看起来严谨的理论来实施的,更多的是通过实践、通过优化来逼近。所以更多的是计算,不再是数学理论。这是很大的一个差异。


         以统计为例,统计的理论都是在计算能力不够的情况下,用一种算术的方法找到最想要的,能够倒推出总体的状态。统计所有的力量都集中在理论、数学理论,而大数据所有的力量都集中在算法的优化。我根本不假定理论,我只是通过一轮一轮的迭代中回归,来逼近真实。用户的需求是什么?首先打出去,然后再校验,只要有双向的反馈,我总是离真实越来越近。所以迭代是互联网整个产品的最关键的一个基石。跟这相关的还有A/B test,这也是互联网的特殊性跟它的技术架构决定的,比如说要测试任何一个产品,我可以把淘宝流量的1%切出来,先给它试这个东西,试完这个程度我再把它放大到20%、80%。迭代跟A/B test的结合使用,让互联网企业的效率远远超过传统企业所能想象的。


    5)第五点是演化,而不是计划。

    大家应该有一定的感知了,我刚才讲的迭代也好,A/B test也好,它本质上不是通过一个完美计划来实现的,而是通过一种演化的方式,来逐渐优化、接近更好的状态,这是互联网精神。


         我总结互联网的精神就是,平等、开放、互动、迭代、演化,就这5个。既然是叫精神就要深入骨髓,贯彻到你的产品、服务、团队、组织、运营当中去。


         最后总结一下,互联网到底给我们带来什么?从一个最大的角度来说,互联网让我们从工业文明走向了信息文明,从工业经济走向了知识经济。这些话喊了二三十年,正是因为不断的喊,今天我们才可能跨过这个门槛。我把云计算的普遍使用,当做这个社会进入信息时代的标志。当然云计算作为一个公用事业,达到30%或40%的覆盖率,可能还需要十年左右的时间。但是我们应该已经像100年前状态,即1910到1920年这十年快速发展的状态。同时正是因为有了云计算,大数据变成了可能。如果没有海量数据的存储和计算能力让成本变得非常低廉的话,根本不可能做大数据,数据的成本就把你压垮了。


         我们在从一个机械系统的时代走向一个生态系统时代,从工业文明走向信息文明,从工业经济走向知识经济。从这个角度看,如果说农业文明时代最重要的资产是土地跟农民的话,工业时代则是资本、机器(机器是固化的资本)、流水线上被异化了的人。工业时代早期考虑最多的是异化的人,因为人也被当做机器在处理。福特另外很有名的一句话是“我根本不需要你们的脑袋,我只需要你们的手跟脚”,所以人只是流水线当中的螺丝钉。资本跟异化了的人,是工业时代最重要的生产要素。到了知识经济的时代最核心的资源,是两个新的东西,一个是数据,一个是知识工人(知识工作者),就是德鲁克在上个世纪末讲的Knowledge Worker。大家可以看到资本“Capital”,在未来再也不会占据那么大的重要性。当然我们整个社会的变化、生产关系的变化总是落后于生产力的变化,所以资本市场的整个评估,还是以股东利益作为最大化作为基本指导思想。企业的管理也会从传统的多层次走向更加扁平、更加网络、更加生态的方式。让Knowledge Worker真正能够创造价值,变成任何一个组织和整个社会最重要、最需要突破的地方。


         我附带提一句,大家要看书的话,有本书还是最经典的,就是德鲁克写的《21世纪的挑战》。这是写得最经典的一本书,对未来整个大趋势的变化,用最通俗易懂的方法,阐述了知识经济对于我们每个人到底会怎样。大数据只是知识经济落地最实在的切入口,当云计算有了大数据、有了互联网这样的基础后,这三者是三位一体的。没有云计算,就没有大数据,云计算是为大数据服务的,而整个互联网输出的就是计算能力。人们提过super computer超级计算机,而互联网就是最大的一台计算机,它输出的就是全社会所有需要的计算能力。


         当这三位一体的东西开始走向正向循环的时候,知识经济就真正开始了。在这个意义上,我们面临着跨时代的变化,而且一切才刚刚开始,未来还有太多太多的可能性。如果不是100倍空间的话,至少几十倍的空间是能看到的。任何一个大型技术革命,早期大家总是高估它的影响,会有一轮一轮的泡沫;但是中期大家往往会低估它的影响,觉得这些不过是概念而已。当你觉得它是概念的时候,它已经开始生根发芽,开始茁壮成长。


         本文内容根据2013年发表的主题为“互联网本质”的演讲整理编辑。

    具体链接地址参见:

    http://www.weibo.com/ttarticle/p/show?id=2309403991301946236807#_0

    展开全文
  • 机器学习的本质是什么

    千次阅读 2018-02-23 11:43:34
    机器学习方法本质上是人类认知方式的新世界,是人类的未来。工业革命解放了人类的体力,以机器学习技术逐步解锁的人工智能革命将解放人类的脑力。这不是技术层面上的进步,而是从根本上改变人类认知世界的方式。长久...

    机器学习方法本质上是人类认知方式的新世界,是人类的未来。

    工业革命解放了人类的体力,以机器学习技术逐步解锁的人工智能革命将解放人类的脑力。

    这不是技术层面上的进步,而是从根本上改变人类认知世界的方式。

    长久以来,人类对事物的认知经由三个步骤:原始数据——专业知识/经验常识——认知。

    这里的原始数据指得是可被人类感知到的一切客观存在之总体,既包括理工范畴内的计量数据,亦包括文史范畴内的事件与现象。

    面对同样的原始数据(股市数据,仪表指数,社会现象等),拥有不同知识的人将得出不同的认知;同样,拥有相同知识的人,面对没有数据、有少量数据、有大量数据以及有充分数据等不同情况时,也将得出不同的认知(信息均等博弈,信息不对称博弈)。

    那么究竟是知识重要还是数据重要?

    在人类历史很长一段时间内,无疑是知识的拥有者占据了上风。

    而机器学习方法的出现,则将这个趋势彻底扭转。

    或许,“知识”未来将一文不值,而“数据”,才是价值连城。

    机器学习的本质,就在于建立了(原始数据——认知)之间的直接映射,跳出了“知识”的束缚。

    从此,人类的认知方式改天换地。

    因为,从此我们或许再也不需要那冗桎的“知识”。

    一,什么是“知识”:

    事实上,“知识”也产生于“数据”。

    因为人类全部“知识”的产生过程如下:

    1)最初的人类不具备任何“知识”。

    2)人类所取得的任何“新的知识”,都是灵感来源于“数据”、推导基于“已有知识”、验证于“数据”。

    所以,所谓“知识”,只是对数据之间客观联系全部总体的系统化、逻辑化、因果化了的描述方式,正如“系统”、“逻辑”、“因果”这三个词背后所代表的哲学意义一样,都是客观上并不存在,只是被我们人类人为地创造出来用于认知的工具而已。

    用以凭借人脑这一低效的处理器与存储器去理解这无限复杂的世界而不得不妥协的产物。

    更直接地说,“知识”其实并不是客观存在,只不过因为人脑无法存储处理这世间所有的(“数据”——“认知”)关系,而妥协生成的一种中介机制、一种简化机制,以便于人类去理解相关“数据——认知”关系对的模块化的桥梁。例如“标签化”,正因为人脑无法存储也无法分析所有“河南人”“广东人”的数据,所以我们生成了类如“河南小偷多”“广东人吃福建人”这样的标签用于简化我们对河南人与广东人的认知。抛开这两个玩笑性质的“标签”不谈,事实上现实生活中我们对特定职业、特定阶层、特定民族所贴上的一些“标签”,本质上往往是基于最大似然估计的,这样当我们在没有更多后验信息的条件下与一个完全陌生的人打交道时,我们通过这些标签能够高效地以最大概率的获取对此人的最近似的认知。

    其实,人类的一切“知识”都只不过是各种形式的“标签”而已,从而通过对某一特定族类数据的特殊化处理,实现高效理解能力的一种简化方式。

    当然,这种简化背后所损失掉的,是精确性。因为对事物的本质最好的解释依然是事物本身,或者说,是人类可以感知到的有关该事物的全部数据本身。就好比,要解释什么是苹果,最好的方法就是递过去一个苹果说:“诺,这是个苹果。”。而其它的类似于“苹果就是圆圆的,一般为红色的,酸甜多汁的一种水果”这样的“知识”无论多么精确,都只是人类面对自己有限的认知能力条件下的一种只好挑选出一些“简化特征”的妥协而已。

    二,什么是机器学习

    人脑处理能力不足因而需要“知识”来简化运算,但电脑不需要,相比于人脑,电脑的运算能力几乎是无限的。

    所以,电脑足以也必须担负起抛开“知识”的束缚,直接建立(“数据”——“认知”)关系库,从而以更加深邃、更加贴近世界本来面貌的视角去认知世界的重任。

    这便是机器学习的本质。

    说完了本质,那么,机器学习具体究竟是怎么样的一种方法呢?

    这是一种全新的思维方式。

    机器学习的标准范式可以表达如下:

    对于一个Task及其Performance的度量方法,给出特定的Algorithm,能够通过利用Experience Data不断提高在该Task上的Performance的方法,就称为机器学习。

    其实这个定义就是“学习”的全部含义,这个事情按照机器的思路来做,就是机器学习。

    举现在最火的Alpha:GO(也就是计算机围棋学)的例子,不妨设此处的“Task”就是一步棋路,“Performance”就是最后的胜率,“Experience Data”就是以往的棋谱。然后设计出一个Algorithm,使得构建出的“这步棋我该走到哪里呢——模型”能通过利用过往数据而取得“Performance:胜率”的提高。

    为了实现每次利用Experience data对Performance的提升,当前最主流的方法就是“误差反向传播法”。这种方法的核心思想就是:让机器自由去试错,然后根据尝试的结果与样本的真实结果之间的误差反向调整试错策略。误差较小的尝试要奖励,误差较大的尝试给予惩罚,然后将这个尝试过程一直循环进行下去,直到多学习到的结果在所有样本上的表现达到我们所定义的最优。通俗来说,这与训练一条狗去服从我们的指令或是训练自己完成题集上的全部习题等过程并没有什么区别。

    有了“误差反向传播”算法,Alpha:GO们就可以通过每次利用“Experience data:棋谱”使得自己下棋的胜率提高一点点。这便是一个机器学习方法的实例。

    因为这个“下棋机器”从历史的数据中确实学到了点什么。

    讲到这里,可能有人会感觉,似乎机器学习很弱鸡啊,随便一个棋手看看以前的棋谱也都可以学到点什么啊。

    幸运的是或者(对于柯洁们来说)不幸的是,对于机器而言,“学到点什么”就等价于“学到了全部”。

    因为它可以“一直学”。

    只要有了:

    1)合理的算法保证每次对Experience Data的学习都能使Performance提高一点点,

    2)足够的运算能力。

    这两点设计,机器的能力必将达到极值,在可获取的Experience Data约束范围内的极值。因为机器可以一夜之间学遍所有棋谱,包括古谱、网络棋谱、以及自己和自己下的棋谱。而且还能神tm能保证每次进步一点点。

    而人类棋手穷极一生可能做到这点吗?

    所以人类棋手进步的通道更多的转向了听取前辈的教诲,钻研棋理,总结技巧,或者说,转向了“知识”,人类各行各业的佼佼者归根结底都是知识的“富有者”。

    其实,在人类的学习中,也有类似于机器学习的学习过程,那便是基于千百次尝试中通过“惩恶扬善”所积累出的个人经验或直觉本能。只可惜,对于人类来说,这部分“学习结果”是无法共享的,一个老司机的开车能力是一个新手通过怎样的言传身教都无法企及的。

    而对机器而言,第一不依赖于知识,只要有足够多的病例数据,在完全没有任何医学基础的条件下也可以通过合理的算法对疾病进行诊断,且准群度媲美甚至远超一众经验丰富的“老中医”;第二,学习结果在机器间可以共享,一台机器(或者说一套算法)达到了某一高度,所有的机器便都可以达到这样的高度。(没钱买不起设备?没钱买不起数据?没钱买不起程序?)。

    三,人类学习与机器学习

    正因为计算与处理能力的差别,导致了人类与机器在学习方法上的差异。

    机器计算能力无穷无尽,所以机器学习很粗暴,有多少,学多少。其最终能达到的高度只取决于数据量。

    当数据量充足时,机器学习方法所能得到的结果,可无限逼近于事物的本质面貌。

    不需要理论,不需要知识。

    或者说,机器通过对海量数据进行学习所得到的结果,就是该问题最终极最权威的“理论”与“知识”。只是,“不足为外人道哉”,这是一种隐式的(知其然不知其所以然)“知识”。

    就好比,Alpha:GO并不懂棋理,也说不出什么理论基础,它只知道怎么下能赢,至于为什么要这么下,它自己无法解释,谁也无法解释。

    但这并不妨碍我们认可Alpha:GO已掌握了围棋的真谛。

    而人类计算能力有限,不可能做到对全部数据的充分学习。因而人类转向了一种“分布式”的处理方式,将每个人做为一个独立的处理单元各自做出一点微不足道的小贡献,同时建立起“知识”这一显式的(可阅读,可解释的)抽象表示事物关系的体系作为各个分布单元人之间传输信息的接口。

    因此,人类尽管个体能力有限,但人类这个群体却是飞速发展;同时,作为无数个体“知识”的汇总而构成的“科学”,帮助着我们每个人类依靠着自身非常低效的处理能力,也能对客观事物给出相当靠谱的解释。

    这真是“我为人人,人人为我”的境界啊。

    从这个意义上,虽然人类的自身能力有限,但实际上人类却发明了一种更为先进的认知系统。

    用于突破造物主施加于人类之上的桎梏。

    体能上的桎梏我们已经通过工业革命突破,智力上的桎梏则要交给人工智能来突破。

    四,最后

    不要小看机器学习,这必将成为人类世界的一种新的思维方式,渗透入各行各业。

    更不要小看人类,因为是人类造出了机器,这是人类“善假于物”特性在当代最完美的演绎。

    人类,永远能在自己有限的能力范围内,做出惊天动地的伟业!



    作者:sharekiller
    链接:https://www.jianshu.com/p/2dd876c82a85
    來源:简书
    著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
    展开全文
  • Andorid Activity的本质是什么

    千次阅读 2014-02-27 15:20:49
    Activity恐怖是Android用得最多且是最基本的组件了,估计也是每个学Android的人接触的第一概念,对于Activity的理解和说法,层出不穷,有人说是一个窗口,有个说是一个活动,但他的本质是什么呢?

    本文我主要通过查看Activity的实现源码和推测其设计思想的方法来探讨一下Android的本质是什么。


    Activity恐怖是Android用得最多且是最基本的组件了,估计也是每个学Android的人接触的第一概念,对于Activity的理解和说法,层出不穷,有人说是一个窗口,有个说是一个活动,但他的本质是什么呢,官方的说法是Activity一个应用程序的组件,它提供一个屏幕来与用户交互,以便做一些诸如打电话、发邮件和看地图之类的事情,原话如下:

    An Activity is an application component that provides a screen with which users can interact in order to do something, such as dial the phone, take a photo, send an email, or view a map.

    这句话概括的很好,但我并不认为这就是Activity的本质。


    切入主题之前,我们先要了解一下UI系统的职责和原理。所有的图形界面,无论是什么UI系统,都要收集用户的活动,这些活动包括打开和关闭程序,输入事件等,这样系统才能针对这些活动做出一些反应,比如程序打开时加载一个数据库,建立一个网络连接,不过针对这些活动所作出的反应都委托给了具体的应用程序,系统相当于只是把这些事件或消息转发给应用程序。下面是一个简单的图:


    这些消息怎么转发给程序呢,可以约定好,要求应程序写一个方法,或如果是C可要求传入一个回调,Java可以要求程序传入一个监听器,总之实现这个功能还是很容易的,但这么多消息,全部传到一个方法里吗,我想那样会很惨,那样可能要求你写应用程序的时候可能要写一个长长的swich语句或if语句,所以一般都把这些消息分类,如一种是整个程序的活动的消息,如关闭和打开,还有就是输入事件,如按键鼠标,每个分类里的消息还可以再细分,这样的话,就可以封装成多个类或接口,每个类有数个方法,之后应用程序重写这些类方法或实现某个接口,系统就可以通过调用这些类或接口的实例发送消息了。

    于是问题转化成了类的设计。在Windows中,有个窗口类来接受一个窗口的活动,系统就可以通过调用窗口类的方法来传递消息,这个窗口类既接受打开和关闭的活动,又接受用户输入事件。而在Android中而不同,Activity只接受打开和关闭等的活动,而不会接受输入事件,那是由Activity内嵌的Window类来接受的,然后转发给相应View,你有可能会说Activity中有个onKeyDown方法,其实那只是处理没人领的按键消息才会到达Activity。现在发现Android和Windows分发消息的的区别了吧,这样化分,每个类的职责更细了,更明确了,当然喽,Android中的消息跟Windows中的可能有点稍小的区别。


    现在应该可以很容易的理确Android的每一个生命周期对应的方法(onCreate, onStart...)其实是处理收到的消息,当用户打开一个Activity的时候,系统(严格的说应该是ActivityManager)就会调用onCreate来告诉你这个消息,这个时候你就要加载你的XML布局文件并做一些初始化。然后离开的时候,就应该把这个Activity销毁吗,如果用户是暂时离开,等下还要回来呢,如果销毁了那就又得重创建,太浪费时间了(用我们家乡话说就是太难费神了),所以不能销毁,但是系统也得通知你用户离开了(用的是onStop方法),因为可能需要暂停播放视频。当下次重新进入的时候,系统又会通知你用户又进来了,这时你可能要恢复播放了,但你有没有发现,用户第一次进入和再次进入,你需要做不同的处理,第一次可能是初始化一些资源,第二次可能只要恢复播放就可以了,所以系统应该告诉你,是第一次进入还是再次进入,于是系统就用了两个方法,用onCreate告诉你用户是第一次进入的,用onStart告诉你用户是再次进入。

    不过这还不算完,还有一种情况,用户是半离开状态,什么是半离开呢,都知道Android的界在有全屏,还是非全屏,也有半透明的,这里的半离开指的就是本界面被一个非全屏或半透明的界面盖住,总之,你还能看到一点点被盖的那个界面;全离开就是被全屏的界面盖住,用户完全看不到被盖的。这两种情况要有可能要区别对待,比如一个播放在线视频的应用,它可能希望要在用户半离开时只暂停播放,不暂停后台下载,而当用户完全离开时,播放和下载都暂停。所以系统也应该区分这种情况,于是就有了onPause和onResume来表示半离开和从半离开恢复。值得注意的是,Android中全离开包括了半离开,半离开不包括全离开,什么意思呢,就是即便是全离开,系统也是先调onPause再调onStop,从全离开中恢复,也是调了onStart后还会调onResume,而对于第一次进入,onCreate、onStart、onResume会被依次调用,所以记住,只要用户进入,无论是怎么进入的,都是调用onResume,在这里恢复播放是再适合不过的了。还有一个onDestory也说一下,就是在销毁的时候被调用,一般是回收资源或按了返回键会被销毁。现在清楚了,也顺便看一下Android官网的这张图吧:


    然后,你可能好奇系统是怎么调用到你写的onCreate方法的,有兴趣的可以查看源码的frameworks/base/core/java/android/app/ActivityThread.java,此类里面有许多handle***Activity方法,如handleResumeActivity,不过这不是本文章讨论的重点,后续有可能另写一篇讨论。

    下面我们来讨论一下Activity这个类吧,我估计很多人都忽略了Activity类也是一个类,它也可以有构造函数,你还可以在构造函数里初始化一些东西,不过请注意,Activity的onDestroy被调用时,Activity这个类本身还没有被销毁。还一点也很少人忽略,我常问应聘者Activity之间怎么通信,他们一般都会说Intent或AIDL,如果两个Activity是同一个应用的,一般是运行在同一进程中的(除非你在AndroidManifest里配置了让它们不运行在同一进程),而且一般是同一线程的,所以最简单的通信方法,莫过于在A Activity中写一个方法,让B Activity来调用,你再懒一点,直接访问变量都可以,只是风格不好。

    其它,还要说明的是,一个Activity包含了一个Window,Window才是真正代表一个窗口,也就是说Activity可以没有Window,那正好是Service了,论据就是刚刚说的ActivityThread类,他的职责包括处理Service,(ActivityThread不是Thread的子类,但他描述了主线程要做的事,具体本文暂不讨论)。Window包含了一个DecorView,这才是真正的界面元素,它是整个View树的根,你可以试试在Activity里调用下面这句代码把整个界面染红:

    getWindow().getDecorView().setBackgroundColor(Color.RED);


    另外,还有一个ViewRoot,这个和DecorView经常有人搞混,首先是它对应的类的真正名字是ViewRootImpl,然后,他不是一个View,即他不是View的子类,他的工作与视觉元素无直接关系,但他确定Android View系统的一个重要类,它是负责通信的,如果你知道bridge设计模式就好理解了,这就是一个活生生的例子啊,不过不知道也没关系,不会阻碍对下文的理解,负责谁跟谁通信呢,是负责你的WindowManager与WindowManagerSerivce之间通信,整个系统的窗口都是由WindowManagerSerivce管理的,因为所有窗口的Z-order,事件分发,都要由一个中枢统一管理才可能有秩序,这就是WindowManagerSerivce的职责了。这样说,你肯定不能完全理解,要理解还是看代码吧,路径:frameworks/base/core/java/android/view/ViewRootImpl.java。其中有一句:

    mOrigWindowType = mWindowAttributes.type;
                        res = sWindowSession.add(mWindow, mSeq, mWindowAttributes,
                                getHostVisibility(), mAttachInfo.mContentInsets,
                                mInputChannel);
    就是向WindowManagerSerivce注册了一个输入事件处理监听器mInputChannel,具体实现可以写一篇很长的文章,暂不讨论。

    这就是与Activity主要相关的信息,希望本文加深了你对Activity的理解。


    参考资料:

    官网指南:http://developer.android.com/guide/components/activities.html

    展开全文
  • 信息熵到底是什么

    万次阅读 多人点赞 2016-11-06 21:53:48
    在百度百科中的定义:信息,泛指人类社会传播的一切内容,音讯、消息、通信系统传输和处理的对象。 但信息可不可以被量化,怎样量化?答案当然是有的,那就是“信息熵”。早在1948年,香农(Shannon)在他著名的...
  • 信息检索复习笔记

    万次阅读 2020-12-17 17:14:46
    信息检索复习 第一讲 搜索 ...信息检索的本质 确定文档和查询之间的相关度是IR的核心问题 IR作为一门学科,是研究信息的获取(acquisition)、表示(representation)、存储(storage)、组织(organizatio
  • 中断响应的实质是交换用户程序和处理该中断事件的中断处理程序的指令执行地址和处理器状态,以达到如下目的: 1、保留程序断点及有关信息。 2、自动转入相应的中断处理程序执行。 转载于:...
  • 区块链技术的本质是分布式数据库

    万次阅读 2017-06-27 09:39:48
    2、区块链的本质是分布式数据库(本文) 3、区块链与微服务是天生的一对区块链技术是基于比特币应用提出的一个概念,他是一个融合了多种技术的一个集成式创新。目前区块链的应用早已不仅仅局限在比特币上。...
  • 架构”这个词常见,但如果深究一下“架构”到底什么,大部分人也许并不一定能够准确地回答。例如: 架构和框架是什么关系?有什么区别? Linux 有架构,MySQL 有架构,JVM 也有架构,使用 Java 开发、MySQL ...
  • 数据及大数据的本质到底是什么?

    千次阅读 2019-02-22 17:43:23
    对于哲学家们探索的数据本质特征,我们可以从以下几个方面来把握。 数据与大数据 技术进步,主要是计算机、网络和各种类型的传感器以及云技术、分布式计算与存储等海量存储技术的广泛应用和运算能力极速进步,...
  • 互联网流量的本质是什么?

    万次阅读 2018-08-25 11:33:52
    当然也有例外,今日头条信息流的形式对于用户单位时间进行了分割,从而使得用户适应在短时间内获得不同刺激的习惯,这有利于广告商的投放和转化。我们看到产品形态在左右着用户的注意力,同时左右着流量的价值。 ...
  • 大数据本质上是人类社会数据积累从量变到质变的必然产物,是在信息高速公路基础上的进一步升级和深化,提升人工系统智能水平的重要途径,对人类社会的发展具有极其重大的影响和意义。 大数据是一个体量特别大、数据...
  • 信息检索是信息集合中迅速、准确地查找出所需信息的程序和方法。信息检索有广义、狭义之分 • 广义信息检索:信息存储与检索两个过程。 • 狭义信息检索:仅从检索工具或数据库中准确的检出信息这一过程,即...
  • 2019诺贝尔经济学奖得主:贫穷的本质是什么?

    万次阅读 多人点赞 2019-10-15 22:47:45
    在计算机中带宽是单位时间内通过设备的数据量。这里的带宽用来比喻就心智的容量,包括两种能力:认知能力和执行控制力。 什么是认知能力? “认知能力”,它是我们解决问题、获得信息、进行逻辑推理等能力背后的...
  • 什么是信息系统

    千次阅读 2013-07-10 16:55:08
    什么是信息系统 一.名称 信息系统的英文名是Information System 二.定义 信息系统是由计算机硬件、网络和通讯设备、计算机软件、信息资源、信息用户和规章制度组成的以处理信息流为目的的人机一体化系统。 三...
  • 静脉识别技术

    千次阅读 多人点赞 2017-08-11 16:29:29
    静脉识别是静脉识别的一种,首先通过静脉识别仪取得个人手指静脉分布图,从手指静脉分布图依据专用比对算法提取特征值,通过近红外光线照射,利用CCD摄像头获取手指静脉的图像,将手指静脉的数字图像存贮在...
  • “架构”到底什么

    千次阅读 多人点赞 2018-11-01 09:51:09
    架构设计是技术人员成长和晋升过程中必须掌握的技能,虽然非常常见,但深究一下“架构”到底什么,有多少人能够准确回答呢? 本文选自《从零开始学架构:照着做,你也能成为架构师》 对于技术人员来说,“架构...
  • 所以沉下心看清代码本质很重要,这次给大家带来的是手写RPC框架。 完整代码以及说明文档,点我跳跃~ 1. 什么是RPC? RPC是远程过程调用,也就是说两台服务器A,B,一个应用部署在A服务器上,想要调用B服务器上应用...
  • 条件自信息跟互信息区别简述

    千次阅读 2018-06-28 15:01:13
    条件自信息: 条件自信息本质上还是自信息。定义上,明确指出,是在已知事件y=bjy=bjy = b_j发生的条件下,x=aix=aix = a_i的自信息。 互信息: 互信息的话,并没有想象中的那么独立。其实,在互信息的定义中,...
  • 计算机本质

    万次阅读 2017-02-16 15:49:56
    向上的箭头,表示电信号从0到1变化的那一瞬间有效,再次在脑袋里想象下,触发器是一个很听话的孩子,当clk从0->1变化时,相当于告诉孩子,“孩子啊,赶紧接住我给你的球,球在这里指信息”,其他状态下,孩子在...
  • 机器学习是在一定的知识表示意义下获取新知识的过程,按照学习机制的不同,主要有归纳学习、分析学习、连接机制学习和遗传学习等. 知识处理系统主要由知识库和推理机组成.知识库存储系统所需要的知识,当知识量较大...
  • 一般来说,信息法由信息资源管理法、政府信息公开法、信息保密法、大众传播法、知识产权法、网络信息法等组成,涉及宪法、法律、行政法规、部门规章、地方行政和规章在内的所有关于信息活动和信息工作的法律法规。...
  • 什么是信息孤岛

    千次阅读 2019-07-04 21:37:46
    如果你想了解更多有关于信息孤岛的信息,快来看看这篇文章吧,一位业界大牛过来帮你解答信息孤岛,从中你可以了解什么是信息孤岛,信息孤岛的产生条件,信息孤岛的存在是普遍性还是单一性,信息孤岛所造成的问题,...
  • Offer——知识点储备-Java基础

    万次阅读 多人点赞 2016-10-21 23:54:52
    Offer——知识点储备-Java基础网址来源: http://www.nowcoder.com/discuss/5949?type=0&order=0&pos=4&page=2 参考资料:(java方面的一些面试答案) ...
  • Offer——Trie树(字典树)

    万次阅读 多人点赞 2016-09-07 21:21:30
    Offer——Trie树(字典树)Trie树 Trie树,即字典树,又称单词查找树或键树,是一种树形结构,是一种哈希树的变种。典型应用是统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频...
  • 概率Probability的本质是什么?[附概率...
  • SOA = 5S本文中的5S是麦肯锡企业管理的7S方法论中,除了愿景和战略之外的5个S,包括(系统Systems、组织Structure、能力Skills、人力Staff、文化Style)。可以参考资料:麦肯锡7S模型很多人都在说SOA,但是真正...
  • 信息安全简答题

    千次阅读 2020-12-28 11:57:49
    在2008年由署名为中本聪的作者在《比特币:一种点对点的电子现金系统》一文提出,的是一种在对等网络环境下,通过透明和可信规则,构建防伪造、防篡改和可追溯的块链式数据结构,实现和管理事务处理的模式。...
  • 从问题看本质:socket到底是什么?

    万次阅读 多人点赞 2011-09-22 10:32:11
    一、问题的引入——socket的引入是为了解决不同计算机间进程间通信的问题 ...1).socket与进程间的关系:socket 用来让一个进程和其他的进程互通信息(IPC),而Socket接口是TCP/IP网络的API接口函数。 2).进程间通
  • 信息管理与信息系统

    万次阅读 多人点赞 2009-06-26 18:15:00
    信息管理 :是在整个管理过程中,人们收集、加工和输入、输出的信息的总称。信息管理的过程包括信息收集、信息传输、信息加工和信息储存。信息收集就是对原始信息的获取。信息传输是信息在时间和空间上的转移,...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 295,793
精华内容 118,317
关键字:

信息的本质是指