精华内容
下载资源
问答
  • 初次看到信息熵的公式有很多不理解的地方,只知道信息熵如何进行计算,却不懂得公式背后的原理,我通过查阅了一些资料,加深了信息熵的理解,现在将这些理解分享给大家。如有疑问欢迎评论,若你有帮助,麻烦点个...

    一、序言

        初次看到信息熵的公式有很多不理解的地方,只知道信息熵如何进行计算,却不懂得公式背后的原理,我通过查阅了一些资料,加深了对信息熵的理解,现在将这些理解分享给大家。如有疑问欢迎评论,若对你有帮助,麻烦点个赞。未经允许、请勿转载。(本文适合只知道信心熵的公式,但是不明白其中原理的人进行阅读)

    二、什么是信息熵

        正如我们想要衡量某个物体的质量引入了克这个单位、我们想衡量时间,我们设计一秒钟这么长。香农老人家想要量化一条消息中带有的“信息量”的大小,提出了信息熵。
    那么,首先明确一个问题,什么样的消息算作“信息量大”呢?什么样的消息又算作“信息量小呢”?举个例子昨天小明和我说:“今天罗志祥又和周扬青秀恩爱了!”,我就觉得这有啥的,他们天天秀恩爱。也就是说小明的这条消息并不能给我带来很大的信息量。
    BUT今天小明和我说:”周扬青怒锤罗志祥!!!罗志祥人设崩塌!!!“,我就会很惊讶,因为这条消息给我的信息量很大。(类似的信息量很大的消息还有,小明告诉我今天太阳会从西边升起)
    我们用信息熵来描述一个事件混乱程度的大小(一个事件我们一定知道结果,那么这个事件的混乱程度就是0;一个时间充满随机性,我们猜不到或者很难猜到结果,那么他的混乱度就很大)
    引用下面一个在箱子里面摸球的例子,我们来更具体的了解信息熵。
    (此例引自:Youtube的一个视频
    在这里插入图片描述
    图左侧中有一个装有四个球的封闭箱子(这个箱子里面有三个红球、一个蓝球),现在我们从箱子中随机取出一个球,记录它的颜色后再放回箱子中,重复四次操作。如果你依次取出的序列为右上角所示(第一次取到红色、第二次取到红色、第三次取到红色、第四次取到蓝色),则你可以获得奖金;否则你就输了。大家用初中数学来算一算,我赢得奖金的概率是
    Px=34343414=27256 P(x)=\frac{3}{4}*\frac{3}{4}*\frac{3}{4}*\frac{1}{4}=\frac{27}{256}
      现在明确了这个游戏的规则,那么我们分析一下如下几个箱子和获胜概率
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    (每个图的左边是这个箱子的红球与蓝球初始条件,右侧是获胜所要求的序列,大家自己算算这个概率和图上写的一样吗?)
    在这里插入图片描述
    我们来分析一下这三种状态的游戏,第一次由于箱子内全是红球、该箱子的随机性很弱,也就是说带来的信息量很小;第三个箱子随机性很强,也就是说带来的信息量很大。也就是说,我们算出的这个概率越接近1时候,这个信息熵应该越接近0;算出的这个概率越小的时候,信息熵反而应该越大。我们需要找到这么一个公式来满足这一点。(暂停思考一下,有哪些公式可以满足)
    该可以很轻松的想到,用刚才P(winning)的概率取倒数可以吗? 答案是,只考虑刚才的问题,是可以的。但取倒数这个方式还是存在一些问题,比如第三个箱子取0.0625的倒数,算出来的这个信息量为16,如果这个P(winning)概率算出结果很小时,取倒数后就会变得非常大,所以我们认为这个乘法的规则并不是很好。香农发现log函数可以很好的解决这个问题。 因为log(a*b) = log(a)+log(b);而恰巧像抽箱子的独立事件P(AB) = P(A)*P(B)。【原因不止于此,后面我们还会再详细讨论】。
    所以香农取了一个-log(x)这么一个函数来表示某一状态的信息量大小,因为x是概率事件取[0,1],所以log(x)是一个递增的恒负的值,取一个负号,-log(x)是一个恒正、递减的函数,正好符合我们的预期。
    在这里插入图片描述

    表的第四列就是我们用log计算出的结果。而我们刚刚是依次计算的每一个球的结果,为了表示系统的平均信息量。我们除4得到最终的信息熵。
    在这里插入图片描述
    我们来将这个模型一般化,m个红球n个蓝球,信息熵表示如上图所示。
    我们可以再将模型一般化一些,如果这个箱子里有多种不同颜色的球,我们就公式变成了如下的样子:
    H(x)=i=1nP(xi)log(P(xi)) H_{(x)}= -\sum_{i=1}^{n}P_{(x_i)}*log(P(x_i))\,
    这就是信息熵。也就是说,我们规定拿出一枚硬币,随意投出后,他可能是正面也可能是反面,它的信息熵是单位1(用刚才的方法来算算是不是1)。就像我们在这节开始所提到的,我们知道一个物体是几千克。是因为我们有一个1kg的砝码作为参考。我们能感受到时间流逝了多少秒,是因为我们规定了秒的单位。

    三、为什么是log

     这章我们会再用一个例子来讲解,为什么是信息熵为什么要用log?还是以一个游戏为例。在这里插入图片描述
    在上述的8个字母中,任取一个字母(我们不知道取的是什么,但我们知道初始的8个字母是什么),现在让你来猜这个字母是什么。
    利用我们刚刚学过的信息熵,我们可以知道第一个序列的信息熵很低、第三个最高。我们可以计算出如下结果
    在这里插入图片描述
    (这个信息熵大家自己算一下,和上面计算的方式完全一样)
    重点来了: 下面我们用一种提问的方式,来解决这个问题。你可以像系统提问(比如:这个字符是A吗?),系统会给你回答,你根据回答继续进行提问,直到猜到结果为止。以第二个序列为例;系统选了D,让你来猜。你会这样提问:
    Q1:这个字符是A吗? Answer:不是
    你就知道,这个答案只能是B,C,D中的一个,你就会继续提问:
    Q2:这个字符是B吗? Answer:不是
    你就会继续问:
    Q3:这个字符是C吗?Answer:不是
    好了,你不会再继续问下去了,因为这个答案一定是D。
    也就是说通过这种方式,如果答案是A,你会猜1次,答案是B你会猜两次,答案是C或者D,你会猜三次。平均猜测次数为
    Ex=141+142+143+143=2.25 E(x)=\frac{1}{4}*1+\frac{1}{4}*2+\frac{1}{4}*3+\frac{1}{4}*3=2.25次
    显然,你可以选择一种更精妙的提问方式,来缩减平均猜测的次数
    你可以这样进行提问:
    Q1:这个字符是A或B吗? Answer:不是
    Q2:那么这个字符是C吗? Answer:不是
    好了,那么我知道这个字符是D了。也就是通过这种方式,我们不管是哪一个字符,我们只需要问两次就可以解决问题,我们用一种更直观的树来表示,如下图所示
    在这里插入图片描述
    恰巧,这种提问二选一的过程,恰巧是个抛硬币的过程。由于我们类似的等价于抛了两次硬币,我们可以知道,这个过程的信息熵是2。我们再用信息熵的公式试一试
    Hx=14log(4)+14log(4)+14log(4)+14log(4)=2 H(x)=\frac{1}{4}*log(4)+\frac{1}{4}*log(4)+\frac{1}{4}*log(4)+\frac{1}{4}*log(4)=2
    (这里我们把符号直接化进log中了)

    大家发现没有,log(x)是不是恰巧等于x需要询问的次数呢?!!!这也是这个公式的精妙所在,在离散数学中我们学过,一个树的高度等于log(节点数),这个log(x)恰巧是询问的高度,也就是投硬币的次数!这原来就是使用log的原因
    上面的例子中A,B,C,D都是等概率出现的;下面我们将这个过程一般化,看一看当每个随机变量不等概率时的运算过程
    在这里插入图片描述

    我们看如上的序列,其中A出现的概率要等于BCD之和。所以我们为了让我们的提问次数最小化,我们要尽力讲每次提问的YorN分成等概率,也就是我们要问的第一个问题是:
    Q1:这个字符是A吗?
    如果不是,我们知道是B,C,D但是B的概率等于C和D之和,我们就再问:
    Q2:这个字符是B吗?
    如果不是,这时候C和D等概率,我们随便问一个即可:
    Q3:这个字符是C吗?
    好了,现在得出了结论。
    问出A需要1次,B2次,C和D都是三次。
    我们用信息熵来计算一下。
    Hx=12log(2)+14log(4)+18log(8)+18log(8) H(x)=\frac{1}{2}*log(2)+\frac{1}{4}*log(4)+\frac{1}{8}*log(8)+\frac{1}{8}*log(8)
    每一个log(x)恰巧对应着他所在的叶子在树的第几层,也就是他需要询问的次数,前面乘上一个概率,是不是发现这个公式提出的非常巧妙!!
    .

    三、结语

     通过上述过程,相信大家能清楚的理解信息熵。本文并没有一些数学上详细的证明,暂时留个坑以后填。如果大家有什么问题,欢迎在评论区交流,如果觉得有用麻烦点个赞~
    参考资料:https://www.youtube.com/watch?v=ErfnhcEV1O8

    展开全文
  • (原标题:十分钟理解线性代数的本质 作者:了不起的陈皓宇)线性代数的本质先一句话先把最重要的东西说了,什么是线性代数?线性代数的本质,其实是一种高维空间上的变换。这句话虽然简单,但这句话具体什么意思呢。...

    (原标题:十分钟理解线性代数的本质  作者:了不起的陈皓宇)

    线性代数的本质

    先一句话先把最重要的东西说了,什么是线性代数?

    线性代数的本质,其实是一种高维空间上的变换。

    这句话虽然简单,但这句话具体什么意思呢。别急,我们引入一个很直观的例子来理解这个数学表达。

    拿二维空间中的小纸片人为例来说,小人在此:

    我对一个小人进行位移,拉伸的一系列线性操作,它可以变成另一个样子:

    这就是线性代数要做的一些事情。我对这个小人做的一些操作,就叫矩阵,也就是对这个对象的一些操作或者说映射。

    所以乍一看,这个问题好像并没有什么特别难的,为啥线性代数这么难呢。

    主要是很多的基本概念和实际的物理含义没有挂钩。

    接下来,我们就来讲讲线性代数中的各个名词和物理含义的联系。

    行列式

    首先第一个概念就是矩阵的行列式。还记得刚开始学习线性代数的时候,老师上来就咔咔给我们一顿求解矩阵的行列式。

    二阶矩阵的行列式是下面的这个公式,大家应该依稀还记得求矩阵的行列式的求法(不是定义),对角线相乘再相减:

    然而,我还记得一个学期的线性代数学完了,我连第一个问题都没有解决。那就是,老师,咱们为什么要求一个矩阵的行列式?

    为什么?

    为什么?

    在这里,我就来告诉大家,为什么要求解矩阵的行列式!

    还是举一个例子,这次我们把上面的小纸片人换成一个面积是1*1的小方块:

    我们用一个矩阵对它进行一顿操作,就得到了下面的样子:

    可以看到,经过了图中所示的矩阵的变换之后,我们之前的小方块变成了大一点的矩形,面积变成了3*2,也就是6。

    而我们再算算图中这个矩阵的行列式的数值,也是6。

    行列式的数值和矩阵变换之后的面积一样!

    朋友们,这不是巧合!

    我们可以再试验一个矩阵变化:

    我们用另一个矩阵对原来的小方块进行一顿操作,可以看到之前的小方块变成了一个斜一点的矩形。

    变换后的斜方形的面积是1,而图中这个矩阵变换的行列式的数值也是1。

    行列式的数值和矩阵变换之后的面积仍然一样!

    这!其实就是行列式的非常重要的物理意义!它其实就是矩阵变换带来的面积变化。

    我第一次看到这个概念的时候,觉得醍醐灌顶,原来行列式的意义可以这么理解!

    同时感慨,曾经我求解了不下一千个矩阵的行列式,原来自己根本不知道自己在求些什么东西!

    当然,上面的定义是不准确的,对于二维来说,行列式代表的就是面积变化,三维来说,行列式表征的就是体积变化了,推之高维空间亦然。这样就严谨一些了。

    逆矩阵

    现在我们应该知道了矩阵是一种变换,想想上面的矩阵变换,我们可以把一个小方块变成一个斜斜的方块。

    那么一定存在另一种矩阵的映射,能把这个斜斜的方块变回原来的小方块,是不是?

    所以逆矩阵的物理意义就出来了,如果有个矩阵能把经过变换之后的斜斜的这个方块:

    还原成为之前的小方块:

    那么它就是原来那个矩阵的逆矩阵。

    可以这么理解,逆矩阵就是一种对原矩阵的逆向变换。

    对于逆矩阵,在数学上,有这么个表达:

    A 是一个矩阵, A-1是A 的逆矩阵,它们相乘会得到一个单位矩阵。

    结合物理意义我们就能理解这个公式了:一个物体经过了A矩阵的变换,在经过A 的逆矩阵的变换,就等于保持不变(单位矩阵就是保持不变)。

    简单来说一句话,变过去又变回来,那就是没有变。

    这就是逆矩阵的性质。

    矩阵的秩

    如果说上面的东西还只是有点意思的话,那接下来讲的东西就要进入高潮了。

    由上面的论述,我们知道了逆矩阵是啥东西——就是一种反向变换。

    一切看似没啥问题。

    但是问题来了。我们喜欢折腾的数学家不久发现,有些矩阵变换没法求逆变换!

    这是为什么呢?

    这还要从矩阵的行列式说起。

    我们从上面知道了,行列式表征的一种面积的变化。但是我们会发现有很多矩阵的行列式的数值是0。

    啥意思呢?

    很不严谨地举一个例子,想想我们上面提到的那个小方块。

    现在有一种变换,让这个小方块的面积变换后变成零了。你觉得这是一个什么变换?

    不知道你猜出来没(反正我一开始是没有头绪),只有一种可能:

    这个小方块被压缩成了平面上的一个点或者一条线!

    以至于变换后的面积为零!

    这就是行列式为零的物理意义。

    借由这个物理意义,我们进一步可以知道:

    如果一个矩阵变换的行列式为零,代表这个变换将对目标进行降维(比如从平面变成点)。

    然后我们可以想象,一个物体维度一旦下降(比如从平面变成点),这个过程将不能逆转(从点重新恢复成平面)。

    这就是为什么有些矩阵变换不能求逆矩阵!

    进一步,我们就能得到线性代数里面最常用的一个结论:

    行列式为0的矩阵是不可逆矩阵,不可逆矩阵的行列式就是0。

    我第一次看到这个结论,内心是在咆哮的:

    这就是传说中的降维打击啊!

    科幻里面的东西原来就在身边,只是我一直没有去挖掘过!

    矩阵的秩

    那么什么又是矩阵的秩呢?

    一句话解释就是,矩阵变换之后所给出的维度,就是矩阵的秩。

    什么意思,打个比方,很简单,如果对一个三维物体进行一个矩阵变换,变成了一维的,那么这个矩阵的秩就是1,如果得到的是二维的,那么这个矩阵的秩就是2。

    如果变换之后仍然是三维物体,那么这个矩阵的秩就是3,也叫做满秩(没有维度的损失)。

    前两种情况下,经过矩阵变换后,维度都会下降,信息都会丢失。可以想象,他们相应的行列式都为零——对于一个三维物体,无论是变成了直线还是点,面积都是变成了0。

    所以我们又得到了一个重要结论:

    只有满秩的矩阵(变换之后维度不变)行列式才不为零。

    我们可以看到,用物理含义来看这些定义,会显得格外通俗易懂。

    特征根与特征向量

    接下来我们来讲讲线性代数里面最最核心的最经典的一个问题:

    求解矩阵的特征根和特征向量。

    我刚开始学习矩阵这门课的时候,老师啥也没说,整节课就围绕着求解一个矩阵的特征向量和特征根展开了。

    遗憾的是,我再次懵圈了,因为我连一个最基本的问题都没搞明白,嘿,老师,我们为啥要求解特征根和特征向量呀?

    啥是矩阵的特征根?

    啥是矩阵的特征向量?

    啥?啥?啥?

    于是我下课自己查看了相关资料之后,网友的一通介绍让我豁然开朗:

    什么是特征向量呢,就是在高维空间中,经过了某个矩阵变换之后,保持不变的向量,就是这个矩阵的特征向量。

    看不懂?

    没关系,一如既往地,我们还是来举个例子。如下图,假设我们有一对向量是下面这个样子的:

    经过了一个矩阵变换之后就变成了这个样子:

    然后我们再随意的取另一个向量,黄色的箭头:

    看看它经过了这个矩阵变换之后的样子:

    可以看到,这个黄色的向量经过矩阵变换之后,方向和大小都改变了,注意那个粉色的延长线。

    我们接下来再看一个经过了变换之后,方向可以不改变的向量,图中的黄色箭头:

    我们可以看到,经过了矩阵变换之后,这个黄色的箭头的方向保持了不变!

    重点来了!!!

    从物理意义来讲,这种经过了矩阵变换之后,方向依然能保持不变的向量,就是这个矩阵的特征向量,这些特征向量经过变换后大小的改变,就是该特征向量的对应特征值了。

    为什么叫这个矩阵的特征向量呢,数学家说了,这是因为咱们只用这一个向量,就能代表这个矩阵的变换,所以叫做特征向量。

    可能你又要问了,特征向量有啥用呢?

    好的,例子再次登场!

    如下图,我们有一个立方体的物体:

    我们现在对这个物体进行一波3D 旋转,得到下面这个样子:

    虽然我告诉旋转的过程是,红的那一面从右边转到了左边。

    但是你可能还是很难想象它到底是怎么转过来的,对吧?

    计算机也很难想到!

    然后,怎么办呢?

    为了直观起见,我们可以想象一下这给它添加一个旋转轴,如下图:

    它旋转的时候,就是围绕着这个轴来转的:

    你可能会说,行吧,好像能想象出来了。

    但是旋转就旋转吧,和特征向量有啥关系呢。

    人数学家说了,这个旋转其实就是一种矩阵变换,而这个轴就叫做这个旋转变换的特征向量!

    因为在整个变换中,只有这个轴的方向是没有改变的!

    也就是说,我们找到了这个轴,也就是特征向量,我们就找到了这个旋转,也就是矩阵变换的最简洁的表征方法!

    基于上述的这个理论,在现代的矩阵求解特征向量的运算中,有一个叫 Power 迭代法 的算法被广泛用于计算机求解矩阵的特征向量。

    它的原理就是基于——特征向量就是,经过矩阵变换后,方向保持不变的向量。

    Power 迭代法 它具体是怎么进行求解一个矩阵的特征向量的呢?非常简单。

    我们首先任意选一个向量,对它进行矩阵的变换,然后得到一个新的向量,我们再对这个新的向量进行矩阵变换,如此反复。我们可以想见,经过了无数次的矩阵变换后,向量会趋近于不变。而这就是特征向量的定义——经过矩阵变换后,方向保持不变的向量。

    以上,就是我在课余时间对线性代数物理含义的一些总结。

    [1] https://www.bilibili.com/video/av6540378/

    展开全文
  • 合伙制度一些理解

    千次阅读 2019-03-02 09:13:31
    合伙,就是一起做大事的人。这些是如何做事,我们简单分析下。 汉高祖刘邦,斩白色起义,一堆合伙,这些组到一起就是”事业合伙“,大家奔是消灭...当然还有很多别模式,但大同小异,本质不变。 ...

    合伙人,就是一起做大事的人。这些人是如何做事的,我们简单分析下。

    汉高祖刘邦,斩白色起义,一堆合伙人,这些人组到一起就是”事业合伙人“,大家奔的是消灭秦朝的暴政,只要做成了荣华富贵加身,但是失败了全家都得掉脑袋,非常典型的”收益共享、风险共担“。到了现在的企业管理中,员工参与持股的有限公司,其实就是员工与企业分享不确定性,从而做到利益共享、风险共担;当然还有很多别的模式,但大同小异,本质不变。

    我认为的”业务合伙人“,其实就是公司搭建了一个平台,这个平台拥有强大的能力,强大到你出去单干都没有在平台上回报多,回报与你的个人能力和贡献完全正相关,企业则只收部分的服务费。这样越来越多的强人都会在这个平台上做出贡献,反过来又逆推这个平台越来越好;双方是一种互利共赢、互惠互利、互相促进的关系。我理解的阿里巴巴、链家贝壳、云计算、新零售等都是类似的模式,这个平台是由企业为用户/客户搭建的,企业得到大力发展,用户/客户得到的则是更优质的服务、更便捷的效率、更廉价的商品等。

    ”投资合作人“,简单理解就是有钱出钱,没钱出人,双方不断试探,最终有钱的主愿意出钱,有人的主愿意出人,这里的人是拥有更高能力(就是差钱)的人。双方合作,在一起做大生意,共奔向远大前程。我对你的钱负责,你对我的人监督。有钱的花钱买未来,有人的投时间花精力把事做成,双方共担风险。

    ”运营合伙人“,其实是一种好的营销模式,或者说激励机制,把所有人的利益都绑定在一起,大家一起赚钱。这种模式在很多行业都有应用。目前面对快速变化的时代,如何更好的营销,如何更好的共生,如何更好的创新,如何把企业、员工、用户打造成命运共同体是企业的大难题之一。

    总之,我们进入了企业,本身就与企业结成了合伙人关系,只不过更多是价值交换的关系而已。员工为企业工作,提供个人价值,企业给员工回报,包括薪资、奖金、职位等,作为同等价值进行交换。当企业发展到一定阶段时,可能会建立新的合伙人关系,除了个人价值外,还增加了风险投资,或者提供了更大的机会和舞台,把彼此之间的关系绑定的更紧了,常见的形式就是个人价值(薪资、奖金)+未来风险(股票、期权等)+无限可能(平台、职位、机会等)来激励员工。在此情况下,员工越优秀,企业给予的回报越多;员工越努力,企业给予的回报越多;企业越强大,员工的机会和选择越多。当企业和员工彼此命运深度交融的时候,那就是彼此合作最好的时候。

     

    备注:下文根据刘润老师的每个人的商学院整理。

    本篇是系列书籍6“管理进阶”的第九章“合伙人制度”。

    详细笔记内容如下: 

    业务合伙人:麦肯锡的咨询顾问为什么不自立门户

    “教会徒弟,饿死师傅”是手艺人解不开的心结。

    把手艺人团结起来,形成手艺人集团,让手艺人在手艺人集团中做业务获利比自立门户更大,这就是业务合伙人制度。

    这就是业务合伙人制度,它不推崇“一日为师,终身为父”,它允许“徒弟逐渐成长为朋友,甚至是师傅”。

    事业合伙人:收益共享,风险共担

    简单来说,万科的事业合伙人制度包括两个部分:持股计划和项目跟投。

    持股计划:首先,买股票让员工不仅共享工资、奖金的收益,也共担盈亏和涨跌的风险;其次,只能用奖金买,说明万科把这个收益共享、风险共担的机会,只和有贡献的优秀员工分享。

    项目跟投:员工可以在具体的项目上持股。

    事业合伙人制度的本质是与员工分享不确定性,从而做到收益共享,风险共担。

    投资合伙人:资本与人才的婚约

    投资业非常特殊,在这个行业,缺了眼光的钱,傻;缺了钱的眼光,穷。资本和人才谁也雇佣不了谁,必须合伙。

    这份合伙人的契约,大概有三个部分:1、权--身份条款(有限合伙人和管理合伙人);2、利--收益条款(投资的目的,不是管理合伙人挣有限合伙人的管理费,而是双方一起挣投资的巨大收益);3、责--风险条款(如果赔钱了,到有限合伙人的钱赔光为止,这也是“有限合伙人”名字的由来,如果赔的钱超过了本金,投资决策都是管理合伙人做的,所以要承担所有剩余责任)。

    运营合伙人:如何让一线员工尽心尽力

    运营合伙人制度的关键,就是与一线运营员工分享门店的剩余利润。他们原本视而不见所溜走的利润有了自己的损失,这让他们肉痛;他们握紧拳头所省下的成本中有自己的利益,这让他们眼红。

    如何做:1、确定增量以润(高于基本利润的部分);2、分配(有五五分的,四六分的,甚至有三七分的--总部拿三、门店拿七);3、再分配(首先按级别分;其次按部门分;最后按出勤分)。

    所有的治理问题,都是责权利不对等的问题。把这三个字理解透了,就理解了治理。

     

    展开全文
  • 而且我也注意到初次学习线性代数的学生往往这一科目的理解很肤浅。学生在教室中学到的可能是如何进行各种各样的计算。比如矩阵乘法、行列式的计算。但是结果很可能是学生并非真正理解为什么矩阵乘法要如此定义。也...

    大部分人都知道线性代数是学习任何技术学科都需要掌握的科目之一。而且我也注意到初次学习线性代数的学生往往对这一科目的理解很肤浅。

    学生在教室中学到的可能是如何进行各种各样的计算。比如矩阵乘法、行列式的计算。但是结果很可能是学生并非真正理解为什么矩阵乘法要如此定义。也并不知叉积与行列式有所关联,或者特征值究竟代表了什么?大部分时候学生对于矩阵的数值操作驾轻就熟。但是对于潜在的几何直观知之甚少。

    在数值水平和几何水平上理解线性代数上有着根本性的差异。它们各有千秋,但是粗略的讲,几何水平上的理解能让你判断出解决特定问题需要用什么样的工具。感受到他们为什么有用以及如何解读最终结果。数值水平上的理解则能让你顺利利用这些工具。

    假如你在学习线性代数时,并没有几何上的直观理解作为坚实基础。问题可能暂时不会浮出水面。但是当你在你的研究领域中继续钻研时,他就会显露出来。不管是计算机科学,工程学,统计学,经济学还是数学本身,这个道理都是一样的。当你坐在教室里或者你开始从事一项工作,都需要你通晓线性代数知识。你的教授或者同事所做的就如同魔法一般,他们很快就知道应该使用什么方法,以及答案大致是什么样子。如果你猜测他们处理的是繁杂无章的数据,你可能还会以为他们有什么奇特的计算方法。

    打个比方,假如你首次学习正弦函数时,学到的是这样一个无穷次多项式。你的作业只是通过代入不同的数字,并做合理的截断,来练习计算正弦函数的近似值。再假设你对三角形和正弦函数的关系有一点模糊的认识。但是确切是什么关系你并不清楚,这也不是课程的重点所在。后来你参加了一门物理课程,正弦和余弦函数随处可见。其他人很快就知道如何使用这些函数。并且大致知道它的值是多少。你会觉得这很吓人对吧?仿佛那些适合做物理的人都有着计算机一般的大脑。而你在每个问题上都需要花费很长时间,蠢到无药可救。

    线性代数也差不多如此,幸运的是和三角函数很类似。线性代数也有许多隐藏其中的直观理解,而且是可视化的直观理解。但是和三角函数的例子不同。线性代数中计算和可视化直观理解之间的联系往往相当直接。当你消化了这些内容,真正理解了几何直观和数值计算的关系。这门科目的细节和他在实际生活中的应用就会显得合情合理。

    平心而论,目前很多教授也在努力向学生传达几何直观思想。但是我的确认为大部分课程让学生花在数值计算方面的时间太长了。尤其是在当今时代,我们有计算机来处理这些计算问题。在实践中人们关注的则是概念层面的东西。对于这个问题你能做的是形成正确的几何直观。以便在接下来的学习中收获累累硕果。同时对那些教授需要熟练掌握线性代数知识的课程的教育者来说。给学生一个途径指导他们快速重温线性代数知识。

    由于大家有着不同的知识背景和接受程度,很难同时照顾到所有人。所以我鼓励大家必要时仔细思考。

    线性代数中最基础最根源的组成部成部就是向量。所以我的确信我们在“向量究竟是什么”这一问题上达成共识。

    一般来说有三种看待向量的观点,看似不同却有关联。分别将他们称为物理专业学生的视角,计算机专业学生的视角以及数学家的视角。从物理专业学生的视角看,向量是空间中的箭头,决定一个向量的是它的长度和它所指的方向,但是只要以上两个特征相同,你可以自由移动一个向量而保持它不变,

    处在平面中的向量是二维的。而处在我们所生活的空间中的向量是三维的。

    从计算机专业学生的视角看,向量是有序的数字列表。比如说你正在做一些有关房价的分析。而你只关心两个特征,房屋面积和价格。你可能会用一对数字对每个房屋进行建模。第一个数代表房屋面积,第二个数代表房屋价格。注意这里的数字顺序不可颠倒。用行话来讲,你会用二维向量对房屋进行建模。在这里“向量”只不过是“列表”的一个花哨的说法。之所以这个向量是二维的,是因为这个列表的长度是2。

    另一方面,数学家试图去概括两种观点。大致的说,向量可以使任何东西。只要保证两个向量相加以及数字与向量相乘是有意义的即可。这种看待向量的观点相当抽象。这观点暗示了一个事实。即向量加法和向量数乘贯穿线性代数的始终,二者起着很重要的作用。

    在谈论这些运算之前呢,我们先来确定一种思考向量的特定方式。每当引入一个关于向量的新主题时,我们需要你首先考虑一个箭头。更具体地说考虑这个箭头落在某个坐标系中比如x y平面。并且箭头起点位于原点。这与物理专业学生的看法略有不同。因为在他们眼中,向量可以在空间中自由落脚。但是在线性代数中向量经常以原点作为起点。

    一旦你理解了“向量是空间中的箭头”这种观点。我们就来看看“向量是有序的数字列表”这种观点。我们可以通过向量坐标来理解他。我们中大部分都已经很熟悉坐标系这个概念的,我也很清楚这一点。但是这也值得再详细叙述一遍。因为这两种观点之间的碰撞恰恰形成了线性代数中重要的概念。

    我们现在把眼光局限在二维空间中。画一条水平的线,我们叫他x轴。再画一条竖着的线,我们叫他y轴。两个轴的交点我们称之为原点。应该把它看作整个空间的中心和所有向量的根源。选取一个任意的长度代表1,你就可以在坐标轴上标记刻度来代表这一距离。一个向量的坐标由一对数构成。这种数教导你如何从原点也就是向量的起点出发到达它的尖端也就是向量的终点。第一个数告诉你,沿x轴走多远。正数代表向右移动,负数代表向左移动。第二个数告诉你在此之后沿着平行y轴的方向走多远。正数代表向上移动,负数代表向下移动。

    为了把向量和点区别开,惯用的方法把这对数竖着写,然后用方括号括起来。每一对数给出唯一一个向量。而每一个向量恰好对应唯一一对数。

    三维空间的向量又如何呢?那我们就在添加垂直于x和y轴的第三根轴叫他z轴。这种情况下每个向量就与一个有序的三元数组对应。每一个三元数组给出唯一一个向量。而每一个向量恰好对于唯一一个三元数组。现在我们回到向量加法和向量数乘。毕竟线性代数中每一个主题都围绕这两种运算。两种运算的定义都很直接。假设这里有两个向量,一个指向上方略微偏右。另一个指向右方略微偏下。为了把它们相加,我们平移第二个向量,使它的起点与第一个向量的终点重合。然后画一个向量,它从第一个向量的起点出发指向第二个向量的终点。这个向量就是他们的和。

    我们习惯上把向量看作是一种特定的运动,即在空间中朝着一个方向迈出一定距离。现在我们从数字的角度看看向量的加法。第一个向量的坐标是〔1,2〕,第二个向量的坐标是〔3,-1〕。那么新向量的坐标就是〔1+2,2+(-1)〕总得来说,在“向量是有序的数字列表”观点里。向量加法就是把对应项相加。

    另一个基础的向量运算就是向量数乘。先看几个例子来更好地理解这个概念。比如说你选择数字2,把它与一个给定向量相乘。意味着你把这个向量拉长为原向量的两倍。再比如,如果将向量乘以1/3,就意味着这个线的长度缩短为原来的1/3。如果与一个负数相乘,那么首先这个向量反向,然后延长为原来的多少倍。这种拉伸或者压缩有时又使向量反向的过程被称为缩放。

    实际上自始至终数字在线性代数中起到的主要作用就是缩放向量。所以通常“标量”和“数字”两个词在这里可以相互替换。

    另一方面从数字的角度来看将一个向量伸长为原来的两倍,对于将每一个分量分别乘以2,所以将向量看作一个数字列表时,向量与标量相乘,就是将向量中的每个分量与标量相乘。实际上无论你怎么看待向量都无所谓。或把向量看作空间中的箭头。这种观点恰好有漂亮的数字表示与之对应。或者把向量看着数字列表,这种观点又恰好有漂亮的几何意义与之对应。

    线性代数的效用很少体现在这些观点中的其中一个,更多体现在它能够在这些观点中相互转化。

    线性代数为数据分析提供了一条将大量数据列表概念化、可视化的渠道。他让数字样式变得非常明晰。并让你大致了解特定运算的意义。另一方面,线性代数给物理学家和计算机图形程序员提供了一种语言。让他们通过计算机能处理的数字来描述并操纵空间。

    展开全文
  • 给这个机器输入一个条件,机器会运转,条件进行加工,然后输出一种现象。通过研究输入与输出,有时候可以推测出机器内部构造,这就是所谓科学。比如牛顿,他发现:给物体一个力,就能使物体产生一个加速度,力...
  • 如何理解管理的本质,这是困扰很多管理者的问题,管理可大可小、可繁可简,可急可缓,成熟的管理者能够在管理上轻松自如,不入门的管理者总会在管理上左右为难、相互掣肘。本文就管理的本质做深入的探讨和分享,帮助...
  • 更抽象一点,说架构其 实 是 我 们 重复性业务 抽象和我 们 未来 业务 拓展前瞻,强调过去经验和你整个行业预见。 我们要想做一个架构话需要哪些能力?我觉得最重要是架构师一个最重要能力...
  • 有同学我讲现在复习线性代数遇到了瓶颈,在历年复习过程中,有许多同学完全找不到复习感觉,线性代数这门学科学习方法和高等数学完全不一样,也就是说你学习线性代数首先你得换学习思想,它完全是一套全新...
  • 导语:本文将采取虚拟故事与图解方式让读者理解比特币系统在本质上到底是什么样一个系统,此片不会涉及到比特币系统具体相关技术,完成适合没有技术背景的人理解比特币系统。 一. 情书集团虚拟“比特币”...
  • 大数据本质上是人类社会数据积累从量变到质变必然产物,是在信息高速公路基础上进一步升级和深化,提升人工系统智能水平重要途径,人类社会发展具有极其重大影响和意义。 大数据是一个体量特别大、数据...
  • 有同学我讲现在复习线性代数遇到了瓶颈,在历年复习过程中,有许多同学完全找不到复习感觉,线性代数这门学科学习方法和高等数学完全不一样,也就是说你学习线性代数首先你得换学习思想,它完全是一套全新...
  • 最近股票涨得很好,也借此机会有些不错收益,虽然这种几乎靠运势和赌博来收入不应该作为自己职业,但这种什么事都没干就能赚钱好事,还是太吸引了,可能这也是为啥这么多人都在炒股原因吧。 后来带着...
  • 西方哲学的人性解读经历了本质主义向非本质主义的转向,后现代主义哲学家们在颠覆了本质主义人性论后,并没有把人性的解读引向"现实的人"与人的现实性。马克思主义哲学把人理解为"现实的人",把人性理解为在现实生活...
  • 其实每个都能轻松而透彻地理解位图与矢量图的本质区别 位图与矢量图的区别(为什么要再进行解释)  播放录像时按空格键暂停/继续播放 (关于位图与矢量图的区别,各种教材和网上解释的有很多,但是本人认为解释...
  • 在没有很多教程的情况下,如果一个人的观察力足够强,他会自动串接很多线索,完成逻辑构建,进而实现快速学习的效果。背后是 观察力, 细节 的把握和敏感度能力。在DAX有 迭代器 的说法,但任何文档都不明确写迭代...
  • 标题:工程与科学的认知以及思维方式的理解 1.工程与科学的认知: 工程的定义:应用科学原理将自然资源,以优化的方式转换成结构、机器、产品、系统及工艺,以造福人类的方法。 简单的来说工程是创造造福...
  • 简单先说一下我逻辑思维的理解。逻辑思维的过程,是化繁为简,目的,是找到解决方法。因此,所有和“寻求解决方法”无关的信息,都是无用信息,都需要剔除。我很喜欢《教父》这部电影,里面有一句话
  • 浅谈JVM的理解

    2020-06-20 09:50:47
    但这些语言计算机中的机器硬件肯定是不认得的,机器的本质是高低电平的转换,因此机器语言是能被机器直接识别并由计算机中相应的的电路来完成的二进制语言。我们使用某一编程软件,便是写入我们所能理解的语言,由...
  • 面向对象是被讨论的最多的,个人认为,这是因为 Java 之类的编程语言有强大的用户基础,本质还是因为比较符合人的直觉。 说到面向对象,大家可能就会很快想到了 23 种设计模式,可只有少部分人会想到面向对象的 6 大...
  • 交易一些理解

    2020-02-05 20:59:04
    倒过来思考有利于理解事物的本质 倒过来思考有利于理解事物的本质,从而帮你解决许多困难的问题。 芒格曾经开玩笑说,他想知道他会死在哪里,这样他就不能再去那里了。他还讲过这样一个故事: 我常给我的家人出些小...
  • 关于“编程的本质”的探讨

    千次阅读 2018-09-27 09:21:12
    没有经年的编程和架构经历,没有问题本质的深入探究,恐怕任何回答都会显得非常苍白。 探索历程之编程本质 有了问题和好奇心之后,令你印象深刻的问题就会在一段时间内充斥你的脑海。让我回答软件工程的理解,...
  • 区块链的本质浅析

    2020-07-20 16:08:27
    区块链发展到今天已经有一段时间了,在这段时间里,人们区块链的认知经历了快速的迭代,对于区块链本质的理解也陆续出现过若干个版本,很多大咖都从不同的角度阐述过他们所理解的区块链本质。 比如《经济学...
  • 技术研究真的很爽,像吃鸦片一样,虽然我没有吃过,但估计就是那种感觉。...技术反应了这个世界,了解技术的本质,就是加深世界的理解。虽然世界有万事万物,但它们终究都会回归到一个相同的地方,会...
  • 需求的本质

    2019-01-27 21:57:06
    自己的需求(自己的理解) 你想做什么 为什么 想得到什么 你现在有什么 你未来可以做到什么 最好的结果和最坏的结果,你能接受吗? 如果连自己的需求都不能满足,怎么可能满足用户? 二.用户的需求(用户的理解...
  • 架构的本质

    2017-04-11 10:52:04
    分享:卫向军(毕业于北京...在开始谈我架构本质的理解之前,先谈谈今天技术沙龙主题的个人见解,千万级规模的网站感觉数量级是非常大的,这个数量级我们战略上 要重 视 它 , 战术上又 要 藐 视 它。先举个例
  • 金融的本质

    2019-10-07 13:58:42
    金融的本质是融资+杠杆+套利。 任何一种人类游戏都是有一定规则的,金融也不例外。说白了,金融就是以钱为中心的游戏。金融本身并不创造价值,人类创造的价值主要通过实体部门来实现,比如说工厂生产了一辆汽车,...
  • 以下只代表我个人粗浅的理解,如有错误请多包含,编译本质上是把人类能理解的字符语言翻译成机器能理解的机器语言的过程。为此编译器做了一下几个工作: 预处理 编译 汇编 链接 编译一共分为几个步骤: 1.预处理...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 1,593
精华内容 637
关键字:

对人的本质的理解