精华内容
下载资源
问答
  • 智能,万亿维空间中的求解

    千次阅读 2021-01-18 19:35:00
    作者:Terry J. Sejnowski编译:贾伟、梦佳1884年,Edwin Abbott 在讽刺小说《平面国》中描述了这样个世界,这个国家生活在个二世界中,平面国的人们只能够...

    作者:Terry J. Sejnowski

    编译:贾伟、梦佳

    1884年,Edwin Abbott 在讽刺小说《平面国》中描述了这样一个世界,这个国家生活在一个二维世界中,平面国的人们只能够理解二维数学;但其中一个方块绅士做了一个关于球体的梦,在那个梦中,他发现世界的可能性要比平面国里任何人所想象的都要大。但他醒了告诉别人时,没有人能够理解并相信他,最终他因为蛊惑人心被投入了监狱。

     

    我们生活在三维世界中,可以很容易想象一维、二维和三维的空间。但是如何来想象四维、五维,甚至一千亿维空间呢?

     

    GPT-3有1750亿个参数,也即它是在一个1750亿维的空间中进行求解;而我们大脑有亿万个维度,当我们生活在这样的空间当中,去看3维的世界,会是什么感觉?

     

     

    加州大学圣迭戈分校生物科学教授 Terry J. Sejnowski 在美国顶刊PNAS发表的一篇论文《The unreasonable effectiveness of deep learning in artificial intelligence》,从一种完全不同的视角来看当下深度学习的优劣,他认为当下深度学习的优点在于高参数空间,这与人脑有共通之处;但另一方面,生物大脑通过数亿年的进化,在万亿级维度空间中所学习到的方法,依然值得人工智能研究者借鉴。

    Terry强调:

    我们才刚刚开始探索超高维空间中的表示和优化。也许有一天,对深度学习网络的结构进行分析,我们将得出理论上的预测,并揭示出对智能本质的深刻见解。

     

    对于真实世界,或许并不仅仅存在一个函数来描述,也许我们尚未探索在高维空间中仍然存在的大规模并行算法的世界,这远远超出我们所居住的三维世界,以及数字计算机的一维指令序列的直觉。

     

    就像平面国的方块绅士一样,我们能够从更高维中,瞥见一个远远超出旧视野的新世界。

     

     

    Terry J. Sejnowski,1947年生人,加州大学圣迭戈分校生物科学教授,美国索尔克生物研究所计算神经生物学实验室主任,美国艺术与科学院院士,美国工程院院士,美国国家发明家科学院院士,美国医学院院士,美国科学院院士。在神经网络和计算神经科学方面的研究具有开创性。

     

    第一届NeurIPS研讨会于1987年在丹佛科技中心举行。600名与会者来自多个跨学科领域,包括物理学、神经科学、心理学、统计学、电子工程、计算机科学、计算机视觉、语音识别和机器人学,但他们都有一个共同点:他们都致力于解决那些用传统方法无法轻易解决的难题,而且他们往往是自己学科的佼佼者。

     

    现在回想起来,33年后,正是这些“格格不入”的人把他们研究的领域推进到由大数据集组成的高维度空间,这就是我们今天生活的世界。作为每年组织NeurIPS大会的基金会主席,我见证了这个创造了现代机器学习社区的卓越发展。NeurIPS大会稳步增长,2019年吸引了超过14000名参会者。许多棘手的问题最终变得容易处理,而今天机器学习已经成为当代人工智能的基础。

     

    机器学习的早期目标比人工智能的目标要低。机器学习针对的目标一开始并非是通用人工智能,而是从感知、语言、运动控制、预测和推理等实际问题入手,主要方式是从数据中进行学习。相比之下,AI研究早期的特点是采用维度较低的算法。但是,这种方法只适用于受到良好控制的环境。

    比如说,在方块世界中,所有的物体都是矩形的实体,形状相同,环境中光照也相同。这些算法并不适用于现实世界的场景,因为现实世界中的物体形状复杂,反射率各不相同,照明条件也不受控制。

     

    而现实世界是高维度的,可能没有任何低维度的模型可以适用。早期基于符号和句法的自然语言模型也遇到了类似的问题,原因是忽略了语义的复杂性。只有深度学习语言模型的复杂性接近真实世界的复杂性,实际的自然语言应用才能成为可能。当今自然语言模型有数百万个参数,经过数百万个标记样本的训练,并且已经投入规模化使用。而更大的深度学习语言网络也正在生产中,为数以百万计的在线用户提供服务,从引入至今还不到十年。

    01

    深度学习的起源

    我曾写过一本书,《深度学习革命: 人工智能与人类智能的结合》(The Deep Learning Revolution: Artificial Intelligence Meets Human Intelligence ),讲述了深度学习是如何产生的。

     

    深度学习的灵感来自于大脑中大规模并行处理的架构,它的起源可以追溯到20世纪50年代 Frank Rosenblatt 的感知机,该感知机基于 McCulloch 和 Pitts 引入的单个神经元简化模型。感知机能够执行模式识别,并学会分类标记样本。Rosenblatt 证明,如果存在一组能够正确分类新输入的参数,并且有足够的样本,感知机的学习算法就能保证找到它。

     

    该学习算法将标记数据输入,通过梯度下降法,对权重参数进行微小的调整。这个简单的模拟是当今更大更复杂的神经网络架构的核心,但从感知到深度学习的跳跃并不是一个一帆风顺的过程。我们可以从中吸取教训。

     

    图注:感知机是Frank Rosenblatt在1957年就职于康奈尔航空实验室时发明的一种人工神经网络,它可以被视为一种最简单形式的前馈神经网络,是一种二元线性分类器。

     

    感知机学习算法需要用实数计算,而数字计算机在20世纪50年代表现不佳。Rosenblatt 从海军研究办公室获得了今天相当于100万美元的拨款,用于建造一台大型模拟计算机,该计算机可以使用代表可变权重的电机驱动的电位器组,来实现权重并行更新。

     

    而感知机被赋予的巨大期望不久便被Minsky 和 Papert 打破了。他们在《Perceptrons》一书中指出,感知机只能表示在权重空间中线性可分离的类别。虽然在书的最后,Minsky 和 Papert 考虑到将单层扩展到多层感知器的前景,一层传递到下一层,但对于是否有办法训练这些更强大的多层感知机他们提出了质疑。不幸的是,许多人认为这种质疑是决定性的,从事神经网络的研究人员审视完这个问题,最终选择了放弃。

     

    20世纪60年代,计算能力与我们今天相比微不足道;当时的情况更适合编写程序,而不是做机器学习,早期编写程序解决玩具问题的成果看起来鼓舞人心。到了20世纪70年代,机器学习已经失宠,但到了20世纪80年代,数字计算机的速度提高了,使得模拟中等规模的神经网络成为可能。

     

    在接踵而至的20世纪80年代神经网络复兴中,Geoffrey Hinton 和我提出了一种用于训练玻尔兹曼机的学习算法,与一般观念相反,证明了训练多层网络是可能的。玻尔兹曼机学习算法是局部性的,只依赖于单个神经元的输入和输出之间的相关性,这是一种发现于大脑皮层的赫布可塑性。

     

    有趣的是,训练过程中计算出的相关性必须通过没有输入的相关关系(我们称之为睡眠状态)进行规范化,以防止自我参照学习。在无监督学习模式下,也可以学习不带标签输入的联合概率分布。然而,同时提出的另一种基于误差反向传播的学习算法虽然牺牲了局部性 ,但效率更高。这两种学习算法都使用随机的梯度下降,这是一种优化技术,可以逐步改变参数值来最小化损失函数。

     

    02

    迷失在参数的空间

     

    20世纪80年代的网络模型在输入和输出之间很少有超过一层的隐藏单元,但按照统计学习的标准,它们已经高度超参数化了。尽管以今天的标准来看,这些网络是很小的,但是它们比传统的统计模型拥有的参数已经大了几个数量级。

    根据统计学原理,在可用训练集相对较小的情况下,很难实现泛化。然而,即使是简单的正则化方法,比如权值衰减,也会导致模型具有比较好的泛化能力。更让人意想不到的是,非凸损失函数的随机梯度下降很少陷入局部极小。

     

    这些网络模型和它们的高维参数空间的几何使它们能够更加有效地模拟和预测,且能够获得良好的泛化能力,这与传统直觉的错误预测恰恰相反。

      

    网络模型是高维动态系统,可以学习如何将输入空间映射到输出空间。这些函数具有特殊的数学属性,但我们现在只是刚刚开始理解这些数学属性。在高维参数空间中,大多数临界点是鞍点,局部极小值则相对少见。此外,神经网络一般是从参数空间中的一个随机起点进行梯度下降收敛。由于过参数化,因此解决方案的简并性改变了问题的本质,把一个“干草堆里找针”的问题,变成了“针堆里找针”。

     

    但许多问题并没有回答:

     

    • 为什么可以从这么少的样本和这么多的参数中得出正确的结论?

    • 为什么与其他优化方法相比,随机梯度下降在寻找有用函数方面如此有效?

    • 对于同一个问题,所有好的解决方案的集合有多大?

    • 好的解决方案在某种程度上是相互关联的吗?

    • 架构特点和能够促进泛化的归纳偏见之间有什么样的关系?

     

    探究这些问题的答案,显然将帮助我们设计更好的网络架构和更有效的学习算法。

     

    20世纪80年代,没有人知道神经网络学习算法可以根据网络中的神经元和权重数量进行缩放调整。与许多人工智能算法不同的是,随着深度学习网络规模的扩大,训练规模随着参数的增加而线性增加,性能随着网络层数的增加而不断提升。

    此外,深度学习网络的大规模并行处理架构可以通过多核芯片有效地实现。在完全并行的硬件下,学习和推理的复杂度为 O (1)。这意味着处理输入所需的时间与网络的大小无关,这是计算领域一种罕见的结合。

     

    当引入一类新的函数时,通常需要几代人的时间来进行充分的研究和探索。例如,当傅立叶在1807年引入傅立叶级数时,他无法证明收敛性,针对其是否能算作是函数也受到了质疑。但这并没有阻止工程师们使用傅里叶级数来求解热方程,并将其应用于其他实际问题。对这类函数的研究最终导致了对泛函分析的深刻见解,这是数学皇冠上的一颗明珠。

     

    03

    深度学习的本质

      

    继上世纪50年代的感知机和80年代的多层神经网络之后,如今进行的第三次神经网络架构探索,已经超出了学术研究的范畴,进入到了实用阶段。媒体甚至将深度学习直接称为“AI”。

     

    显然,深度学习对“AI”的贡献在于,将人工智能真正地扎根到现实世界中。

     

    传统AI是一个基于符号和规则的黑白世界,而现实世界是模拟的、嘈杂的、不确定的和高维的。深度学习则为两个世界提供了一个接口。

     

    例如传统上自然语言处理被认为是符号处理的问题。但递归神经网络直接将语言翻译变成了端到端,直接从句子中提取语法和语义信息,让自然语言处理不再面对繁琐的规则处理。

    上世纪60年代,AI研究所面临的一个严重问题是,AI与人类智能之间的关系。当时AI的工程目标是,通过直觉编写程序,来重现人类智能的功能。

     

    我曾问过卡耐基·梅隆大学的艾伦·纽厄尔(Allen Newell)一个问题,他是AI的先驱者之一,曾参与了1956年的达特茅斯夏季学术会议:为什么AI的先驱者忽略了人类智慧的基石——大脑?毕竟人类的大脑是唯一可以解决AI难题的存在性证据。

     

    他告诉我说,他本人对大脑研究的见解持开放态度,但当时对大脑的了解还不足以提供更多帮助。

     

    很不幸的是,随着时间的流逝,人工智能研究的态度逐渐从“了解不足”,变成了“与脑无关”。

     

    这种观点通常通过航空学的例子来证明其合理性:如果要制造飞行器,研究鸟类如何拍打翅膀或鸟的羽毛特性是浪费时间的。

     

    但这种观点忽略了一点:莱特兄弟正是从鸟类滑翔中学到了设计实用机翼的思想以及空气动力学的基本原理;现代喷气式飞机机翼正是模仿了老鹰的翅膀,从而节省了5%的燃料。

     

    现在人们对大脑如何处理感官信息。如何积累证据,如何做出决策以及如何计划未来行动等,已经有了很多了解。借鉴大脑,正当其时。

     

    另一方面,深度学习也同样可以从大自然中获得启发。当前计算机科学中正在兴起一个新兴的领域,称为算法生物学,即模拟生物系统中使用的各种问题解决策略来设计算法。我们可以从自然界中学习到一些复杂问题的一般原理和特定解决方案,这些问题经过数亿年的进化,已经贯穿到了生物的链条当中。

    在神经网络模型中,实际神经元的复杂性与模型神经元的简单性之间存在鲜明的对比。

     

    生物神经元本身是具有广泛的内部时间尺度的复杂动力系统。其中许多复杂性都源于细胞生物学,每个细胞在各种条件下都需要自己产生能量并保持稳态。

     

    但神经元的其他特征可能对其计算功能更重要,其中一些还尚未应用到模型网络当中,包括:

     

    • 针对特定功能优化的多种细胞类型;

    • 短期突触可塑性,可以在几秒钟的时间范围内兴奋或抑制;

    • 在突触内部可塑性基础上的一系列生化反应,受输入历史控制,持续时间从数秒延长至数小时;

    • 睡眠状态下大脑会离线,并重构自己;

    • 控制大脑区域之间流量的通讯网络;

    • ……

     

    将脑科学研究与AI研究进行协同,必然将使两方都受益。

    新皮质层大约在2亿年前,在哺乳动物的大脑中开始出现;它是大脑外表面折叠的神经元层。人的大脑皮层展平的话,直径大概有30厘米大,厚约5毫米;其中包含约300亿个皮质神经元,共分为 6 层,它们以局部定型模式彼此高度互连。

     

    脑皮层在进化过程中,相对于大脑中枢发生了极大的扩展,特别是人类的皮层,占据了大脑体积的80%。这种扩展表明,皮质结构具有可扩展性;而其他脑区相对于人体而言并没有太多扩展。

     

    有趣的是,形成皮质白质的远距离连接比局部连接少得多,它的体积与灰质体积呈 5/4幂次关系,白质体积上要大于灰质体积。大脑结构的这种尺度定律,可以提供一个重要的计算原理见解。

     

    在整个皮层中,包括细胞类型及其连接性在内皮层结构都相似,但却可以形成用于不同认知系统的专门区域。例如在视觉皮层,已经发展出了用于视觉的专用通路,这些通路在深度学习体系结构(卷积神经网络)中已经得到了验证。

     

    新皮层进化出的这种通用学习体系结构,反过来也极大地增强了许多特殊用途的皮层下结构的性能。

     

     

    人的大脑大概有 11 个不同的层级,上图提供了部分层级内容。

     

    在突触的水平上,每立方毫米的大脑皮层(米粒大小)包含十亿个突触;而当今最大的深度学习网络的参数大概也是在10~1000亿的量级。

     

    皮层具有数十万个深度学习网络的等效功能,每个深度学习网络都专门用于解决特定问题。这些专家网络如何组织?

     

    网络级别以上的 investigation level,主要的功能在于,组织不同皮质区域之间的信息流。这是系统级别的通信问题。关于数十万的专用网络如何组织,还有很多需要研究,其方法则是研究如何管理皮质中的全局信息流。

     

    皮质内的远程连接是稀疏的,原因在于维持远程连接的代价是比较高的,不仅需要长距离传输信息所需要的能量,更重要是它们还要占用大量空间。

     

    交换网络在感觉和运动区域之间会对信息进行路由,这些信息可以快速重新配置,来满足不断发展的认知需求。

     

    构建下一代AI系统的一个主要挑战就在于,如何将由许多深度学习专家网络构成的高度异构系统进行内存管理。

     

    如何才能够灵活地更新这些网络,而又不会降低已经学习到的记忆呢?这是保持稳定的终身学习的关键问题。

     

    目前有一些方法可以最大程度地减少存储损失和子系统之间的干扰。其中一种方法是,选择在哪里存储新知识。例如在睡眠期间,皮质会进入电活动的整体连贯模式;这种短暂的振荡事件(称为睡眠纺锤)在夜间会重复出现数千次,这个过程与记忆的巩固有关;纺锤是由白天经历的事件重放所触发,并被简约地整合到长期皮层语义记忆当中。

     

    04

    深度学习的未来

      

    当下的深度学习主要是受大脑皮层的启发,但人类大脑显然并不只是大脑皮层,还有许多其他脑结构来控制人们的运动以及其他功能,例如负责强化学习的基底神经节、为大脑提供运动命令的小脑。

     

    人类之所以能够进行复杂的社交互动,很大程度上是因为同时拥有大脑皮层和皮下神经的共同支持。

     

    因此,如何借鉴皮下神经,以及如何将其与神经网络进行结合,是构建自主AI系统一个很重要的研究方向。

    举例来说,脑干中的多巴胺神经元会计算奖励预测误差,这正是强化学习里时间差异学习算法中关键的计算,DeepMind 正是将这种算法与深度学习进行结合,研发出AlphaGo,在2017年打败了围棋世界冠军柯洁。

     

    中脑中的多巴胺神经元弥漫在整个皮层和基底神经节,它能够调节突触的生长,并提供获得长期奖励的动力。考虑到多巴胺神经元在人类大脑中的作用,甚至出现了一门神经经济学的新领域,来了解人类如何更好地做出经济决策。

     

    除了多巴胺外,在人类脑系统中,还有其他几个神经调节系统,也同样控制着脑部全局状态,来指导行为,表示负反馈,惊奇,信心、时空折现(temporal discounting)等。

    运动系统是AI的另一个领域,也是受生物学启发比较多的一个领域。将动物的运动与大多数机器人的刚性运动进行比较,关键的不同点在于,动物在控制肌肉的高维自由度方便具有非凡的灵活性。高维运动空间中,如何协调行为,将是深度学习网络研究的活跃领域。

     

    此外,还有一种分布式控制理论,可以解释脊髓、脑干和前脑中的多层控制是如何协调的。大脑和控制系统都必须处理反馈回路中的时间延迟,这会导致不稳定。

     

    小脑中的身体正向模型(The forward model of the body)提供了一种预测运动-感觉结果的方法,并且将感觉预测误差用到优化开环控制当中。

     

    例如,头部运动,前庭眼反射(VOR)通过在开环中快速使用头部加速度信号来稳定视网膜上的图像滑动。VOR的增益通过来自视网膜的滑动信号进行调整,小脑则使用该信号来减少滑动。

     

    感觉神经和运动神经的带宽有限,此外大脑的其他限制,但在分层控制系统下可以克服这些限制,这些分层控制系统的组件具有速度-精度折中方案。工程系统中也存在许多类似的案例,例如计算机中的内存系统,尽管组件并非最好,但仍然可以实现快速、准确的控制。

     

    05

    通向通用人工智能

    从深度学习的当前状态到通用人工智能,是否存在一条道路?

     

    从进化的角度看,大多数动物都可以解决其生存所面临的问题,但只有在人类这一脉的动物存在一般的抽象推理能力。

     

    但我们人类显然也并非特别擅长抽象推理,我们的大脑系统是从动物而来,还没有针对逻辑进行优化,因此需要长期训练才能够达到逻辑推理的能力。例如,小学生需要学习很多年才能够掌握计算机1s内就能完成的算法。

     

    不过,人类能够具备推理能力,这在原则上证明了,大规模的深度学习网络系统有可能发展出计划和决策的能力。

     

    当然人类并非唯一的参考,我们同样可以使用一些混合解决方案,例如DeepMind开发的神经图灵机,可以学习、排序、导航等。

     

    根据Orgel第二规则:大自然比我们聪明,但仍有可改进空间。

     

    当下深度神经网络,在有监督学习方面取得了巨大的进展,许多拥有大数据的领域都取得极大进步,例如机器翻译等。但是在现实中,更多的领域并没有足够的标签数据集。

     

    与之对应,人类在信息不足的时候,会首先对事物的可能结果做出一个潜意识地预判,对于符合预判的则把它视为正常,而对于意外情况会觉得惊讶。

     

    类比于人类,自监督学习将是一个很有前途的方向,其学习的目的则是从一些数据流中预测未来结果。

     

    此外,模仿学习也是一种方法,来学习重要行为并获得有关世界知识。

     

    人类在真正达到成人水平智力前,还有许多可以借鉴的学习方法。这些必然对设计通用人工智能大有裨益。

    06

    旧视野的新世界

    我们正处于一个可以称为“信息时代”的开始。数据从传感器涌入,传感器将数据转化为信息,然后通过一些方式将信息转化为知识,将知识转化为理解,如果幸运的话,也可以将知识转化为智慧。

    我们已经迈出了解决现实世界中复杂的高维问题的第一步;正像婴儿一样,虽然步履蹒跚,但我们已经走在正确的方向上。深度学习网络是数字计算机与现实世界之间的桥梁;这让我们可以根据自己的情况,例如通过语音与计算机进行互动,键盘将与打字机一样变得过时。

     

    Eugene Wigner 在他的论文“自然科学中数学的不合理有效性”(The Unreasonable Effectiveness of Mathematics in the Natural Sciences)中惊叹道:物理理论的数学结构常常揭示出对这种理论的深刻理解,从而得出经验预测。值得注意的是,方程中的参数很少,我们称为物理参数。本文也反映了 Wigner 的观点;但是,与物理定律不同,深度学习网络中存在大量参数,而且是可变的。我们才刚刚开始探索超高维空间中的表示和优化。也许有一天,对深度学习网络的结构进行分析,我们将得出理论上的预测,并揭示出对智能本质的深刻见解。我们可以从维度中受益。

     

    找到一类函数来描述真实世界复杂的现象,但也许还存在其他函数。也许我们尚未探索在高维空间中仍然存在大规模并行算法的世界,这远远超出了我们所居住的3维世界,以及数字计算机的一维指令序列的直觉。

     

    就像平面国的方块绅士一样,我们能够从更高维中,瞥见一个远远超出旧视野的新世界。



    点击左下角“阅读原文”,了解更多!

    展开全文
  • 26维空间

    千次阅读 2014-11-03 11:35:05
    二十六维空间 弦理论有更大的问题:似乎只有当空间— 时间是十维或二十六维,而不是通常的四维时它们才是协调的!当然,额外的空间 —时间维数是科学幻想的老生常谈;的确,它们几乎是必不可少的
    当代物理中弦理论认为:空间是十维或二十六维,除了已知的三维,剩余的维数都在量子力学的量度下(10的负十几次方)卷缩。该理论只是假想,虽有严密理论依据但并未得到试验证实。 (摘自时间简史
    二十六维空间
    弦理论有更大的问题:似乎只有当空间— 时间是十维或二十六维,而不是通常的四维时它们才是协调的!当然,额外的空间 —时间维数是科学幻想的老生常谈;的确,它们几乎是必不可少的,因为否则相对论对人们不能旅行得比光更快的限制意味着,由于要花这么长的时间,以至于在恒星和星系之间的旅行成为不可能。科学幻想的办法是,人们可以通过更高的维数抄近路。这一点可用以下方法描述。想像我们生活的空间只有二维,并且弯曲成像一个锚圈或环的表面(图10.7)。如果你是处在这圈的内侧的一边而要到另一边去, 你必须沿着圈的内边缘走一圈。然而,你如果允许在第三维空间里旅行,则可以直 穿过去。
    如果这些额外的维数确实存在,为什么我们没有觉察到它们呢?为何我们只看 到三维空间和一维时间呢?一般认为,其他的维数被弯卷到非常小的尺度——大约 为1英寸的一百万亿亿亿分之一的空间, 人们根本无从觉察这么小的尺度。我们只能看到一个时间和三个空间的维数,这儿空间—时间是相当平坦的。这正如一个桔子的表面:如果你靠非常近去看,它是坑坑洼洼的并有皱纹;但若离开一定的距离, 你就看不见高低起伏而显得很光滑。对于空间—时间亦是如此。因此在非常小的尺度下,空间—时间是十维的,并且是高度弯曲的;但在更大的尺度下,你看不见曲率或者额外的维数。如果这个图像是正确的,对于自愿的空间旅行者来讲是个坏消息,额外附加的维实在是太小了,以至于不能允许空间飞船通过。然而,它引起了另一个重要问题:为何是一些而不是所有的维数被卷曲成一个小球?也许在宇宙的极早期所有的维都曾经非常弯曲过。为何一维时间和三维空间摊平开来,而其他的维仍然紧紧地卷曲着? 人择原理可能提供一个答案。二维空间似乎不足以允许像我们这样复杂生命的 发展。例如,如果二维动物吃东西时不能将之完全消化,则它必须将其残渣从吞下 食物的同样通道吐出来;因为如果有一个穿通全身的通道,它就将这生物分割成两 个分开的部分,我们的二维动物就解体了(图10.8)。类似的,在二维动物身上实 现任何血液循环都是非常困难的。
    多于三维的空间维数也有问题。两个物体之间的引力将随距离衰减得比在三维 空间中更快。(在三维空间内,如果距离加倍则引力减少到1/4。在四维空间减少 到1/8, 五维空间1/16,等等。)其意义在于使像地球这样绕着太阳的行星的轨 道变得不稳定,地球偏离圆周轨道的最小微扰(例如由于其他行星的引力吸引)都 会引起它以螺旋线的轨道向外离开或向内落到太阳上去。我们就会被冻死或者被烧 死。事实上,在维数多于三维的空间中,引力随距离变化的同样行为意味着,太阳 不可能由于压力和引力相平衡,而存在于一个稳定的状态,它若不被分解就会坍缩 形成黑洞。在任一情况下,作为地球上生命的热和光的来源来说,它没有多大用处。 在小尺度下,原子里使电子绕着原子核运动的电力行为正和引力一样,这样电子或 者从原子逃逸出去,或者以螺旋的轨道落到原子核上去。在任一情形下,都不存在 我们所知道的原子。 看来很清楚,至少如我们所知,生命只能存在于一维时间和三维空间没被卷曲得很小的空间—时间区域里。这表明,只要人们可以证明弦理论至少允许存在宇宙的这样的区域——似乎弦理论确实能做到这一点,则我们可以用弱人择原理。同样, 也会存在宇宙的其他区域或其他宇宙(不管那是什么含意),那里所有的维都被卷 曲得很小,或者多于四维几乎是平坦的。但在这样的区域里,不会有智慧生物去观察这有效维数的不同数目。
    展开全文
  • 卡拉比的六维空间

    千次阅读 2018-05-03 13:45:00
    先来看句《蚁人》中的台词——“到了次原子级别,时间和空间都毫无意义。”,这句话出现在电影的最后(大约100分钟-101分钟)。 在电影的末尾,男主角斯科特·朗处于个无限缩小的状态中,他先是穿过了空气颗粒和...

    先来看一句《蚁人》中的台词——“到了次原子级别,时间和空间都毫无意义。”,这句话出现在电影的最后(大约100分钟-101分钟)。


    在电影的末尾,男主角斯科特·朗处于一个无限缩小的状态中,他先是穿过了空气颗粒和灰尘,穿过空气颗粒中的虫螨,缩小到比细菌还要小。后来画面中有几段像是奶酪或者蛋糕一样的孔状结构,那是分子。再然后中间有一个球形环绕着几个轨道样的东西,那是原子。接着,主人公缩小到比原子核还小的亚原子大小,也就是夸克电子和胶子那个级别,可以看到的是一些散乱的云一样的模糊团絮状结构,表现出的是概率云的效果。画面继续往下是一些不停变换的复杂颜色和线条,这是弦理论所说的物质的最基本结构即处于不停震动状态的弦,由于震动的频率的不同,构成不同的亚原子。


    最后的最后,男主停留在阵列的层叠状闪烁体前,那是几个蜷缩维度的卡拉比丘流形,男主是最终处在了卡拉比-丘成桐空间中,即处于六维空间中。


    关于维度空间,弦理论给出了说明。虽然目前弦理论还尚未被证实。弦理论告诉我们,我们的宇宙具有10维的空间,在超弦理论基础上发展起来的膜理论更是宣称宇宙有11维空间。而事实上我们平常只能感知到空间的三个维度即长、宽、高,也许还有时间,那么其余六个维度在哪里呢?它们是六个卷缩维,蜷曲隐藏起来,因此我们看不到也感知不到它们的存在。这些多出来的维度卷曲在一种叫做“卡拉比-丘成桐”的空间结构里,以“卡-丘”空间的形状卷蜷缩起来,蜷缩在普朗克长度的空间上。在各个方向上的振动,根据卷缩维的维度不同,弦的长度不同,形状不同,产生各种各样的缠绕能和振动能,从而形成各种性质的点状粒子与力,粒子拼合成不同的物质,在力的作用下,最后构成了恢弘的宇宙。


    男主角斯科特•朗在不停缩小的过程反映了了微观空间单位不断缩小的过程,到最后他处于卡丘空间中蜷缩在普朗克长度的空间上。而到了普朗克时间和空间的尺度,才会开始考虑空间和时间的连续性,透过不确定原理,普朗克长度与普朗克能量相关联。在这尺度下,大小与距离的概念崩解,量子不确定性变成绝对关键。因此电影里才会说,到了这个级别,“时间和空间都已经毫无意义了。”


    20世纪50年代是几何与拓扑学最辉煌的时代。一批年轻的数学家证明了一系列伟大的数学定理。“卡拉比猜想”就是在这个时期被提出的。1954年的国际数学家大会上,卡拉比提出猜想,并预言有这么一类紧缩的空间结构存在。他猜想,复杂的高维空间是由多个简单的多维空间“粘”在一起,因为简单的多维空间目前已经有成熟的数学工具进行解析,如果高维空间能够拆解,也就意味着高维空间可通过一些简单的几何模型拼装得到。这就是著名的“卡拉比猜想”——关于复几何领域高维空间的单值化的猜想。但由于这个猜想的证明十分困难,此类空间是否存在一直悬而未决。直至21年后丘成桐结合微分几何、代数几何、多复变函数、度量几何等多个数学分支的方法为他提供了强有的证明,卡比拉-丘成桐空间的概念才正式确立起来。


    那么“卡比拉-丘成桐”空间的大小如何,它又是一个怎样的空间?它的半径极小,只有质子和中子半径的亿万分之一,以至于目前我们是无法用任何办法来观测到它。其次,由于这个理论只是科学家猜测出来的一个理论,它有六个维度,因此完全无法用仪器进行测量。


    但是我们可以对它进行描述,它的大概样子像一个被揉得乱七八糟随手丢弃的废纸团。

    由于卡丘空间是一个六维微观世界的空间构造,在这种极其抽象的空间中,物质形态被极度扭曲,因此可以实现类似于自己看到自己的后脑勺或者后背一样神奇的效果。如果向着自己所看到的后背扔一个物品,一段时间后后背将被打中。这个东西被扔出后像经过洗衣机的翻滚和过山车的颠簸,途中艰难万险拐了无数个弯最终抵达后背。


    同时由于不可观测,科学家们对卡丘空间的描述完全是通过计算得出的。这个六维卷曲的空间正是采取了这种类似废纸团一样奇特而又古怪的方式紧缩起来的。它们看起来是一颗颗珠子,穿在普朗克长度的细细长长的弦上面,弦可能从它们的“孔”中穿过去,也可能绕过它们,或是包围缠绕着它们。这些细细长长的弦在不停的振动着,就组成了各种奇怪的形态。


    “卡拉比-丘成桐”空间理论的证明,为几何学和物理学的发展做出重大贡献,带来突破性进展。“卡-丘”空间对于超弦理论亦是非常重要,它的“紧缩性能”正是超弦理论物理学家要找的。目前已经测试出25种“卡-丘”空间构造符合超弦理论的“胃口”。

     

    结语:在本文中,笔者通过科幻电影的引入,对弦理论进行了阐释,并解释了“卡比拉-丘成桐”空间被发现证明的过程,分析了卡丘六维空间的具体形态和意义。


    原文发布时间为:2017-12-26
    本文作者:陶卿
    本文来源:量子趣谈,如需转载请联系原作者。

    展开全文
  • 维空间点索引数据结构

    千次阅读 2012-03-06 00:54:11
    、 四叉树(quad tree)是在数据库中放置和定位文件(称作记录或键)的方法。这算法通过不停的把要查找的记录分成4部分来进行匹配查找直到仅剩下条记录为止。    在树中,记录被存储在叶子的位置上。这...

    一、

    四叉树(quad tree)是在数据库中放置和定位文件(称作记录或键)的方法。这一算法通过不停的把要查找的记录分成4部分来进行匹配查找直到仅剩下一条记录为止。
       
      在树中,记录被存储在叶子的位置上。这一名字的由来是因为记录被存储在端点上,它们上面再没有节点了。分支被称作节点。数的顺序是每节点的分支(也称孩子)数。在四叉树中,每个节点通常有4个孩子,因此顺序是4。四叉树的叶子数也是4。为达到想要的记录所进行的查找操作次数成为树的深度。下图给出了深度为3的四叉树。

                                       
        
      在实际的树中,可能有成千、成万或数十亿条记录。不是所有的叶子必须有一条记录,但只少要有一半包含记录。不包含记录的叶子成为空。在上面例子中,第8、第12、第16个叶子是空的,用空白圆来指示。
       
      四叉树(quad tree)是在二维图片中定位像素的唯一适合的算法。因为二维空间(图经常被描述的方式)中,平面像素可以重复的被分为四部分,树的深度由图片、计算机内存和图形的复杂度决定。





    二、

    KD-Tree 在二维中 2D-Tree

     KD-Tree是一种由二叉搜索树推广而来的用于多维检索的树的结构形式(K即为空间的维数)。它与二叉搜索树不同的是它的每个结点表示k维空间的一个点,并且每一层都根据该层的分辨器(discriminator)对相应对象做出分枝决策。顶层结点按由分辨器决定的一个维度进行划分,第二层则按照该层的分辨器决定的一个维进行划分···,以此类推在余下各维之间不断地划分。直至一个结点中的点数少于给定的最大点数时,结束划分。

      KD-Tree的分辨器根据不同的用途会有不同的分辨器,最普通的分辨器为:n mod k(树的根节点所在层为第0层,根结点孩子所在层为第1层,以此类推)
      即:若它的左子树非空,则其左子树上所有结点的第i维值均小于其根结点的第i维值;
      若它的右子树非空,则其右子树上所有结点的第i维值均大于其根结点的第i维值;并且它的左右子树也分别为KD-Tree。






    展开全文
  • OpenGL 三空间变换

    千次阅读 2010-03-17 10:49:00
    我们生活在个三的世界——如果要观察个物体,我们可以:1、从不同的位置去观察它。(视图变换)2、移动或者旋转它,当然了,如果它只是计算机里面的物体,我们还可以放大或缩小它。(模型变换)3、如果把物体...
  • m=4,即点均为四维空间的点。 n数目不定,可以理解为几万,几十万甚至上千万。 使用spark计算。资源配置为:executor-cores:6,executor-memory:10G。   解法: 首先将点的矩阵弄成dataframe(dataframe里每...
  • 随着地理空间信息服务产业的快速发展,地理空间数据的要求越来越高。对地理空间数据的要求正...主要内容有:、基本概念;二、地面三激光扫描仪测量原理;三、三激光扫描系统分类;四、三激光扫描系统特点;五、
  • 线上预估服务是AI在企业应用落地的关键环节,企业通常会采用分布式计算架构在内存中完成实时数据处理和高达万亿维的模型特征存储,并通过多集群副本解决传统纯内存(DRAM)天生的易"失"性隐患,以达到线上实时服务...
  • 3.1 一维插值方法 1、数据处理的应用背景 2、插值的基本原理 3、引例 3.1、引例演示 4、一维插值定义 5、一维插值原理 6、一维插值方法 6.1、拉格朗日插值 6.2、分段线性插值 6.3、三次样条插值 3.2 二插值方法 1...
  • 条码技术——从一维到二 从条形码到二维码 生活中,我们经常能够看到二维码,到处充斥着“扫扫”,但是,你是否想过,小小的二维码里面藏着哪些信息?二维码又是如何被创造出的? 条码技术的诞生从...
  • 数灾难

    千次阅读 2016-04-14 23:11:57
    维度灾难是机器学习中的另个重要问题,这个概念是贝尔曼(Bellman)在 1961 年首先提出的,它描述了以下事实:许多算法在低维空间表现很好,但输入为高维时,算法往往失效。 在机器学习领域,这有更多的意义,...
  • 建模

    千次阅读 2015-08-05 19:47:05
    美国Autodesk公司的3D Studio Max(前身是Discreet公司的,后被Autodesk收购)是基于PC系统的三建模、动画、渲染的制作软件,为用户群最为广泛的3D建模软件之。常用于建筑模型、工业模型、室内设计等行业。因为...
  • 白话空间统计二十一:密度分析() 密度分析这个概念其实很早就想写了,也有无数同学都问过我,虾神你能不能讲讲那些漂亮的热度图是怎么做的啊?比如下面这种: 如果说,这是互联网地图里面,最让人...
  • 常用的3D三建模软件大全有哪些?

    万次阅读 2020-05-14 16:19:06
    你可能听过3D建模——常用于动画及游戏等作品的要求,通俗来讲,就是通过三维制作软件,通过虚拟三维空间构建出具有三维数据的模型。3D建模,可以使得动画及游戏作品能够展现现实世界,真实的三维空间,有真实的距离...
  • 空间统计二十一:密度分析(

    千次阅读 2018-01-21 18:15:06
    白话空间统计二十一:密度分析() 密度分析这个概念其实很早就想写了,也有无数同学都问过我,虾神你能不能讲讲那些漂亮的热度图是怎么做的啊?比如下面这种: 如果说,这是互联网地图里面,最让人...
  • 通俗易懂讲数据仓库之【缓慢变化

    万次阅读 多人点赞 2020-05-10 14:58:57
    本篇博客,博主为大家带来的是关于数据仓库中个非常重要的知识点缓慢变化的讲解!         码字不易,先赞后看 文章目录缓慢变化1. 什么是缓慢变化(SCD)1.1 缓慢...
  • 受信息容量的限制,一维条码必须依赖于后台的数据库才能使用。在没有数据库或不便连网的地方,一维条码的使用受到局限。为此,美国Symbol公司发明了种被称作便携数据文件的二条码棗PDF417技术。二条码是种...
  • ——本文文字内容节选自帕拉格·康纳《超级版图 ——全球供应链、超级城市与新商业文明的崛起》书 配图来自互联网。 最后文化圈部分,是空间统计:空间权重矩阵的部分。  在地球近地轨道(距...
  • 作者 | 彭厚文、傅建龙来源 | 微软研究院AI头条(ID: MSRAsia)编者按:当时间从一维走向二,时序信息处理问题中一种全新的建模思路由此产生。根据这种新思路及其产生的二时间...
  • 滴滴老板:程的故事

    万次阅读 2018-05-04 09:18:56
    35岁身价165亿:卖过保险,干过足疗,滴滴打车程如何成功? 2018-05-03 11:30 来源:塔木德富豪会mp 保险 /滴滴 /大学 原标题:35岁身价165亿:卖过保险,干过足疗,滴滴打车程如何成功? 来源:商界洞察...
  • 半秒内筛一亿以内的所有素数

    千次阅读 2015-03-19 18:40:00
     这个问题可以有两种解法:种是用“筛子法”,另种是“除余法”。  如果要了解“除余法”,请看另篇文章连接http://blog.csdn.net/lingling_1/article/details/44459423 《求质数 之 除余法(C语言描述)》...
  • 3D打印:三智能数字化创造(全彩)(全球第本系统阐述3D打印与3D智能数字化的专业著作) 吴怀宇 编  ISBN 978-7-121-22063-0 2014年1月出版 定价:99.00元 428页 16开 编辑推荐 本书包含最新创客实践:...
  • Voxelization 三模型体素化

    千次阅读 2019-08-22 21:05:12
    Voxelization 三模型体素化 导入mesh文件,以obj文件为例: 一般文件mesh文件内容有顶点与面,可以用三设计软件生成,生成的时候注意mesh文件只保存三角形面片,以便后面读取 ...第步:离散三条边(线段) 这...
  • 4D数据是测绘地理信息人的全部吗... 跳出传统测绘地理信息的圈子,以空间数据为基准和尺度的各种数据分析和应用正在爆发。剧变面前,传统地信人正在尝试改变,这种改变能够帮助他们完成从传统数据采集者到数据更好应用
  • 真三立体显示技术分类、特点及展望真三系统显示技术特点几种主流的真三系统显示技术PerspectaFelix3D 显示器DepthCube...(3)可具有超过 1 亿体元的三图像分辨率; (4)可进行三测量; (5)无需佩戴...
  • 2021数杯A题思路 --- 思路分享

    千次阅读 2021-05-26 20:53:42
    2021数杯思路 届时会在群内分享赛题思路,欢迎大家加群Q 赛题内容 (先占个坑,出题目后第时间更新) 第问 (先占个坑,出题目后第时间更新) 第二问 (先占个坑,出题目后第时间更新) 第三问 (先占个坑,出...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 22,787
精华内容 9,114
关键字:

一亿维空间