精华内容
下载资源
问答
  • 【黑客联盟2016年12月06日讯】HPE 宣布成功研制...它颠覆了以往 把 CPU 作为计算机核心的惯例,而采取多个处理器共用中央存储集群的运行模式。 虽然 HPE 声称该架构有极广的适用性,但它主要是为大型数据中心所设...

    【黑客联盟2016年12月06日讯】HPE 宣布成功研制“基于存储的计算架构”(Memory-Driven Computing)。它颠覆了以往 把 CPU 作为计算机核心的惯例,而采取多个处理器共用中央存储集群的运行模式。

    虽然 HPE 声称该架构有极广的适用性,但它主要是为大型数据中心所设计,尤其是对物联网大数据的分析、处理。另外,HPE 并没有打算向服务器市场推出基于全新架构的产品,这次的发布会更像是一个广告——为 HPE 使用新技术的的各类企业产品做推广,尤其是 HPE 的持久存储和尚在开发中的非易失性存储产品。将来,新的计算架构是否会颠覆企业服务器市场?我们拭目以待。

    10011140_Htjb.jpg

    众所周知,今天的电脑,是以 CPU 作为核心,内存和硬盘存储作为辅助。这其实是 1940 年代“计算机之父”约翰·冯·诺依曼设计的系统架构,距今已超过 60 年。

    计算机巨头 HPE(惠普企业)认为,革新计算机系统架构的时机正在成熟。

    本月 28 日,(QQ公众号:黑客联盟)了解到HPE 宣布,已成功开发出下一代计算机架构:基于存储的计算。这是一个把存储,而非处理器,作为计算机运算核心的概念。HPE 认为,它能带来数个量级的计算性能和效率提升。

    注:HPE(惠普企业)全称为“Hewlett Packard Enterprise”,为原惠普公司企业业务部,现已独立拆分。

    10011140_CSp7.jpg

    动图演示:从传统以 CPU 为核心的计算架构到基于存储的计算架构

    如图所示,采用传统架构的大型数据中心,大量工作被浪费在系统之间数据的传输。而在基于存储的计算架构中,多个 SoC 共享中央存储集群,极大提高传输数据的效率

    作为对“基于存储的计算”的概念验证,HPE 还展示了采用新一代计算架构的原型机:

    10011141_D6z0.jpg

    研究人员正在组装“the Machine”原型机的核心部件

    10011141_hala.jpg

    “The Machine”原型机组装完成

    原型机的每一个 SoC 有独立 DRAM(系统内存),但通过光子通讯共享 2 到 4TB 的“持久存储”(persistent memory)。所有处理器能通过光纤维,在其他节点(nodes)上连接持久存储。这构成了一个容量巨大、可按字节寻址的中央存储集群。该公司没有透露 CPU 信息,但外媒猜测,它可能使用了 64 位 ARM v8-A 或英特尔 X86 处理器。

    HPE 用这台原型机展示了:

    计算节点与被系统共享的 Fabric-Attached Memory 存储集群连接。

    一个经过优化的、基于 Linus 的操作系统在 SOC 芯片上运转。

    计算机的光通讯设备,包括新的 X1 光子模块能连接上网并正常运转。

    新的软件编程工具,能对富余的持久存储空间加以利用。

    HPE 表示,这个新的计算架构能够按照 HPE 工程师们的设计,让各个基础模块协同运转。

    “The Machine”项目

    据美国高德纳公司预计:到 2020 年,世界物联网设备将达到 208 亿台,这会生成前所未有的海量数据。届时,数据增长的速度,会大大高于现有计算架构对数据进行处理、存储和加密的速度。

    这要求数据中心和服务器,把数据处理性能提高到一个前所未有的新水平。而在摩尔定律已失效的情况下,在现有计算架构上实现这一目标显得不切实际。这便是 HPE “the Machine”项目的初衷:为数据中心和超算系统开发下一代高性能计算架构。

    10011141_O2td.jpg

    “the Machine”的项目 logo

    上文中的原型机,便是诞生于“the Machine”项目。HPE 声明,“基于存储的计算”会颠覆已成为老古董的、以 CPU 为核心的计算机架构。因此,它将成为计算机发展史上的“关键里程碑”。

    HPE 副总经理 Antonio Neri 对(QQ公众号:黑客联盟) 说:“‘The Machine’是 HPE 迄今为止规模最大、最复杂的研究项目。用这个原型机,我们展示了“基于存储的计算”的前景,并为相关创新打开了大门。我们的客户和整个计算行业,都将在这项创新中受益。我们会继续研究能颠覆现有游戏规则的黑科技。”

    在项目的设计阶段,模拟程序就预测,新架构的运行速度将比现有计算系统高“数个数量级。现在,HPE 在现有的计算机硬件上测试了新的软件编程工具,并证明根据在不同工作情况下,理论上能达到最高 8000 倍的运算速度。

    10011141_o4OW.jpg

    基于存储计算架构在不同任务下的运算速度。其中,在内存计算能达到现有技术的 15 倍, 海量图形推理 100 倍,近似物搜索 300 倍,金融模型运算 8000 倍。

    用更多节点和存储扩展原型机的配置之后, HPE 预计仍能达到相似倍数的性能提升。

    “The Machine”项目更多地关注于百万兆级运算(exascale computing)。百万兆级运算是高性能计算(High Performance Computing)一个快速发展的领域,它致力于开发出,性能比现有云计算平台高几个数量级的计算机设备。

    除了传说中的性能,HPE 基于存储的计算架构还拥有极为理想的扩展性从迷你物联网设备到百万兆级运算设备,该架构都可以应用。这使它成为,处理高性能计算和数据密集任务的理想平台,包括大数据分析。

    新架构的商业化

    HPE 已经决定,不会推出采用新架构的完整计算机系统。 这很可能是由于成本的限制。他们推出这台“the Machine”原型机也不是为了打造产品,而是向世界展示该项目的进展。在很长一段时间内,这台原型机会是世界上唯一一台基于存储计算架构的计算机。

    但是,“the Machine”项目开发出的这一系列技术,将会被分拆应用于 HPE 的各项独立产品中。这些技术可被分为四类:1.非易失性存储 (NVM,Non-Volatile Memory) 2. 光纤维 3. 软件生态系统 4. 安全。其中,非易失性存储产品和生态系统尤为重要。

    非易失性存储

    HPE 正努力把可按字节编址的(byte-addressable)非易失性存储产品带到市场,该公司计划最早在 2018/2019 年实现。它的目的是把 DRAM 的性能与传统存储产品大容量、持久的特点相结合。利用“The Machine”的项目成果,HPE 已经开发出了持久内存,这是开发出可按字节编址的非易失性存储产品的关键一步。该公司已经在 ProLiant DL360 和 DL380 Gen9 服务器上发布了 HPE 持久内存。

    以下为 HPE 非易失性存储产品的路线图:

    ·现在:ProLiant设备将引入持久性内存以供各应用程序使用,这部分内存由DRAM及闪存混合构成。

    2016年 – 2017年:采用经过改进的DRAM持久性内存。

    2018年 – 2019年:为软件提供速度低于RAM但成本更为低廉的真正非易失性内存(简称NVM)。

    2020年及之后: NVM技术将被应用于多个产品类别当中。

    生态系统

    HPE 已经为基于存储计算架构的软件开发做了很多工作。今年,HPE 发布了与 Hortonworks 和 Spark 在新架构上软件开发的合作。在今年 6 月,HPE 在 Github 发布了,帮助开发者熟悉新架构软件开发的代码包。该公司准备在明年,把这些代码用于已有的硬件上。HPE 将最早在 2018/2019 年, 开始把下一代分析工具和应用程序整合入新系统。他们计划在未来几年中,把生态系统的技术和标准整合入一整套的产品当中。

    10011142_6yWr.jpg

    该公司对(QQ公众号:黑客联盟) 表示,他们会尽快把基于存储计算架构的各项附属技术商业化,推出各项衍生产品。

    转载于:https://my.oschina.net/u/3579120/blog/1533039

    展开全文
  • 构建下一代软件架构

    千次阅读 2005-01-26 10:03:00
    构建下一代软件架构 作者:李巍 来 源: 中国计算机报 Web服务一种作为炙手可热的技术,应用到企业的IT系统和商业流程之中,并给企业带来直接的经济效益,一直以来得到了国内外企业管理者的推崇。而在近两年,伴随...
    展开全文
  • 深度学习在手机等移动端...近日,谷歌将这一技术的第二代产品开源,开发者称,新一代 MobileNet 的模型更小,速度更快,同时还可以实现更高的准确度。项目链接:https://github.com/tensorflow/models/tree/master/re
        


    深度学习在手机等移动端设备上的应用是机器学习未来的重要发展方向。2017 年 4 月,谷歌发布了 MobileNet——一个面向有限计算资源环境的轻量级神经网络。近日,谷歌将这一技术的第二代产品开源,开发者称,新一代 MobileNet 的模型更小,速度更快,同时还可以实现更高的准确度。

    项目链接:https://github.com/tensorflow/models/tree/master/research/slim/nets/mobilenet

    谷歌 2017 年推出了 MobileNetV1,它是一种为移动设备设计的通用计算机视觉神经网络,因此它也能支持图像分类和检测等。一般在个人移动设备上运行深度网络能提升用户体验、提高访问的灵活性,以及在安全、隐私和能耗上获得额外的优势。此外,随着新应用的出现,用户可以与真实世界进行实时交互,因此我们对更高效的神经网络有着很大的需求。

    今天,谷歌很高兴地宣布下一代移动视觉应用 MobileNetV2 已经发布。MobileNetV2 在 MobileNetV1 的基础上获得了显著的提升,并推动了移动视觉识别技术的有效发展,包括分类、目标检测和语义分割。MobileNetV2 作为 TensorFlow-Slim 图像分类库的一部分而推出,读者也可以在 Colaboratory 中立即探索 MobileNetV2。此外,我们也可以下载代码到本地,并在 Jupyter Notebook 中探索。MobileNetV2 在 TF-Hub 中会作为模块使用,且预训练保存点可在以下地址中找到。

    • Colaboratory 试验地址:https://colab.research.google.com/github/tensorflow/models/blob/master/research/slim/nets/mobilenet/mobilenet_example.ipynb

    • MobileNetV2 本地实验地址:https://github.com/tensorflow/models/blob/master/research/slim/nets/mobilenet/mobilenet_example.ipynb

    • 预训练模型下载:https://github.com/tensorflow/models/tree/master/research/slim/nets/mobilenet

    MobileNetV2 基于 MobileNetV1[1] 的基本概念构建,并使用在深度上可分离的卷积作为高效的构建块。此外,MobileNetV2 引入了两种新的架构特性:1)层之间的线性瓶颈层;2)瓶颈层之间的连接捷径。MobileNetV2 的基本架构展示如下:

    640?wx_fmt=png

    MobileNetV2 的架构概览,蓝色块如上所示为复合卷积构建块。

    我们可以直观理解为,瓶颈层对模型的中间输入与输出进行编码,而内层封装了模型从像素等低级概念到图像类别等高级概念的转换能力。最后,与传统的残差连接一样,捷径能快速训练并获得更优精确度。读者可查阅文末的 MobileNetV2 论文了解更多的详情。

    V2 与第一代的 MobileNet 相比有什么区别?总体而言,MobileNetV2 模型在整体延迟范围内上实现相同的准确度要更快。特别是,目前新模型减少了两倍 operations 的数量,且只需要原来 70% 的参数,在 Google Pixel 手机上的测试表明 V2 要比 MobileNetV1 快 30% 到 40%,同时还能实现更高的准确度。

    640?wx_fmt=png

    MobileNetV2 不仅速度更快(降低延迟),还刷新了 ImageNet Top 1 准确度。

    MobileNetV2 是一个用于目标检测和分割的非常有效的特征提取器。比如在检测方面,当 MobileNetV2 搭配上全新的 SSDLite [2],在取得相同准确度的情况下速度比 MobileNetV1 提升了 35%。我们已通过 Tensorflow Object Detection API [4] 开源了该模型。

    640?wx_fmt=png

    为实现实时语义分割,我们借助简化版 DeepLabv3 [3] 把 MobileNetV2 用作特征提取器,这将稍后公布。在语义分割基准 PASCAL VOC 2012 上,MobileNetV1 与 MobileNetV2 作为特征提取器表现相当,但是后者所需的参数量减少了 5.3 倍,在 Multiply-Adds 方面 operations 也减少了 5.2 倍。

    640?wx_fmt=png

    正如我们所看到的,MobileV2 面向移动端提供了一个非常高效的模型,它能处理许多基本的视觉识别任务。最后,谷歌也希望能与广泛的学术社区和开源社区分享这个新模型,并期待它有新的提升与应用。

    论文:MobileNetV2: Inverted Residuals and Linear Bottlenecks

    640?wx_fmt=png

    论文链接:https://arxiv.org/abs/1801.04381

    本文中我们介绍了一种新的移动端架构——MobileNetV2,其在多任务和基准以及不同模型大小的范围上进一步刷新了移动端模型的当前最佳性能。我们还介绍了如何通过全新框架 SSDLite 将这些模型高效应用于目标检测。此外,我们也展示了通过简化版 DeepLabv3(我们称之为 Mobile DeepLabv3)构建移动端的语义分割方法。

    MobileNetV2 架构基于反向残差结构,其中残差块的输入和输出是较短的瓶颈层,这与在输入中使用扩展表征的传统残差模型正相反。MobileNetV2 使用轻量级深度卷积过滤中间扩展层的特征。此外,我们发现为了保持表征能力,移除短层中的非线性很重要,这提升了性能,并带来了催生该设计的直观想法。最后,我们的方法允许将输入/输出域与转换的表现性分开,从而为未来的分析提供一个简便的框架。我们在 ImageNet 分类、COCO 目标检测、VOC 图像分割上测试了 MobileNetV2 的性能,同时也评估准确度、operations 数量(通过 MAdd 测量)以及参数量之间的权衡。640?wx_fmt=png

    参考文献:

    1. MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications, Howard AG, Zhu M, Chen B, Kalenichenko D, Wang W, Weyand T, Andreetto M, Adam H, arXiv:1704.04861, 2017.

    2. MobileNetV2: Inverted Residuals and Linear Bottlenecks, Sandler M, Howard A, Zhu M, Zhmoginov A, Chen LC. arXiv preprint. arXiv:1801.04381, 2018.

    3. Rethinking Atrous Convolution for Semantic Image Segmentation, Chen LC, Papandreou G, Schroff F, Adam H. arXiv:1706.05587, 2017.

    4. Speed/accuracy trade-offs for modern convolutional object detectors, Huang J, Rathod V, Sun C, Zhu M, Korattikara A, Fathi A, Fischer I, Wojna Z, Song Y, Guadarrama S, Murphy K, CVPR 2017.

    5. Deep Residual Learning for Image Recognition, He, Kaiming, Xiangyu Zhang, Shaoqing Ren, and Jian Sun. arXiv:1512.03385,2015



    ∞∞∞

    640?wx_fmt=jpeg&wx_lazy=1

    IT派 - {技术青年圈}持续关注互联网、区块链、人工智能领域640?wx_fmt=jpeg&wx_lazy=1


    公众号回复“机器学习”

    邀你加入{ IT派AI机器学习群 } 


    展开全文
  • 此新型微控制器样品计划于2009年第二季度交货,该系列器件将是首款集成有下一代‘RX’CPU架构的32位产品,CPU性能将高达200MHz,具备读取业界最快的单周期闪存的能力(100MHz)。  RX家族是应市场转向对高速、高...
  • 中国夺超级计算机500强亚军 《纽约时报》消息:中国超级计算机曙光星云排名世界第二,超过了欧洲与日本。...ARM确认下一代芯片核心架构“Eagle” ARM公司在Computex宣布,高端的A8、A9芯片的
    中国夺超级计算机500强亚军

    《纽约时报》消息:中国超级计算机曙光星云排名世界第二,超过了欧洲与日本。本周一,国际超级计算机大会在德国汉堡举行,会上公布了最新的超级电脑 500强排行榜。曙光星云(英文名:Dawning Nebulae)位于深圳国家超级计算机中心,运算速度1270万亿次,居世界超级电脑500强第二位。20世纪60年代,美国设计第一台超级电脑,此后 美国地位坚不可摧。

    ARM确认下一代芯片核心架构“Eagle”

    ARM公司在Computex宣布,高端的A8、A9芯片的下一代核心架构将被命名为“Eagle”,这是一个未经宣布的全新设计,采用多核心和新 一代图形硬件结构,并内置安全方案。这款芯片一开始将采用28纳米工艺,并在GlobalFoundries的技术成熟后扩展到22纳米。

    展开全文
  • 在PC时代,先是处理器的更新换代促使了用户对更新PC的需求,后来软件产业的壮大和人们对丰富应用的渴求迫使半导体厂商推出更快的架构与芯片。似乎移动计算领域也出现了类似的状态。我在想,既然移动计算已经初现浪潮...
  • 1.课题研究背景1.1 电信业务需求和提供发生了很大的变化近年来,随着通信技术的不断发展和计算机的普及,电信业务发展迅猛,以互联网为代表的新技术革命正在深刻地冲击着传统电信业的概念和体系。首先,用户对电信...
  • 基于Qos的下一代移动IP架构研究

    千次阅读 2005-03-04 20:57:00
    IETF为满足移动用户使用多媒体和其他实时业务的需要,在移动IPv4的基础上,提出了下一代移动IP(即Mobile IPv6),它具有极大的经济实用性,可以为移动计算机提供无线连接,支持任何无线媒体接入,使移动用户在网络...
  • 从上个世纪70年代开始,数据库就成为计算机软件中最重要的“中间件”。有了数据库后,关于数据操作的原语可以从应用代码中分离出来,DBMS(数据库管理系统)承担了数据结构的管理、存取等任务,并维护了数据的可用性...
  • 在IT系统的建设和管理中,敏态和稳态似乎不可协调...作者简介:王璞,数人云CEO,为美国George Mason大学计算机博士,擅长分布式计算、大规模机器学习、海量数据处理。曾担任 Google 广告部门数据平台构架师,负责管理
  • 于2003年加入宾夕法尼亚州立大学计算机系,2008年获得终身教职,2012年提升正教授。2014年他转入加州大学圣芭芭拉分校电机与计算机工程系(ECE)担任正教授。他同时也是北京大学的兼职教授和台湾新竹清华大学的客座...
  • 10月27日,2017中国计算机大会(CNCC2017) 技术论坛“下一代数据中心存储技术与系统”在福州举行。围绕论坛主题,众多学术界顶尖学者与企业界重磅嘉宾现场对新型存储器件、多核服务器、高速网络等新硬件的发展以及...
  • 下一代防火墙

    2012-04-22 21:59:48
     Gartner介绍为应对当前与未来新一代的网络安全威胁认为防火墙必需要再一次升级为“下一代防火墙”(参见“工具包:评估信息安全预算,2007年升级版”)。例,第一代防火墙现已基本无法探测到利用僵尸网络作为传输...
  • 据悉,此次发布的验证EDA产品与技术,已经在国产飞腾服务器上通过验证,能兼容当前产业生态,并面向未来有助于支持下一代计算机架构,是建设中国自主研发集成电路产业生态的重要里程碑。 其中,仿真技术是保证集成...
  • PICMG1.3是PICMG 1.x规范的最新版本,与外围板卡沟通时有更高速的接口带宽。PICMG 1.3依旧保有此类架构的好处,包括系统设计时具有弹性、以及PCI/PCI-X兼容性等。
  • RyuJIT:下一代的JIT编译器

    千次阅读 2013-12-30 16:25:07
    但是,这将会被改变:一个新的,下一代x64的JIT编译器编译代码的速度将加快两倍,它将改变你对64位.NET代码的印象。 回顾64位计算 32位x86计算机的问世好比黑夜中迎来的天明,这是伟大的计算机架构,但它有很大...
  • ARM CPU 架构

    2020-12-25 23:31:11
    ARM CPU 架构1....80年代中期,Acorn的一个小团队要为他们的下一代计算机挑选合适的处理器,根据他们提供的技术需求,在当时的市场上无法找到合适的处理器,于是 Acorn决定自己设计一个处理器(真有魄
  • ARM架构解析

    2021-01-19 17:30:10
     80年代中期,Acorn的一个小团队要为他们的下一代计算机挑选合适的处理器,根据他们提供的技术需求,在当时的市场上无法找到合适的处理器,于是Acorn决定自己设计一个处理器。一个小团队仅仅用了18个月就完成了从...
  • 学习总结浅谈 – 微服务架构 前言:对于微服务架构有一些了解,简单谈谈对于微服务的...下一代微服务架构: Service Mesh 1. 关于微服务实现之前 第一代网络计算机系统:开发人员需要在自己的代码处,来处理网络...
  • 应用需求的快速发展带动了计算机网络技术的快速发展,其直接结果是产生了当前炙手可热的网络服务(Web Service)技术...面向服务架构(SOA,Service-oriented architecture)就是在此背景下出现的,SOA被誉为下一代Web
  • arm920t架构cpu详解

    2020-12-25 21:19:55
    arm920t架构cpu详解1.处理器/DSP2.ARM9系列3.ARM920T CPU结构 1.处理器/DSP 先来谈一下ARM的发展史:1978年12月5日,...80年代中期,Acorn的一个小团队要为他们的下一代计算机挑选合适的处理器,根据他们提供的技术需求
  • 架构的演变历史

    千次阅读 2018-07-18 00:21:33
    架构的演变历史 我们首先介绍 ARM Ltd,这里先说的是公司而不是架构。ARM 的发展历史非常久远,超乎许多人的想象。 首先,我们提供一些背景...80年代中期时,Acorn 一个小团队接受了一个挑战,为他们的下一代计...
  • 80年代中期时,Acorn一个小团队接受了一个挑战,为他们的下一代计算机挑选合适的处理器,他们起草了一个技术需求说明书,经过相当长的摸索后得出一个结论:无法找到与之相符的产品,于是Acorn决定自己设计处理器,一...

空空如也

空空如也

1 2 3 4 5 ... 9
收藏数 166
精华内容 66
关键字:

下一代计算机架构