订阅云计算RSS CSDN首页> 云计算

青云黄允松:走向全虚拟化+机器智能的“IT 2.0”

发表于2015-08-07 18:04| 次阅读| 来源CSDN| 0 条评论| 作者周建丁

摘要:云计算应当是一个统一、融合的系统,通过开放的API联合。从底层技术来说,云计算最重要的是三个关键词:simplified,integrated和coordinate。要实现这样的效果,有两项技术最为重要:全虚拟化和智能调度系统。

在青云QingCloud用户大会(QCUC 2015)上,青云QingCloud CEO 黄允松(Richard Huang)和他的团队在用户面前讲述了青云认识的技术演进趋势,并展示了青云在这种趋势下的最新动向。

黄允松认为,云计算是IT工业的延续,也可以称为“IT 2.0”,不同应用根据不同需求跑在不同的环境,IT资源通过开放的API联合,形成一个统一(包括异构融合)的系统。从底层技术来说,云计算最重要的是三个关键词:simplified,integrated和coordinate。要实现这样的效果,需要做好两项技术:全虚拟化和智能调度系统。

青云一直在奉行工程师文化,为这三个关键词而努力,推出了超融合设备等产品。不过,是青云做功能开发从来没有日程表,原因是要寻求好而不是寻求快黄允松认为,“好的一定比别人慢一些”。

云计算没有底层创新 只是“IT 2.0”

黄允松如同往常一样反对说云计算的创新性:“我不认为云计算是一个新的产业,云计算没有底层创新的能力,仍然是传统IT行业的延续,因此我更愿称之为‘IT 2.0’。”


当然,这并不是说,没有技术上的变化。以青云为例,黄允松解释说,青云最底层是硬件,往上是IaaS层,还有Orchestration(编排)层,使用过Cloud Foundry、Docker、Rocket等模板化部署或配置工具的人会对这层很熟悉,它将传统的中间件层高度自动化,就像在IaaS层将传统的IT运维自动化。上层的SaaS/Apps不会关心底层技术细节,虚线以下都是透明的,App之间可以通过API相互协作,形成一个自动化的社会。

黄允松强调了“IT 2.0”的两个技术:全虚拟化与智能调度系统。全虚拟化之所以重要,是因为它能够带来敏捷,硬件故障不可避免出现时可以快速恢复,并将影响降低到最小。目前,全虚拟化带来的性能损耗,在CPU级别已经可以控制在1%以内。

黄允松还透露,青云会在未来的大约两到三个月之内会发布最新的SDN 2.0,最大的改变是TCP/IP协议栈,会提升现有性能的5到8倍,内部定的指标是10倍。也就是说,虚拟化网络的性能几乎等同于物理网络的性能。

其次,全自动的智能调度系统是资源层面全透明的保证。青云通过P2P架构支持弹性扩展,还构建了P2P机器人运维系统,保证在大规模的情况下,无需关心数据中心的位置、设备类型、数量,并且任何一台物理设备都是可以随时下线。这就是机器智能(MI)

四款新产品

在此次用户大会上,青云发布了四款新产品,包括:QingCloud Object Storage Service(对象存储服务),QingCloud大数据技术平台,QingCloud桌面云,以及QingCloud hyper-converged超融合一体化设备。青云QingCloud工程师团队针对这些新产品做了详细的介绍和演示。

QingCloud Object Storage Service

对象存储在整个QingCloud存储里面是最后一块拼板,但很重要。杨锦涛表示,开源的分布式存储系统几乎都有一个特点,就是为特定场景而设计的,如GlusterFS只是做了一个弹性的调度算法,存储大量小文件时性能瓶颈依然存在,用户自己做和用开源方案代价都很高,而第三方对象存储服务不完美。

QingCloud对象存储的主要特点如下:

  • 不限制。对数据的类型、大小、流量、并发和数目都没有限制。在用户业务高并发的情况下,系统可以正常支撑业务。
  • 无限扩展。这是青云做对象存储的初衷,在空间上可以无限的水平扩展,在时间和效率上,性能随容量线性提升。
  • 数据安全。不让用户丢数据。监控分多个维度,如API调用次数、请求的流量、数据的容量等。在监控周期上,系统可以做到实时的监控,将展现周期设置为一小时。
  • 访问安全。在做对象存储接口设计时,完全遵循HTTP里的规范,以及RESTful里面的一些约定。在安全性方面也做了很多工作:1.请求验证基于对称加密技术,与QingCloud IaaS的加密技术一致。2.支持HTTPS和HTTP,用户可以根据自己的需求使用。3.访问权限控制。用户可以给每个人指定权限分配,包括私有、公开只读、公开读写、面向某个人的读、面向某个人的读写。4.跨域访问控制。为了防止在网页中嵌入恶意代码,进行恶意数据上传,做了跨域访问控制。
  • 与计算紧密结合。因为QingCloud IaaS是跨区域部署的,而存储应该和计算资源尽可能的接近,因此对象存储也采取了多区域部署的路线,与多区域的IaaS内网传输,好处是低延时和低成本。

根据王煜的现场演示,QingCloud的对象存储服务支持图形化控制台和命令行的的使用方式。QingCloud对象存储监控有三个维度,分别是流量的唯度、存储空间的维度和API访问次数的维度。QingCloud对象存储服务的SDK和命令行工具,拥有和界面上的所有操作一样,包括了对Bucket存储空间的操作、对象文件的操作、访问密钥和用户相关操作。

杨锦涛还介绍了对象存储的Roadmap(产品路线图),包括访问加速,集成第三方CDN服务,兼容和集成,以及产品生态。他表示, QingCloud对象存储会和QingCloud的很多产品和功能有关联,并且希望合作伙伴的数据能跟对象存储进行关联。


QingCloud大数据技术平台

周小四介绍了QingCloud大数据技术平台服务。他认为,基础架构是大数据的基石,云计算能够弹性伸缩,是大数据基础平台最好的部署方案。青云QingCloud大数据基础平台服务是由一系列可自由组建端到端行业解决方案的部件构成的,目前发布的有ZooKeeper, Kafka, Spark, MongoDB等,接下来陆续会发布Hadoop, HBase, Cassandra, Storm等。

在云上保证大数据稳定、可靠、高性能的做法,是要充分挖掘云的特点。周小四举例如下:

  • Hadoop的存储副本因子默认是3,设计的初衷是防止两个副本所在的机架出问题,而把第三个副本放在另外一个机架上;而在云上两个副本是足够的,不仅节约空间,性能还能得到提高。去掉这个副本带来的高可用和稳定性的问题,完全可以由IaaS做保障。
  • Spark主节点的高可用问题,官方文档推荐用ZooKeeper管理多个Spark主节点,它的故障切换时间是1-2分钟,如果云上部署Spark这种方式不可取。因为创建虚机的时间是几秒钟,青云用重构Spark主节点的方案时间在1分钟左右,而且可以节省3个ZooKeeper节点和1个Spark主节点。


他最后表示,青云会把Spark和Hadoop集成起来,也会兼顾有些用户数据来自远端的场景,通过Kafka和MongoDB把用户的数据放在一起。还会利用QingCloud的IaaS,把平台做到稳定、可靠、高性能和在线扩容,并且是多样化、组件式的,用户可以根据自己的业务需求,形成行业解决方案。

QingCloud桌面云

王强介绍了QingCloud桌面云,主要分为终端和云端两个部分。终端桌面仅需要键盘、鼠标、显示器和一个价格低廉的瘦终端,所有的数据都存放在云端,可以享受QingCloud实时异地副本以及高性能的特性。

QingCloud桌面云设计特色包括:

  • 智能。可以处理密集的GPU和CPU任务,可以由程序自动决定运算是放在高端的终端运行还是在服务器上运行完再传回瘦客户端。
  • 安全。终端和云端的连接支持多因子的验证,以及二次认证等,企业可以通过防火墙限制上下行网络数据和上网行为。所有的传输也是加密的,同时还可以根据网络状态自动调整压缩、编码和传输算法。
  • 稳定可靠。QingCloud云桌面是完全架构在QingCloud的IaaS平台上,可以提供充分提供稳定性、可靠性和可扩展性的保障。基于QingCloud公有云的积累和自动化运维技术,QingCloud桌面云可以轻松扩展到上万、上十万的规模,并且维持极低的运维成本。与其他桌面云不同,它能同时满足企业交付云桌面和云服务器的需求,最大化地进行资源整合。
  • 高效运维。只需要在一个云端主机里面安装所需的软件,将它制作成模板镜像,可以短时间内发布成千上万的桌面给员工,通过集中式的管理,可以很快的响应故障修复。同时还可以通过一站式的可视化管理平台管理成千上万的云桌面和云服务器,绝大部分事情交给不睡觉的QingCloud机器人。
  • 低TCO。以某银行QingCloud桌面云第一期改造项目报告为例,他们的服务器数量减少了74%,机房空间占有率减少了67%,电力消耗降低了73%,同时运维效率大幅度提高,办公设备的部署周期由3个月缩短为1周,每个IT运维人员管理的机器数量从100台增加到1000台

王强表示,已有的桌面云解决方案都有一个通病,就是传输协议性能低下,特别是广域网这种低带宽、高延迟的情况下,表现特别明显,用户体验极差,而QingCloud桌面云的操作完成以后占有的流量仅仅是Windows原生远程桌面流量的六分之一,这样的效果来源于调整编码、压缩算法等传输协议的优化。

另外值得一提的是,QingCloud还集成了Citrix的解决方案,并且支持一种软终端的模式,让用户可以充分地利用旧设备。

QingCloud hyper-converged超融合系统

廖洋介绍了QingCloud hyper-converged——为了让云变得更简单。援引IDC和Forrester的数据,IT项目在实际立项和实际部署时,几乎有34%的项目会发生延迟;有68%的成本用于运维与管理。

深层的原因,现在绝大多数的数据中心是用硬件定义的数据中心,仅仅实现了计算的虚拟化,没有实现网络、存储的虚拟化,所以目前的数据中心仅仅是一个虚拟计算中心,而不是真正的云计算软件定义中心。它让我们的设备往两个极端发展,存储变得非常昂贵,成为奢侈品;网络成为计算和存储的生命线,需要做大量冗余。这种架构对存储和网络的要求特别高,不适用于云计算。

QingCloud以及其他国际知名云计算厂商都是“No SAN”架构,没有存储。他认为,适合云计算的架构具有如下四个关键词。

  • 零干预。通过这些智能化的机器人来维护管理IT资源,可以实现开箱即用、自动调优的功能。
  • 统一。用户可以在Web或者手机App中,通过统一的控制台来管理和监控所有的资源,包括公有云、私有云和超融合设备资源,不需要再为资源的割裂为进行分开管理。
  • P2PP2P解决的是分布式的问题,解决了资源快速高效分配的问题。通过采用P2P的架构,可以实现资源的安全自动化部署,免除单点故障,支持最小10个节点到无限节点的水平线性扩展,同时和公有云一样,对于故障的处理是完全自动化的,最大程度降低人为对系统的干预。
  • 融合3.0。和公有云共享代码和功能,与公有云是一个整体,能够开箱即用。

廖洋解释了融合1.0到融合3.0的不同:

  • 融合1.0为了解决快速上架的问题,把不同厂家的硬件装在一个盒子里,存储、网络、计算等硬件都是割裂的,如果出现一个故障,需要逐点去排除。同时为了满足性能的需求,将存储和计算都做到两个极端,然后通过SAN来管理,而且为了保证性能,企业需要不断的增加成本投入,陷入一个错的循环。
  • 融合2.0完全去除了SAN,通过分布式文件系统提供Server SAN,摆脱了对硬件的制约,但是还需要重新部署所有的软件,这些软件都是割裂的,无法实现一个完整的云计算环境。
  • 融合3.0和公有云共享了同样的代码和功能,预置经过优化的IaaS平台和PaaS服务,用户不需要再去组合硬件和软件,实现开箱即用,与公有云是一个整体,资源不够时完全可以动态调用公有云资源。

QingCloud推出的QingCloud超融合系统就是一套预调优、预集成、自动优化的一个系统,简化用户IT;通过P2P的架构来支持弹性扩展;QingCloud是首家提供融合3.0设备的云服务商,为用户提供计算、存储、网络、安全等完整的IaaS能力;低成本、低消耗、低空间占用。

QingCloud超融合设备分为四个系列。F系列,提供全闪存存储,使用的是Flash而不是SSD,免除了RAID可能面临的瓶颈问题,通过PCIe总线直接将Flash和CPU连接起来,降低物理部署对于闪存的性能开销,可以提供60万的IOPS存储性能,满足数据库等关键应用的需求。S系列,全SAS硬盘,通过分布式块存储提供了高性能的I/O,满足主流应用的计算及存储需求。NL系列,全SATA硬盘,目的是为了扩充容量,存放一些冷数据。C系列是在大规模系统中需要部署的SDN网关以及其控制管理功能。

廖洋表示,QingCloud是超融合系统的第一个受益者,能耗、空间和布线分别降低了16%、50%和50%。

用户声音

时速云、我来贷、91金融等QingCloud合作伙伴和用户代表接受了CSDN记者的采访,谈到了选择QingCloud的原因以及使用QingCloud的感受。

时速云(定位是容器云平台)CEO黄启功表示,青云的秒级计费与轻量级的可以秒级启动的容器相结合,对于原生支持微服务架构很重要。

我来贷技术副总裁陈绍明也表示,秒级计费对于我来贷成本的控制很有帮助。我来贷选择QingCloud的原因之一是就近原则,公司位于深圳,而 QingCloud具有广东的云数据中心,并且比当地别的公有云在性能、功能上要好。

91金融创始人、CEO许泽玮称,91金融选择云服务商考虑的主要是安全和接入,这两点QingCloud能够很好地满足91金融的需求。

0
0