订阅业界RSS CSDN首页> 业界

Kylin-Hadoop上的大规模联机分析(OLAP)引擎现在已经能够用Docker运行

发表于2014-11-14 21:02| 来源CSDN| 作者耿立影

摘要:Kylin是一套由eBay公司打造的开源分布式分析引擎,其突出特性在于能够为Hadoop支持下的庞大数据集带来标准SQL接口与多维分析(OLAP)能力。

Kylin是一套由eBay公司打造的开源分布式分析引擎,其突出特性在于能够为Hadoop支持下的庞大数据集带来标准SQL接口与多维分析(OLAP)能力。

作为SequenceIQ网站,我们对于各类新兴技术方案自然抱有浓厚的兴趣,且一直致力于将其推介给我们的客户以及更为广阔的开源社区。就在几周之前,eBay公司正式以开源产品形式发布了Kylin项目并以基于Apache 2许可规范的方式将其交付给整个业界。出于对这款开源软件加以分享的考虑,我们与eBay方面合作共同对Kylin进行了Docker化处理(即容器化),从而使用户们能够利用我们的Hadoop即服务(Hadoop as a Service)API——也就是Cloudbreak——非常轻松地将Kylin部署在本地或者云端环境当中。

尽管Kylin项目本身提供了非常完备的说明文档,在此我们仍然会以简洁明了的方式对其进行一番介绍与概述。

概述

从概述角度出发,大家可以通过以下图表来了解Kylin项目所使用的各组件以及架构。

作为参考资料,大家还可以通过查看Ambari蓝图来掌握Kylin项目所采用的各个组件,其同时提供单节点多节点蓝图两种可用模板。

运行在Docker之上的Kylin集群

我们已经将Kylin集群的整个自动化创建流程以分步方式加以总结。大家惟一需要亲自完成的就是通过以下命令从Docker官方库当中获取这套容器。

当Docker容器获取完成之后,大家就做好了开始使用Kylin的全部准备工作。各位可以从我们的Kylin GitHub当中获取以下帮助功能-(请确保source该模块)。

大家可以根据实际情况在自己的集群当中指定合适的节点数量(在本示例中取值为3)。在完成了对全部必要Hadoop服务的安装之后,我们接下来要做的是在此基础之上构建Kylin并通过以下命令启用其用户界面:

Kylin的登录凭据默认为:ADMIN/KYLIN 。该集群会预先以示例数据进行填充,并准备好如此处所示构建Cube。

原文链接:

http://blog.sequenceiq.com/blog/2014/11/13/kylin-on-docker/