订阅业界RSS CSDN首页> 业界

IBM Power8&巨杉数据库算法挑战赛火热来袭!

发表于2016-01-27 10:44| 次阅读| 来源未知| 0 条评论| 作者CSDN

摘要:本次比赛的主题为“空气质量分析与预测”这一热门话题,我们提供2014年全国各地的全年空气质量情况,通过在POWER 8 设备上搭建巨杉数据库集群,对这些全量数据进行存储。

大数据背景下,对传统的数据存储平台以及支撑存储的硬件都带来了前所未有的挑战。巨杉数据库与IBM POWER8,作为新一代大数据平台和硬件的代表,联合主办本次“POWER8 & 巨杉数据库算法挑战赛”,旨在希望参赛的开发者通过比赛,能够切身体会到POWER8与巨杉数据库的优势。

本次比赛的主题为“空气质量分析与预测”这一热门话题,我们提供2014年全国各地的全年空气质量情况,通过在POWER 8 设备上搭建巨杉数据库集群,对这些全量数据进行存储。之后再通过对巨杉数据库的操作,返回题目要求的数据结果。除此之外,我们还对性能表现以及是否使用数据库和POWER8特性评分。

大赛官网地址:http://reg.powerlinux.csdn.net/

大赛时间:

2016年1月26日——2月29日

大赛题目

1) 根据2014年空气数据,找出全国哪里空气最好,哪里最差以及空气质量状况最相近的两个地区。

2)通过2014年数据,预测2015年2月11日10:00南京草场门的空气质量情况。

(判断相近需要根据 空气污染物含量,化学成分组成比,每一项的变化趋势等维度综合判断)

评分标准

1.准确计算出全国空气质量的最好和最坏城市获得10分;

2.准确计算出全国空气质量最接近的两个地区获得15分;

3.根据找到两个最接近地区的时间评比,性能最高得获得30分(按照排名顺序得分);

4.PowerLinux硬件特性的优化获得20分(每个特性10分,上限20分);

5.使用了巨杉数据库特性获得20分 (每个特性10分,上限20分);

6.其他加分项(展现、应用性)获得5分;

大赛奖励

注意事项

1)本次比赛要求使用 POWER 8 设备以及巨杉数据库进行应用开发。数据库与环境若与要求不符,则不计算分数。

2)本次比赛要求根据POWER 8 Linux 服务器特性以及巨杉数据库特性进行调优,且要求对巨杉数据库进行操作。在此基础上使用应用层操作和展现,将有适当加分。

3)比赛将会提供 POWER8的Linux服务器环境以及巨杉数据库的安装配置教程作为参考,也会提供同样的源数据集供参赛者统一使用。数据仅供比赛使用,请勿用作其他用途。

4)本次比赛大家可以根据算法的设计来配置数据库节点。

----------------------------------------------------------------------------------------------------------------------------

特别鸣谢:本次大赛原始数据由“数据堂”提供,数据库由“巨杉数据库”提供。

数据堂(股票代码:831428)成立于2011年,为国内上市的大数据资源服务龙头企业,致力于成为全球最大的数据服务商。秉承“专注数据,共享价值”的服务理念,旨在盘活和融合各类大数据资源,挖掘数据价值,为客户产品和服务增值,为社会发展和进步献策。

通过获取线下大数据、行业大数据以及政府大数据,数据堂整合了涵盖科技、信用、交通、医疗、卫生、通信、天气、地理、质监、环境、商户、电力等数十大领域的大规模数据。以此为基础,为客户提供专业数据采集处理、共享交易及数据云服务。

SequoiaDB巨杉数据库,是广州巨杉软件开发有限公司开发的一款分布式非关系型文档数据库,可以被用来存取海量非关系型的数据,其底层主要基于分布式,高可用,高性能与动态数据类型设计SequoiaDB可以独立作为一款高性能可扩展的NoSQL数据库使用,也可与当前主流分布式计算框架 Hadoop 紧密集成。

0
0