订阅云计算RSS CSDN首页> 云计算

【云先锋】云智慧殷晋:打造基于大数据的智慧APM

发表于2014-08-01 11:13| 次阅读| 来源CSDN| 0 条评论| 作者魏伟

摘要:从2006年从事应用性能管理领域相关的产品研发,偶然的机会,在做沃尔玛的一个应用性能测试项目过程中,发现当时的性能测试不具有实时性和持续性,存在很大的弊端,而这正是殷晋后来做基于大数据的云智慧APM的初衷。

Gartner关于新一 代应用性能管理的五个特征: 1.终端用户体验监控;2.应用拓扑映射;3.业务事务分析;4.深度应用诊断;5.数据分析;前四点,主流的APM提供商都基于各自的技术特点及对应的用户需求提出了自身的方案,但是在数据分析方面,支撑的粒度以及程度参差不齐;在实现前四点的基础上,云智慧提出基于大数据的智慧APM全套解决方案。

APM概念真正意义的提出是在2008年,基于SaaS的APM市场更是一片空白。北京云智慧科技公司CEO殷 晋表示传统IT运维人员的巡检类工作枯燥无趣却又必不可少,传统的IT运维管理模式亟待创新。所以他期望通过基于SaaS的APM将IT运维人员解放出来,基于此,殷晋参与创立了云智慧,在其带领下,2010年监控宝产品正式上线,并迅速获得了用户的广泛认可,在客户的口碑传播之下,监控宝在2011年 就达到国内监控服务市场占有率第一,2014年国内APM市场占有率和用户保有量都是第一。现在公司从IT监控领域发展到了端到端的性能管理领域,并成长为中国市场上APM领域用户最多的公司。以下是CSDN对云智慧CEO殷晋的采访实录。


云智慧CEO 殷晋

技术团队风采

CSDN:首先给大家介绍一下你和你的公司?技术团队结构?

殷晋: 云智慧是国内最早开始以SaaS的方式来做IT监控和性能管理服务的公司之一,我们的第一个产品监控宝被评为运维必备工具,现在公司从IT监控领域发展到了端到端的性能管理领域,并成长为中国市场上APM领域用户最多的公司。

我们的技术团队是由来自互联网行业的资深技术人员组成,团队主要成员来自于国内知名的电商、云计算服务和国外的知名应用性能管理公司,整个团队在SaaS产品研发,大数据处理和高并发实时事务处理方面的经验十分丰富。


云智慧技术团队

CSDN:为什么选择APM领域作为自己的创业方向,是看到什么样的市场机会?

殷晋:我个人从2006年开始从事和应用性能管理领域相关的产品研发,当时是在一个外企里面从事技术研发工作。在工作的过程中,遇到过一些比较有意思的事情,当时我们是在给沃尔玛做一个应用性能测试,当时沃尔玛召集了思科的人来看硬件,Oracle的人来看数据库,Sun 的人来看Java代码的运行时性能,我们负责前端用户体验和云压力,这个项目前后进行了快1个月,沃尔玛花了很多钱在这个项目上。当时我就觉得事情不应该是这样来解决的,因为这样的项目只能解决用户当时的问题,不能持续的跟踪和优化他们的系统性能,这个就是我们后来做“基于大数据的云智慧APM”的初衷。 我们通过全栈的IT实时数据采集和分析,完全做到了让企业实时了解系统性能问题,预测而不是通过笨重的工具和长时间的项目来检测系统瓶颈。

在中国市场,随着互联网、移动互联网和O2O的快速发展,企业的业务和IT系统的关系越来越紧密,企业应用已经从业务支撑系统变成了企业业务的核心,所以应用性能问题更加凸显出来。而一般的公司不具备专业的技术能力来做专业的应用性能管理,同时越来越高昂的人力成本也迫使大家使用简单快速且性价比高的专业应用性能管理服务。这些都是我们的市场机会和我们成长的驱动因素。

技术优势和架构特点

CSDN:目前国内APM领域涉足的企业还比较少,你觉得你们的端到端APM解决方案最大的技术优势有哪些?

殷晋:

基于大数据的应用性能指标预测及告警

云智慧建立了一整套面向200项关键参数指标的数据分析预测模型。我们可以对所监测系统的各项指标进行预测。可以想象,如果系统告诉用户在下周三的下午1点,网页的响应时间会大于 1000ms,可见大数据预测的价值。

基于大数据的行业解决方案

云智慧提供了不同行业的数据标准与行业知识,采集了大量行业用户的数据,经过分析之后给出具有行业标准特性的建议。系统会自动推荐用户行业标准的响应时间参考阈值。

基于大数据的应用性能管理方案优化

基于大数据,对应用系统进行压力预测找出影响业务指标的IT性能节点,定位问题后进行有针对性的优化。这种事前整体框架性的问题发现实现了运维对于业务增强的驱动要求。

CSDN:能否分享一下你们基于SaaS的APM的技术架构、特点?

殷晋:

基于大数据的APM

大数据采集:基于插件机制的云监控端及流管理器

大数据存储:基于Hadoop及Elasticsearch的大数据存储及分析

大数据处理:基于流处理技术的实时告警引擎

大数据分析:基于NOSQL技术的多维可视化报告引擎

商业智能分析:基于BI的智能应用性能和容量趋势分析

目前云智慧的数据处理情况

目前数据采集量 720亿条/每天,共存储200,000亿条数据

目前处理近 500种不同类型的监控指标数据

预计2017年数据采集量达到100,000+亿条/每天

0
0