精华内容
下载资源
问答
  • 什么是产品?如何评价产品? 作为管理者通常要面临如何评价某一个产品的好坏,以及面向产品线或多产品要考虑如何评价哪些产品好、哪些不好,从而调整和分配相关资源。因此,我建立了“产品评价体系模型”,支持...

    什么是好产品?如何评价产品?


    作为管理者通常要面临如何评价某一个产品的好坏,以及面向产品线或多产品要考虑如何评价哪些产品好、哪些不好,从而调整和分配相关资源。因此,我建立了“产品评价体系模型”,支持企业管理者高效作出决策。


    建立评价体系模型遵循的原则:
    1)客观性 
        筛选评价指标的过程,尽可能不受主观因素影响
    2)可行性
        尽可能采用有数据支撑的指标
    3)相对性

        所采用的指标都应是相对指标
    4)可比性 
        不同产品的同一指标计算口径一致;对时序数据计算的指标,涉及价值量或数量的,应调整为比率


    建立的产品评价体系模型结构:
    所建立的产品评价体系模型分三个层级,再细分各个维度来分析产品的健康状况。三个层级主要包括:企业高层管理者、产品线管理者(包括产品线经理、高级产品经理等)、以及产品经理(包括产品研发经理等),第一层主要从企业竞争力、产品盈利能力等维度建立分析指标,第二层在宏观把握产品特性上建立分析指标,第三层从管控产品质量和过程上建立相关指标。
    注:有对指标详细内容感兴趣的同志,请直接联系我。


    戴明曾说:“只靠财务数据去管理一家公司,就像单独依靠后视镜开车一样难以成功。”所以我们应当建立全面性的指标来评价产品的健康度,不应仅看滞后性的指标,更应从可预见及可控制的指标上,分析产品的健康体征,进行调整和管控可控因子,如跳水运动,列出一系列“标准动作”,实践经验可知,只要按照要求完成这些标准动作,结果就不会太差。同理,产品研发与管理过程依据一系列标准动作进行,就会获取更好的盈利性和竞争力。

    展开全文
  • 昨天把文章开启了付费阅读,体验了下过程挺有意思,今天把这篇文章重发一遍,感谢大家的关注。...营销的目的就是让消费者记住你的品牌,记住你的产品,快速记住你的产品是什么的,记住你的产品有哪些明显特...

    昨天把文章开启了付费阅读,体验了下过程挺有意思,今天把这篇文章重发一遍,感谢大家的关注。

    营销是一个系统性工程,涉及品牌、市场、心理、管理、博弈、产品、服务、运营等各方面,营销整体的驱动是来源于顾客需求的驱动,想要获得顾客需求驱动,就取决于你对于顾客的理解,再成功的营销也不可能打动所有人。

    营销的目的就是让消费者记住你的品牌,记住你的产品,快速记住你的产品是干什么的,记住你的产品有哪些明显特征。让消费者看到你的强势卖点,你的产品突出优势、品牌的强大、价格的突出、差异化特征、个性化的东西以及有情怀的内容。所以在营销的时候,要把那些关注产品、关于品牌的震撼点以及能抓住注意力的点拿出来背书。

    产品的营销重点需要告诉消费者“为什么要使用这个产品“、“这个产品能帮你改变什么现在正在头疼的问题”、“你现在的人生有什么问题”、“使用这个产品后你的生活将发生什么变化”、“不使用这个产品会有什么弊病“......等等。

    记得行业里有一句流传的警示名言:用户要的永远不是直径五毫米的钻头,而是直径五毫米的钻孔。匹配需求,探寻用户需求最深层的本质。直径五毫米的钻孔可以通过很多方式实现,钻头不是唯一的一种。用户最关注的是钻孔,产品首先能不能实现我们的5毫米钻孔,在深入了解其他的特性,质量如何?速度快吗?好用吗?

    所以,在营销执行之前,要对自己的服务或产品,需要沉下来好好思考下一个问题——“你的产品是在什么样的场景下,用什么产品形态,满足什么用户的什么需求“。

    营销传播的关键在于传,传是口耳相传,如果仅仅是视觉感官,没有听觉上面的传播,那效率会很低,要知道能说出来的广告才是好营销。

    在互联网时代,无论是传统营销还是数字化与社交化营销,其中营销的底层逻辑是不变的。下图为我整理的营销策略的相关方法要点,具体如下。

    e0dbe5b95265a66f5c4a60b9fbb18948.png

    对于未来的产品营销一定是数字化、社交化方式,数字化营销的基础在于与用户的直接连接,社交化营销的基础在于高效以及规模化传播。在传统的营销模式中是让用户看到,但并不能与用户连接直接联系,形成具有亲和力的沟通渠道。这个时候带来的就是对用户的不了解,信息的失真,无法获得用户对于产品的反馈。这也是很多企业忽略的内容,大多企业家重视渠道建设,忽视用户的沟通与感受,不能及时发现产品存在的问题以及产品与市场的匹配度。

    在上一篇《构建智能化私域流量池,驱动企业业绩增长》文章中提到了构建智能化私域流量池,也是企业建设数字化与社交化营销的方向。

    企业发展到一定规模,发展的重心应该是线上渠道与线下的渠道的结合,为什么要提到线上渠道的内容,这和产品的营销有什么关系?不要着急,慢慢到来。

    数字化和社交化营销开展的方式有两种方式,一种是在企业自营,利用企业自有的线上渠道开展活动;第二种是借助第三方平台开展营销活动投放。这两种方式的不同在于流量的规模和流量的沉淀。

    最好的方式就是借助第三方平台将流量引入自有平台,把流量变为自有的流量,这也就是我们所说的私域流量。企业开展数字化与社交化营销必须有平台载体的支撑。有了平台支撑,才会有用户流量的沉淀,才会有私域流量的形成。这也是我们为什么说要建设线上渠道?

    有了私域流量的形成,可复用的流量带来的将是企业营销的边际成本的降低。这也应了行业常说的流量为王的道理。

    但也有很多企业线上渠道平台建设起来,但是并没有带来更多的业务增长,这是什么原因呢?归根到底是企业对于产品营销运营体系的建设不到位以及营销运营的人才的缺失,或者是企业对于这部分的建设不重视。

    有了流量重点在于运营,如何把营销做好,其中的运营方法必不可少。可以从以下方式着手:

    • 营销运营的问题分析

    • 营销运营驱动理念与方法

    • 营销运营工具

    一、营销运营的问题分析

    问题是方向的指南针,只有把问题弄透彻了才能定义方向,营销的打法以及相关的策略内容也清晰明了。你可以从以下11个方面着手分析,确定营销方向。

    • 产品/服务是什么?价值是什么?优势是什么(差异化)?

    • 产品是否可以解决用户的实际问题?

    • 目标用户是谁?用户什么样的情况?需要把用户画像定位出来;

    • 传播渠道有哪些?

    • 谁可以影响这些用户?

    • 怎么影响这些用户?

    • 如何消除客户的隐忧和担心?

    • 如何打破客户的习惯性壁垒?

    • 后续服务如何跟上?

    • 如何建立品牌影响力?

    • 如何借助社会化关系建立信任力、影响力?

    二、营销运营驱动理念与方法

    1c8805109dfe1bdd9891ab24c96154c7.png

    营销运营是一个复杂的过程体系,在这里我只把框架性的理念放在这里。

    1、战略层面——合力驱动

    营销是一个被影响的过程,整个执行营的过程是全部资源共同驱动的过程。我把营销的能力称为营销力,系统化的营销力由5个部分组成。

    营销力=价值 /战略力+产品力+运营/服务力+销售力+品牌与影响力。

    1. 价值 /战略力=用户价值和解决的痛点

    2. 产品力=产品价值特性+用户体验+稳定性+流畅性

    3. 品牌与影响力=内容营销(知识内容)+客户口碑+渠道口碑+行业声音

    4. 销售力=团队协作+管理能力+知识结构

    5. 运营/服务力=产品知识库+电销/运营+营销工具+大数据跟踪

    2、策略层面——利用陆海空协同作战

    如何打,靠什么打,有哪些工具支持,在策略层面应有尽有。在企业运营过程中,单单靠一个部门几乎不太可能取得良好的营销效果。必须整合可以整合的资源,凝聚有效的力量,重锤出击。

    1. 空军——外界环境影响(品牌与影响力)

    2. 陆海军——前线运营(产品服务、营销工具、渠道、目标用户)

    3. 战略指挥部、后方医院、后勤——后方支援与服务(大数据跟踪、运营工具,电销中心)

    3、执行层面——营销即运营,必备的9个思维,掌握正确的方法胜于你的努力

    1. 整合的思维——把项目变成一个平台,整合一切可以整合的资源。

    2. 迭代的思维——把营销变成产品进行升级,不断的迭代

    3. 数据的思维——把数据分析进行迭代,包括通过流量、转化率等数据等分析,借助分析来了解用户以及持续优化

    4. 品牌的思维——培育品牌,发挥品牌的影响力

    5. 服务的思维——把客户遇到的问题解决好,及时反馈沟通,让客户满意

    6. 连接(碰撞)的思维——建立客户沟通的通道,与主动沟通的用户保持联系,获得用户的反馈(评论)。

    7. 超级符号——产品的亮点,一提就可以记住

    8. 超级个体——超级IP,代表的是品牌和影响力

    9. 借势的思维——借助环境顺风推舟,带动传播,借用户的口碑传播,造势、把互动的氛围建立起来,通过人与人,人与钱的关系来驱动影响。

    3、营销运营工具

    运营的高效离不开工具的支持,我的方法路径是把营销产品化,产品平台化,平台运营化。

    3affa290db0f09fda51f40df685c94c2.png

    产品营销运营最有效的方式就是CRM能力的建设,通过CRM的建设形成体系化、自动化、智能化的运营平台能力,真正实现私域化流量的变现。下图是针对CRM工具建设的一些思考,如图。

    f75c0641881eedb8bb6ae74cab228231.png

    其他的文章详见

    构建体系化商业逻辑的方法

    构建智能化私域流量池,驱动企业业绩增长

    产品经理掌握有效的产品思维方法至关重要

    产品经理的六个阶段和四个能力

    展开全文
  • 首先定义什么是履约,履约在甲乙双方达成交易产生订单后,乙方按照订单条款为甲方提供服务或交付约定物的行为;常见的履约有:骑手对外卖用户的履约、司机对乘客的履约,电商卖家对买家的履约等。 由于这些履约的...

    饿了么如何保障外卖能按时送达?滴滴如何保障司乘安全?淘宝如何保障百万商家不刷单不漏发?

    履约产品就是在解决这些问题。

    首先定义什么是履约,履约是在甲乙双方达成交易产生订单后,乙方按照订单条款为甲方提供服务或交付约定物的行为;常见的履约有:骑手对外卖用户的履约、司机对乘客的履约,电商卖家对买家的履约等。

    由于这些履约的业务场景复杂,履约流程较长,甲乙双方线下一对一的互动低效,履约达成率和履约质量都有很大的改善空间,履约产品应运而生。

    履约产品帮助履约者安全、高效的达成履约,获得协议约定的收益;反过来也帮助付费方实时的了解履约情况,低成本的验收交付质量;对于平台来说,履约产品增强了对履约的可控性,提供更全的异常处理方案也为付费方和履约方解除后顾之忧,提升双方体验的同时,也有助于提升平台的品牌形象及健康程度。

    以下笔者将以网络货运平台的履约场景为例,介绍履约产品体系包含哪些内容,以及具体介绍履约产品中的重要部分——履约监控产品的搭建方法。

    一、履约产品体系

    我把履约产品体系分为三大块,分别是:履约工具、履约监控和交付验收。

    1. 履约工具

    履约工具是履约产品的基础能力,履约工具承担了两方面的职责:

    • 帮助履约者高效安全履约
    • 采集全面反映履约情况的行为数据

    在网络货运平台中,履约工具除了跟随司机的终端——司机APP外,车载智能设备,进出场道闸系统,装卸货场地的操作终端,以及外部的定位服务都在上传履约数据。

    2. 履约监控

    履约监控是平台交付质量的保障,履约监控能力直接体现于平台能否事前干预异常发生、事中及时发现并处理异常,降低异常发生率,而这些都强依赖于行为数据的采集质量及采集完整性。履约监控的整体目标是为了降低监控成本,提升异常处理效率。

    履约监控主要提供以下能力:

    • 全面的订单在途跟踪能力:服务平台工作人员及付费方;
    • 事前预警:通过行为表现提前预测异常,通过干预避免异常发生;
    • 事中报警:异常发生后,及时响应,降低异常带来的负面影响;
    • 异常发生的处理工具:将异常处理线上化,提高效率的同时,保持异常处理机制可持续的运转;
    • 履约情况可视化看板:站在管理和执行角度对履约情况进行直观的体现。

    3. 交付验收

    交付验收是事后对履约者交付结果的考核,通过采集履约行为数据,系统在付费者验收前对交付质量进行评价,保证交付质量,并对履约者进行相应奖惩。同时也利用履约者的申诉及付费者的评价校正系统评价,形成履约评价闭环。

    二、履约监控产品的搭建

    在履约产品体系中,履约监控产品直接影响到平台的交付质量,是履约产品体系的重中之重,以下只针对履约监控产品的搭建方法进行详细的介绍。

    我将履约监控产品的搭建方法分为三步,如下图:

    1. 流程分解

    履约监控产品需要对订单履约的每一个环节进行跟踪,识别出异常,这对产品经理提出了非常高的业务流程熟悉程度的要求,并且在产品规划阶段,也是力求全面,所以搭建履约监控系统的第一步是画出一张业务流程分解图;

    那如何画出一张好的业务流程分解图呢?

    1.1 实地调研

    如果你是做履约产品的产品经理,那么一定要走出办公室去实地调研,你应该成为全公司最懂履约流程的人。

    此处强调调研准备环节,我有以下几点建议:

    • 确认调研主题及调研输出物。建议按业务类型的维度定调研主题,每次都跟完全链路;
    • 先调研市场竞品,让竞品先入为主,带着质疑的眼光审视自家的履约流程;
    • 按你的逻辑及业务理解,先推演出调研输出物。这一步有助于你到了实地后,快速理解流程;
    • 调研地人员安排:涉及多角色的履约流程,一定要提前找到调研地的相关人员及时解惑,否则调研将一无所获。

    在调研中,也有一点值得特别强调,透过已有的线上工具,思考假如回到没有任何线上工具的协助,业务本身该如何运转。

    1.2 抽象业务流程

    在对各种业务类型的履约流程进行调研后,开始发现不同业务类型履约流程的差别,那是否是n种履约流程就画n张业务流程分解图呢?

    我的建议是只画一张,当开始调研第2个业务场景时,就要不断与第1次的调研结果比较从而发现异同,抽象出核心的业务流程后,标注出每种业务场景在某个流程节点的表现形式。

    1.3 场景穿透

    当有了新的业务场景后,需要拿业务流程分解图进行场景穿透,即把新的业务场景按高度抽象后的业务流程分解图run一遍,可快速发现当前不支持的场景,也反向补足业务流程分解图。

    比如新增中港澳过关的业务场景时,原业务流程分解图中就没有过关查验、返场重验等场景。

    案例:

    笔者以货车司机为货主履约为例,其业务流程分解如下,不同业务的订单履约则只是对该流程的微调:比如个人货主无需靠卡,某些快递运营商则无需回单等,万变不离其宗。下一步要做的就是依据这张业务流程图将每一个细分场景的异常挖掘出来。

    2. 异常场景库

    在对业务流程有了充分的认知之后,就需要开始用产品化的能力对业务目标的达成负责。

    2.1 建立指标体系

    指标体系是平台向客户的承诺,对应的也是我们对平台履约质量的要求。一个好用的履约监控产品直接关系到关键指标的提升与改善。而设计一个好用的履约监控产品第一步就需要建立完善的履约指标体系。

    此处推荐一个方法:战略指标–运营指标–执行指标。

    战略指标为公司的业务目标,常常也是对外的宣传承诺;比如货车平台的“准点必达”,对应的就是“到达卸货地准点率”。

    运营指标是将战略指标按影响战略指标的运营环节进行分解,通过该指标可快速定位出哪个环节出了问题,比如以“到达卸货地准点率”为例,到达卸货地晚点可能由以下环节问题导致:

    • 到达装货地晚点
    • 装货地装货时间过长
    • 已装货司机原因晚发车
    • 途中行驶时间过长

    执行指标将运营指标继续按可追溯到具体角色可执行的粒度进行细化,以途中行驶时间过长对应的“运行超时率”为例,可分解为“时速异常率”、“绕行率”、“车辆事故/故障率”、“异常处理及时率”、“时效不合理率”等。

    2.2 搭建异常场景库

    围绕指标体系,在业务流程分解图中每一个节点中寻找可能发生的异常,一切对指标体系有负面贡献的行为都可以称之为异常。

    在拆解异常场景时,本着完全穷尽、互相独立的原则,逐一对每个流程节点进行异常场景分析,形成你的异常场景库,而每次流程节点的新增与异常场景的挖掘,都需要对异常场景库及时更新。一个覆盖全面的异常场景库往往有几百项之多。

    异常场景库中应包含如下信息:

    • 异常类型
    • 关联指标
    • 可能产生后果描述
    • 业务影响等级
    • 发生场景
    • 原因
    • 责任人
    • 处理人

    2.3 用数据抽象履约者行为

    在异常场景库的基础上,定义出每一种异常的数据表现,系统才能将其作为判定依据,准确的报出异常。而定义数据表现首先要有数据,所以此时依赖履约工具及数据采集方式的设计。

    此处重点讲一个逻辑陷阱:行为产生数据,数据反映行为;a行为会产生A数据,A数据不一定是a行为。

    在实际业务场景中,由于数据源较多,一个行为又往往需要依赖多个数据源进行识别,所以,异常误报率是量化履约监控产品能力最核心的指标之一。

    3. 异常处理

    如果前面讲的流程分解和异常场景库都还停留在理论层面,那一个可以妥善高效的干预和处理异常的工具,将直接带来业务价值。

    3.1 异常分级

    资源永远是稀缺的,稀缺就需要合理分配。

    异常处理也是一个道理,将异常分级,把app推送、短信、电话,包括司机的关注以及异常处理的工作人员等稀缺资源投到高级别的异常上,对资源做最合理的分配,保证整体资源产生价值最大。

    如何分级呢?

    提供一种思路:按异常类型的业务影响等级*事实程度排序

    • 业务影响等级:异常发生后可能造成的最大业务影响的等级,一般分4-5级
    • 事实程度:数值范围0-1,1表示为已成为事实;系统依据用户的行为数据,对异常进行判定时,依据行为数据可靠性及行为表现给判定的结果带上一个事实程度。

    比如在货运场景里,司机扣货是重大异常,业务影响等级为5,当司机轨迹偏移时,判断扣货异常的事实程度为0.2,系统开始推送提醒,当持续偏移(与规划路径偏差度越来越大)时,事实程度上升为0.4,开始语音外呼干预,当司机继续发生停车异常时(持续2小时车速为0-5km/h),事实程度上升为0.8,立即生成工单,人工介入。

    另外,在考虑资源使用的问题上,一方面考虑更低级别的异常投入更低成本的处理资源,另一方面,也要考虑用户在该异常场景下对这种处理方式的触达率有多高。

    3.2 减少异常

    异常分级处理的最优结果是用最低成本的异常处理资源解决问题,所以异常升级是我们不想看到的。

    干预质量分析

    a 更合适的处理手段:

    记录异常消失的节点,异常在什么情况下消除,消除前采取的干预手段是什么,各种干预手段是否有明显的效果差距,结合成本及效率,可考虑直接采用更有效的处理手段。

    b 提高处理质量:

    在触达率可控的前提下,短信和推送的文案会很大程度上影响履约者行为。

    对于最为昂贵的人工干预,系统也需要对处理结果进行质量评价,提供有效考核工具。

    异常行为完善用户画像

    履约者的每一次异常行为都在完善用户画像,提前对有异常记录的司机进行精准干预或直接拉黑也是减少异常的有效手段。

    3.3 可视化看板

    大屏看板是我们最熟悉的监控产品形态,其优点是可以直观的展示业务运转情况,也是平台履约监控能力的集中体现。

    履约监控的可视化看板中主要有三类使用场景,对应的也是三个不同的视图:

    • 管理:主要的用户是管理人员,他们带着考核的视角,看的信息是核心指标的情况及分布、排行等,通俗讲就是“看看这些人都在干啥”。
    • 执行:主要的用户是执行人员,他们关注的信息是自己的待办任务有哪些,先做什么后做什么,做得好不好。
    • 宣传:观看者是客户、合作伙伴等,目的是促成交易与品牌宣传。

    总结

    随着市场竞争的愈发激烈,很多公司都通过合作、并购与关联业务的公司一起给市场提供了更复杂的综合性服务,客户也对服务提出越来越高的要求,解决安全问题、提高履约效率、提升交付质量已成为行业重心。也希望通过这篇文章,提供一些可操作的方法,很多地方浅尝辄止,没有深入探究,欢迎继续交流。

     

    展开全文
  • 监控整个运维乃至整个产品生命周期中最重要的一环,事前及时预警发现故障,事后提供详实的数据用于追查定位问题。 目前业界有很多不错的开源产品可供选择。选择一款开源的监控系统,一个省时省力,效率最高的...

    前言介绍

    监控是整个运维乃至整个产品生命周期中最重要的一环,事前及时预警发现故障,事后提供详实的数据用于追查定位问题。
    目前业界有很多不错的开源产品可供选择。选择一款开源的监控系统,是一个省时省力,效率最高的方案。

    一篇文章全面了解监控知识体系:
    0 监控目标
    1 监控方法
    2 监控核心
    3 监控工具
    4 监控流程
    5 监控指标
    • 5.1 硬件监控
    • 5.2 系统监控
    • 5.3 应用监控
    • 5.4 网络监控
    • 5.5 流量分析
    • 5.6 日志监控
    • 5.7 安全监控
    • 5.8 API监控
    • 5.9 性能监控
    • 5.10 业务监控
    6 监控报警
    7 报警处理
    8 面试监控
    9 监控总结

    0 监控目标

    我们先来了解什么是监控,监控的重要性以及监控的目标,当然每个人所在的行业不同、公司不同、业务不同、岗位不同、对监控的理解也不同,但是我们需要注意,监控是需要站在公司的业务角度去考虑,而不是针对某个监控技术的使用。
    监控目标

    1、对系统不间断实时监控:实际上是对系统不间断的实时监控(这就是监控)
    2、实时反馈系统当前状态:我们监控某个硬件、或者某个系统,都是需要能实时看到当前系统的状态,是正常、异常、或者故障
    3、保证服务可靠性安全性:我们监控的目的就是要保证系统、服务、业务正常运行
    4、保证业务持续稳定运行:如果我们的监控做得很完善,即使出现故障,能第一时间接收到故障报警,在第一时间处理解决,从而保证业务持续性的稳定运行。

    1 监控方法

    既然我们了解到了监控的重要性、以及监控的目的,那么下面我们需要了解下监控有哪些方法。
    监控方法

    1、了解监控对象:我们要监控的对象你是否了解呢?比如CPU到底是如何工作的?
    2、性能基准指标:我们要监控这个东西的什么属性?比如CPU的使用率、负载、用户态、内核态、上下文切换。
    3、报警阈值定义:怎么样才算是故障,要报警呢?比如CPU的负载到底多少算高,用户态、内核态分别跑多少算高?
    4、故障处理流程:收到了故障报警,那么我们怎么处理呢?有什么更高效的处理流程吗?

    2 监控核心

    我们了解了监控的方法、监控对象、性能指标、报警阈值定义、以及故障处理流程几步骤,当然我们更需要知道监控的核心是什么?
    监控核心

    1、发现问题:当系统发生故障报警,我们会收到故障报警的信息
    2、定位问题:故障邮件一般都会写某某主机故障、具体故障的内容,我们需要对报警内容进行分析,比如一台服务器连不上:我们就需要考虑是网络问题、还是负载太高导致长时间无法连接,又或者某开发触发了防火墙禁止的相关策略等等,我们就需要去分析故障具体原因。
    3、解决问题:当然我们了解到故障的原因后,就需要通过故障解决的优先级去解决该故障。
    4、总结问题:当我们解决完重大故障后,需要对故障原因以及防范进行总结归纳,避免以后重复出现。

    3 监控工具

    下面我们需要选择一款合适公司业务的监控工具进行监控,这里我对监控工具进行了简单的分类
    监控工具

    老牌监控:

    MRTG(Multi Route Trffic Grapher) 是一套可用来绘制网络流量图的软件,由瑞士奥尔滕的Tobias Oetiker与Dave Rand所开发,以GPL授权。
    MRTG最好的版本是1995年推出的,用perl语言写成,可跨平台使用,数据采集用SNMP协议,MRTG将手机到的数据通过Web页面以GIF或者PNG格式绘制出图像。

    Grnglia是一个跨平台的、可扩展的、高性能的分布式监控系统,如集群和网格。它基于分层设计,使用广泛的技术,用RRDtool存储数据。具有可视化界面,适合对集群系统的自动化监控。其精心设计的数据结构和算法使得监控端到被监控端的连接开销非常低。目前已经有成千上万的集群正在使用这个监控系统,可以轻松的处理2000个节点的集群环境。

    Cacti(英文含义为仙人掌)是一套基于PHP、MySQL、SNMP和RRDtool开发的网络流量监测图形分析工具,它通过snmpget来获取数据使用RRDtool绘图,但使用者无须了解RRDtool复杂的参数。提供了非常强大的数据和用户管理功能,可以指定每一个用户能查看树状结构、主机设备以及任何一张图,还可以与LDAP结合进行用户认证,同时也能自定义模板。在历史数据展示监控方面,其功能相当不错。
    Cacti通过添加模板,使不同设备的监控添加具有可复用性,并且具备可自定义绘图的功能,具有强大的运算能力(数据的叠加功能)

    Nagios是一个企业级监控系统,可监控服务的运行状态和网络信息等,并能监视所指定的本地或远程主机状态以及服务,同时提供异常告警通知功能等。
    Nagios可运行在Linux和UNIX平台上。同时提供Web界面,以方便系统管理人员查看网络状态、各种系统问题、以及系统相关日志等
    Nagios的功能侧重于监控服务的可用性,能根据监控指标状态触发告警。
    目前Nagios也占领了一定的市场份额,不过Nagios并没有与时俱进,已经不能满足于多变的监控需求,架构的扩展性和使用的便捷性有待增强,其高级功能集成在商业版Nagios XI中。

    Smokeping主要用于监视网络性能,包括常规的ping、www服务器性能、DNS查询性能、SSH性能等。底层也是用RRDtool做支持,特点是绘制图非常漂亮,网络丢包和延迟用颜色和阴影来标示,支持将多张图叠放在一起,其作者还开发了MRTG和RRDtll等工具。
    Smokeping的站点为:http://tobi.oetiker.cn/hp

    开源监控系统OpenTSDB用Hbase存储所有时序(无须采样)的数据,来构建一个分布式、可伸缩的时间序列数据库。它支持秒级数据采集,支持永久存储,可以做容量规划,并很容易地接入到现有的告警系统里。
    OpenTSDB可以从大规模的集群(包括集群中的网络设备、操作系统、应用程序)中获取相应的采集指标,并进行存储、索引和服务,从而使这些数据更容易让人理解,如Web化、图形化等。

    王牌监控:

    Zabbix是一个分布式监控系统,支持多种采集方式和采集客户端,有专用的Agent代理,也支持SNMP、IPMI、JMX、Telnet、SSH等多种协议,它将采集到的数据存放到数据库,然后对其进行分析整理,达到条件触发告警。其灵活的扩展性和丰富的功能是其他监控系统所不能比的。相对来说,它的总体功能做的非常优秀。
    从以上各种监控系统的对比来看,Zabbix都是具有优势的,其丰富的功能、可扩展的能力、二次开发的能力和简单易用的特点,读者只要稍加学习,即可构建自己的监控系统。

    小米的监控系统:open-falcon。open-falcon的目标是做最开放、最好用的互联网企业级监控产品。

    OWL是TalkingData公司推出的一款开源分布式监控系统OWLgithub地址

    三方监控:

    现在市场上有很多不错的第三方监控,比如:监控宝、监控易、听云、还有很多云厂商自带监控,但是在这里我们不打算着重介绍,如果想了解三方监控可自行上官网咨询。(避免说广告植入)

    4 监控流程

    上面介绍了这么多,那么到底选择什么监控工具最合适呢,我这里推荐几款开源监控工具:zabbix、Open-Falcon、LEPUS天兔(专用于监控数据库)。
    但是本文还是基于zabbix来构建整个监控体系生态圈。
    那么下面我们就来聊聊,zabbix的整个流程:

    监控流程

    1、数据采集:Zabbix通过SNMP、Agent、ICMP、SSH、IPMI等对系统进行数据采集
    2、数据存储:Zabbix存储在MySQL上,也可以存储在其他数据库服务
    3、数据分析:当我们事后需要复盘分析故障时,zabbix能给我们提供图形以及时间等相关信息,方面我们确定故障所在。
    4、数据展示:web界面展示、(移动APP、java_php开发一个web界面也可以)
    5、监控报警:电话报警、邮件报警、微信报警、短信报警、报警升级机制等(无论什么报警都可以)
    6、报警处理:当接收到报警,我们需要根据故障的级别进行处理,比如:重要紧急、重要不紧急,等。根据故障的级别,配合相关的人员进行快速处理。

    5 监控指标

    我们上面了解了监控方法、目标、流程、也了解了监控有哪些工具,那具体要监控些什么东西,在这里进行了分类整理:
    硬件监控
    系统监控
    应用监控
    网络监控
    流量分析
    日志监控
    安全监控
    API监控
    性能监控
    业务监控

    5.1 硬件监控

    早期我们通过机房巡检的方式,查看硬件设备灯光闪烁情况判断是否故障,这样非常浪费人力,并且是重复性无技术含量的工作,大家懂得。
    硬件监控
    当然我们现在可以通过IPMI对硬件详细情况进行监控,并对CPU、内存、磁盘、温度、风扇、电压等设置报警设置报警阈值(自行对监控报警内容编写合理的报警范围)
    IPMI监控硬件服务参考资料

    IPMI
    在这里插入图片描述
    IPMI工具无法获取到硬件的状态,可以借助MegaCli工具探测Raid磁盘队列状态
    zabbix提供IPMI监控模板:Zabbix IPMI Interface
    系统自带的IPMI模板只能监控,风扇,电源,和部分温度

    5.2 系统监控

    中小型企业基本全是Linux服务器,那么我们肯定是要监控起系统资源的使用情况,系统监控是监控体系的基础。
    监控主要对象:

    在这里插入图片描述
    CPU有几个重要的概念**:上下文切换**、运行队列和使用率

    这也是我们CPU监控的几个重点指标。
    通常情况,每个处理器的运行队列不要高于3,CPU 利用率中用“户态/内核态”比例维持在70/30,空闲状态维持在50%,上下文切换要根据系统繁忙程度来综合考量。

    针对CPU常用的工具有:htop、top、vmstat、mpstat、dstat、glances

    zabbix提供系统监控模板:Zabbix Agent Interface

    CPU整体状态
    在这里插入图片描述

    上下文切换 在这里插入图片描述

    负载状态
    在这里插入图片描述
    内存:通常我们需要监控内存的使用率、SWAP使用率、同时可以通过zabbix描绘内存使用率的曲线图形发现某服务内存溢出等。
    针对内存常用的工具有: free、top、vmstat、glances

    内存使用率
    在这里插入图片描述

    IO分为磁盘IO和网络IO。除了在做性能调优我们要监控更详细的数据外,那么日常监控,只关注磁盘使用率、磁盘吞吐量、磁盘写入繁忙程度,网络也是监控网卡流量即可。
    常用工具有:iostat、iotop、df、iftop、sar、glances

    磁盘使用率
    在这里插入图片描述

    磁盘读/写吞吐
    在这里插入图片描述

    磁盘读/写次数
    在这里插入图片描述

    网卡进出口流量
    在这里插入图片描述

    TCP11种状态信息
    在这里插入图片描述

    其它的系统监控还有运行的进程端口、进程数、登陆用户、Open File等(详细查看zabbix自带OS Linux模板)

    其他相关监控
    在这里插入图片描述

    5.3 应用监控

    把硬件监控和系统监控研究明白后,我们进一步操作是需要登陆到服务器上查看服务器运行了哪些服务,都需要监控起来。
    应用服务监控也是监控体系中比较重要的内容,例如:
    LVS、Haproxy、Docker、Nginx、PHP、Memcached、Redis、MySQL、Rabbitmq等等,相关的服务都需要使用zabbix监控起来。

    nginx_status
    在这里插入图片描述

    PHP-FPM_status
    在这里插入图片描述

    Redis_status
    在这里插入图片描述

    JVM监控
    在这里插入图片描述
    zabbix提供应用服务监控:Zabbix Agent UserParameter
    zabbix提供的Java监控:Zabbix JMX Interface
    percona提供MySQL数据库监控:percona-monitoring-plulgins

    5.4 网络监控

    作为一个针对全国用户的电商网站,时刻掌握各地到机房的网络状态也是必须的。
    网络监控是我们构建监控平台是必须要考虑的,尤其是针对有多个机房的场景,各个机房之间的网络状态,机房和全国各地的网络状态都是我们需要重点关注的对象,那么如何掌握这些状态信息呢?我们需要借助于网络监控工具Smokeping。
    Smokeping 是rrdtool的作者Tobi Oetiker的作品,是用Perl写的,主要是监视网络性能,www 服务器性能,dns查询性能等,使用rrdtool绘图,而且支持分布式,直接从多个agent进行数据的汇总。
    同时,由于自己监控点比较少,还可以借助很多商业的监控工具,比如监控宝、听云、基调、博瑞等。同时这些服务提供商还可以帮助你监控CDN的状态。

    smokeping
    在这里插入图片描述

    监控宝在这里插入图片描述
    在这里插入图片描述

    5.5 流量分析

    网站流量分析对于运维人员来说,更是一门必须掌握的知识了。比如对于一家电商公司来说:
    通过对订单来源的统计和分析,可以了解我们在某个网站上的广告投入有没有收到预期的效果。
    可以区分不同地区的访问人数、甚至商品交易额等。
    百度统计、google分析、站长工具等等,只需要在页面嵌入一个js即可。
    但是,数据始终是在对方手中,个性化定制不方便,于是google出一个叫piwik的开源分析工具

    piwik
    在这里插入图片描述

    百度统计
    在这里插入图片描述

    5.6 日志监控

    通常情况下,随着系统的运行,操作系统会产生系统日志,应用程序会产生应用程序的访问日志、错误日志,运行日志,网络日志,我们可以使用ELK来进行日志监控。
    对于日志监控来说,最见的需求就是收集、存储、查询、展示,开源社区正好有相对应的开源项目:
    logstash(收集) + elasticsearch(存储+搜索) + kibana(展示)
    我们将这三个组合起来的技术称之为ELK Stack,所以说ELK Stack指的是Elasticsearch、Logstash、Kibana技术栈的结合。
    如果收集了日志信息,那么如果部署更新有异常出现,可以立即在kibana上看到。

    Elk日志展示
    在这里插入图片描述

    当然也可以通过Zabbix过滤错误日志来进行告警

    zabbix日志展示
    在这里插入图片描述

    5.7 安全监控

    虽然Linux开源的安全产品不少,比如四层iptables,七层WEB防护nginx+lua实现WAF,最后将相关的日志都收至Elkstack,通过图形化进行不同的攻击类型展示。但是始终是一件比较耗费时间,并且个人效果并不是很好。这个时候我们可以选择接入第三方服务厂商。

    某某三方安全
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    三方厂商提供全面的漏洞库,涵盖服务、后门、数据库、配置检测、CGI、SMTP等多种类型
    全面检测主机、Web应用漏洞自主挖掘和行业共享相结合第一时间更新0day漏洞,杜绝最新安全隐患

    5.8 API监控

    由于API变得越来越重要,很显然我们也需要这样的数据来分辨我们提供的 API是否能够正常运作。
    监控API接口GET、POST、PUT、DELETE、HEAD、OPTIONS的请求
    可用性、正确性、响应时间为三大重性能指标

    API监控
    在这里插入图片描述

    三方API监控在这里插入图片描述

    响应时间
    在这里插入图片描述
    在这里插入图片描述

    5.9 性能监控

    全面监控网页性能,DNS响应时间、HTTP建立连接时间、页面性能指数、响应时间、可用率、元素大小等
    zabbix提供URL监控:Zabbix Web 监控

    Zabbix站点监控
    在这里插入图片描述

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    终端响应时间
    在这里插入图片描述

    第三方监控监控大盘。各类图表一目了然,全面体现网页性能健康状况。

    5.10 业务监控

    没有业务指标监控的监控平台,不是一个完善的监控平台,通常在我们的监控系统中,必须将我们重要的业务指标进行监控,并设置阈值进行告警通知。比如电商行业:
    每分钟产生多少订单,
    每分钟注册多少用户,
    每天有多少活跃用户,
    每天有多少推广活动,
    推广活动引入多少用户,
    推广活动引入多少流量,
    推广活动引入多少利润,
    今天商品打包出库多少,
    今天退货商品有多少,
    等等 重要指标都可以加入zabbix上,然后通过screen展示。
    注:由于业务监控图表,涉及到隐私的数据太多,就不截图。

    6 监控报警

    故障报警通知的方式有很多种,当然我们最常用的还是短信,邮件
    在这里插入图片描述

    短信报警

    在这里插入图片描述

    邮件报警

    在这里插入图片描述

    7 报警处理

    一般报警后我们故障如何处理,首先,我们可以通过告警升级机制先自动处理,比如nginx服务down了,可以设置告警升级自动启动nginx。
    但是如果一般业务出现了严重故障,我们通常根据故障的级别,故障的业务,来指派不同的运维人员进行处理。
    当然不同业务形态、不同架构、不同服务可能采用的方式都不同,这个没有一个固定的模式套用。

    在这里插入图片描述

    8 面试监控

    1.硬件监控

    通过SNMP来进行路由器交换机的监控(这些可以跟一些厂商沟通来了解如何做)、服务器的温度以及其他,可以通过IPMI来实现。当然如果没有硬件全都是云,直接跳过这一步骤。

    2.系统监控

    如CPU的负载,上下文切换、内存使用率、磁盘读写、磁盘使用率、磁盘inode使用率。当然这些都是需要配置触发器,因为默认太低会频繁报警。

    3.服务监控

    比如公司用的LNMP架构,nginx自带Status模块、PHP也有相关的Status、MySQL的话可以通过percona官方工具来进行监控。Redis这些通过自身的info获取信息进行过滤等。方法都类似。要么服务自带。要么通过脚本来实现想监控的内容,以及报警和图形功能。

    4.网络监控

    如果是云主机又不是跨机房,那么可以选择不监控网络。当然你说我们是跨机房以及如何如何。推荐使用smokeping来做网络相关的监控。或者直接交给你们的网络工程师来做,因为术业有专攻。

    5.安全监控

    如果是云主机可以考虑使用自带的安全防护。当然也可以使用iptables。如果是硬件,那么推荐使用硬件防火墙。使用云可以购买防DDOS,避免出现故障导致down机一天。如果是系统,那么权限、密码、备份、恢复等基础方案要做好。web同时也可以使用Nginx+Lua来实现一个web层面的防火墙。当然也可以使用集成好的openresty。

    6.Web监控

    web监控的话题其实还是很多。比如可以使用自带的web监控来监控页面相关的延迟、js响应时间、下载时间、等等。这里我推荐使用专业的商业软件,监控宝或听云来实现。毕竟人家全国各地都有机房。(如果本身是多机房那就另说了)

    7.日志监控

    如果是web的话可以使用监控Nginx的50x、40x的错误日志,PHP的ERROR日志。其实这些需求无非是,收集、存储、查询、展示,我们其实可以使用开源的ELKstack来实现。Logstash(收集)、elasticsearch(存储+搜索)、kibana(展示)

    8.业务监控

    我们上面做了那么多,其实最终还是保证业务的运行。这样我们做的监控才有意义。所以业务层面这块的监控需要和开发以及总监开会讨论,监控比较重要的业务指标,(需要开会确认)然后通过简单的脚本就可以实现,最后设置触发器即可

    9.流量分析

    平时我们分析日志都是拿awk sed xxx一堆工具来实现。这样对我们统计ip、pv、uv不是很方便。那么可以使用百度统计、google统计、商业,让开发嵌入代码即可。为了避免隐私也可以使用piwik来做相关的流量分析。

    10.可视化

    通过screen以及引入一些第三方的库来美化界面,同时我们也需要知道,订单量突然增加、突然减少。或者说突然来了一大波流量,这流量从哪儿来,是不是推广了,还是被攻击了。可以结合监控平来梳理各个系统之间的业务关系。

    11.自动化监控

    如上我们做了那么多的工作,当然不能是一台一台的来加key实现。可以通过Zabbix的主动模式以及被动模式来实现。当然最好还是通过API来实现。

    12.分布式监控

    9 监控总结

    真正想做到更完整的监控体系,目前的开源软件,确实无法很好的满足,有条件的公司都开始自己开发自己的监控系统,比如小米开源的Open-Falcon。
    也有比较好的开源的监控框架如Sensu等,再加上influxdb、grafana可以用来定制符合自己企业的监控平台。

    展开全文
  • 供应商管理体系是对供应商的信息,产品信息,供货信息进行管理,现在很多大中型企业都会使用供应商管理体系。那到底什么是供应商管理体系?包括哪些内容呢?什么是供应商管理体系: 从概念上讲,供应商管理体系是...
  • 百度百科的专业定义“评价指标体系是指由表征评价对象各方面特性及其相互联系的多个指标,所构成的具有内在结构的有机整体。”简单来说,就是将统计指标系统性的组织起来。指标体系是由指标和体系两部分组成。指标...
  • 我们在通信网络、IT、智能终端和云服务等领域为客户提供有竞争力、安全可信赖的产品、解决方案与服务,与生态伙 伴开放合作,持续为客户创造价值,释放个人潜能,丰富家庭生活,激发组织创新。华为坚持围绕客户需求...
  • GB/T 31950-企业诚信管理体系什么价值? 可以在公开媒体上宣传其认证资格。合法合规地提供对产品和服务信晋的承诺。有利于提高市场信用形象以增加企业效应;从而为其带来更多的颗寄,扩大其市场份额,提升其...
  • 》的这篇文章中就跟大家聊过,运营这个东西很大也很杂,也总结了运营这个学科的知识体系有哪些,今天我将更细化的聊一下产品运营体系,虽然产品是产品经理创造出来的,但是真正让产品落地发展的还是需要运营来实现,...
  • 运营管理三大支撑落地-体系、流程、标准1、体系,其一、企业运营基础一个个体系组成,如营销体系、产品体系、财务体系、人才体系等等。体系的建设我认为自上而下进行,根据企业发展和自我锤炼,经梳理而成,形成...
  • 建议商家在设计前,先弄清楚清楚体系的价值是什么? 第一、让会员用户保持留存 利用积分平台权益的方式,让用户持续选择我们的产品,这是最简单、清晰的一层价值,通过权益来刺激用户持续消费,从而积累消费行为,...
  • 一个企业里所有的活动都离不开体系的要求:产品生产、产品检验、原料采购、人事管理、成本管理、质量管理、环境管理、安全管理……体系无处不在。在信息系统建设和服务能力评估(CS)、 ITSS运维评估认证、CMMI评估...
  • 一、什么是信息流信息流众多种类媒体类型的其中之一。其目的获客、更多用户使用。获客,通过开拓新渠道可得到;更多用户,通过开拓、管理现有渠道可得到。渠道策略为了将客户转化为营收。渠道分析视为了整合...
  • 售后服务工作质量管理在使用过程的延续,实现商品使用价值的重要保证,直接关系到企业的生存、关系到企业商品的市场占有率、关系到...产品价格和质量的竞争仅“第一次竞争”,售后服务的竞争则“第二次竞...
  • ISO9001质量管理体系ISO9001体系标准高度概括了世界经济发达国家工业化革命200年来质量管理的成功经验,源自实践,上升为理论的一套科学管理模式,其目的为了提升产品和服务的质量,增加顾客的满意度,提高市场...
  • 第一章 阿里大数据产品体系 1.大数据基础知识 什么是数据分析? 数据分析基于商业目的,有目的的进行收集、整理、加工和分析数据,提炼有价值信息的过程。 数据分析流程:需求分析明确目标➡️数据收集加工处理➡...
  • 10个案例说明什么是产品模型.pdf 产品模型=商业模式+产品架构+运营体系
  • 许多人,包括一些想建立产品经理职能的企业,最经常问到的问题就是产品经理到底什么的?什么人适合做产品经理?和项目经理到底有什么区别? 《产品经理认证(NPDP)知识体系指南》其实也回答了这个问题,在第...
  • 什么是产品经理?

    2020-01-04 18:59:58
    互联网的精神是什么呢?也许有朋友会振臂高呼说是分享、是开源,NoNoNo说的并不全面。 “开放、平等、协作、快速、分享” 这五个才是互联网真正的精髓,你品你细细的品。 修真院的教学宗旨一直以来也都是围绕着...
  • 阿里云产品体系介绍

    2019-05-08 22:47:32
    什么是云计算? 云计算的商业本质在于资源租赁。云服务厂商批量购买服务器、建设数据中心,云客户按需租赁计算资源、网络资源、存储资源,并购买增值服务。对云客户而言,租赁云服务器可以节省布置机房、购买机器、...
  • 相对不错的用户推送体系是:推送的信息资讯用户觉得有用,不反感。 渣渣的用户推送体系就是:用户感觉莫名其妙收到一些莫名其妙的信息资讯 第一个莫名其妙是因为没有得到用户许可,第二个莫名其妙是因为信息内容...
  • 2017云栖大会HBase专场,阿里云高级技术专家封神带来阿里云...以下精彩内容整理:在阿里已经有12000多台在跑HBase,为什么会有这样的规模?接下来让我们一起来看看HBase产品体系架构及特性。我们发现客户有各种不...
  • 商业产品色彩体系

    2012-10-11 14:17:21
    商业产品有这样几个特点:1.信息量大;2.功能模块繁多;3.用户角色多样化;4.操作者水平参差不齐。 通常情况下,图形及色彩引导用户的第一要素。在商业系统中,图形不可滥用。 那么如何用色彩引导用户获取信息...
  • 数据产品-指标标签体系构建

    千次阅读 2020-04-14 11:37:07
    作为刚毕业不到一年的数据产品经理,今天和大家分享一下我接触到和认知范围内的数据产品经理关于数据指标标签体系的构建过程是什么样子的 1、解读数据库数据 ①在我们公司(家居互联网行业),我们作为数据部门,...
  • 新零售通过线上线下的不断融合,可以将线上流量转到线下店铺,增加用户活跃度,给线下店铺提供新的发展动力,消费者也将得到更加专业的服务、更加优质的产品,企业需要借助互联网时代的传播能力、数据力量、社交化等...
  • 选型宝主编与SYNOPSYS中国区部门业务负责人、 Coverity产品线专家 韩葆首次交流时,他率先抛出的两个观点! PART1 Q 作为一家EDA和IP领域的一个全球的领导者,那么你们为什么会想要进入这个安全市场,这个市场...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 2,323
精华内容 929
关键字:

产品体系是什么