精华内容
下载资源
问答
  • 系统自动化运维

    千次阅读 2014-10-28 09:55:02
    站在“巨人”的肩膀上运维 现实问题 ...我是一名IT运维工程师,每天的工作量很大,更不敢离开机器半步,长期跟设备、服务器打交道,因为怕万一机器出毛病,自己负担不起业务上的麻烦,又怕经理

    系统自动化运维

    现实问题

    之前在论坛看到一个运维工程师的帖子,内容如下:

    现在的一个IT工作者最头疼的就是加班,秃顶的是IT工作者最多、单身的是IT工作者最多、没有约会,没有休闲,没有旅游还是IT工作者最多。这可怎么办呢?我是一名IT运维工程师,每天的工作量很大,更不敢离开机器半步,长期跟设备、服务器打交道,因为怕万一机器出毛病,自己负担不起业务上的麻烦,又怕经理的炒鱿鱼,况且公司还不肯出钱雇很多IT运维人员,让我一个人看着这么多的设备,真是连眼都不敢眨一下,雇来几个人也是呆不长就走人,公司一直没有一个专门潜心在这干的,也招不到专门的运维人员,出了大事,还显不出我的本领,经理直接去找专门的网络公司协助解决,在以上这种状况下,让运维工程师情何以堪?所以我请大家帮忙推荐有没有好用、免费的运维软件,主要就是能监控服务器和网络设备就行,还有没有可以实现自动化巡检的软件?求大家推荐....................
    求助!!!” 

    产生原因

    上述的情况还是处于传统运维管理方式,这种传统的运维管理方式让运维工程师疲惫不堪,主要表现在两个方面:

    1,  运维工程师被动,效率低。在运维过程,只有当事件已经发生并且对业务照成影响时才能被发现和处理,这种被动“救火”使运维工程师终日忙碌,运维质量很难提高,导致业务部门对运维部门的服务满意度不高,这种来自其它部门的不满也增加了运维工程师的压力。

    2,  缺乏运维技术工具。随着技术的发展和多元化,企业的IT系统越来越复杂,各式各样的网络设备、服务器以及在服务器上运行的各种服务让运维工程师难以应付,即使加班加点维护,也可能因为设备或者网络的原因导致服务不可访问,给公司带来不可挽回的损失。出现这种情况的原因就是没有使用高效的运维技术工具进行监控,通告,让运维工程师能够快速主动处理。

    解决方案

    使用监控工具

    监控宝

    监控宝成立于2009年,是一家面向企业或个人站长提供网站监控和预警服务的网站,目前监控宝可以监控的内容包括:网站的可访问性以及速度;服务器硬件性能(CPU、内存、宽带流量、磁盘空间、负载等);服务器软件性能(Apache、MySQL 等)。

    主要功能

    • 站点监控
    • 服务和应用监控
    • 服务器性能监控
    • 内容监控
    • 用户访问速度监控
    • 警告通知

    主要是通告web的方式设置,上手相对容易。

    Nagios

    Nagios是一款开源的免费网络监视工具,Nagios能监视所指定的本地或远程主机以及服务,同时提供异常通知功能等。

    主要功能

    •  网络服务监控(SMTP、POP3、HTTP、NNTP、ICMP、SNMP、FTP、SSH)
    •  主机资源监控(CPU load、disk usage、system logs),也包括Windows主机(使用NSClient++ plugin)
    •  可以指定自己编写的Plugin通过网络收集数据来监控任何情况(温度、警告……)
    •  可以通过配置Nagios远程执行插件远程执行脚本
    •  远程监控支持SSH或SSL加通道方式进行监控
    • 简单的plugin设计允许用户很容易的开发自己需要的检查服务,支持很多开发语言(shell scripts、C++、Perl、ruby、Python、PHP、C#等)
    • 包含很多图形化数据Plugins(Nagiosgraph、Nagiosgrapher、PNP4Nagios等)
    • 可并行服务检查
    • 能够定义网络主机的层次,允许逐级检查,就是从父主机开始向下检查
    • 当服务或主机出现问题时发出通告,可通过email, pager, sms 或任意用户自定义的plugin进行通知
    • 能够自定义事件处理机制重新激活出问题的服务或主机
    • 自动日志循环
    • 支持冗余监控
    • 包括Web界面可以查看当前网络状态,通知,问题历史,日志文件等

    主要通过配置文件进行配置,但是开源免费,拥有大量的插件可以完成日常的监控需求,对入门门槛相对比较高。

    使用通告工具

    百度通告平台

    在监控工具检测到异常后,在通知运维工程师的过程出现遗漏的情况也会造成不可估计的后果。所以需要使用专业的通告工具——百度通告平台来保证通告无遗漏。

    主要功能

    • 多渠道通告方式:一种通告、多个渠道,多重渠道保障通告及时告知目标。随心所欲的选用通告渠道:电话、SNS、短信、邮件等。
    • 报警管理:提供web版和手机APP版,可时刻响应通告,高效办公处理,让您工作生活两不误。
    • 自动逐级报警:报警从不被错过,遗漏的报警会自动升级到合适的等级,发送给合适的人,保证通告无遗漏告知。
    • 接入快捷:大量系统组件支持各监控系统(监控宝、加速乐等)高效接入,丰富API使系统接入更加自由定制化。
    • 通告群发:通知、报警,通告想发就发,随心随意。多人(组)选择,轻轻点击,一触即发。



    图 1 传统通告方式


    图 2 百度通告平台的通告方式

    对比图1和图2,就能体现百度通告平台的价值:多渠道通告方式和自动逐级报警保障故障无遗漏通告。

    愿景

    全天候自动检测与可靠报警方式实现IT运维的“全天候无人值守”,大大降低运维工程师的工作负担,使运维工程师能够从日常的基础运维工作中解放出来,能做运维相关的技术研究。。

    展开全文
  • 云计算的发展,推动了自动化运维、DevOps、AIOps等趋势的兴起,在业务快速变化的今天,企业希望通过一套自动化运维的专家系统提高运维效率,为业务提供支撑。 传统的方式下,打造一套成熟的DevOps流程需要有大量的...

    image.png

    云计算的发展,推动了自动化运维、DevOps、AIOps等趋势的兴起,在业务快速变化的今天,企业希望通过一套自动化运维的专家系统提高运维效率,为业务提供支撑。

    传统的方式下,打造一套成熟的DevOps流程需要有大量的技术投入,如果采用商业软件还会有不菲的支出。无论是哪一项,都意味着大量的时间成本和财务成本支出。云计算正在改变这种情况。

    为云而生的ECS自动化运维套件

    2月3日,阿里云宣布推出ECS(Elastic Compute Service,弹性计算服务)自动化运维套件。这是一套无需自行部署、云原生的免费产品能力,可以帮助企业实现从IT架构的规划、迁移、部署、弹性扩缩容,到日常管理,覆盖云基础设施全生命周期的自动化运维。
    image.png

    “ECS自动化运维套件是真正为云而生的自动化运维体系,能发挥云的最大价值,也能让企业享受云的技术红利。”阿里云弹性计算负责人张献涛表示。

    据阿里云介绍,ECS自动化运维套件涵盖服务器迁移中心、资源编排、运维编排等13个工具,覆盖跨地域部署、定时快照等20多个常见运维场景。利用阿里云自动化运维套件,企业在迁移、部署和扩容的场景下,能实现最高10倍的效率提升,实现从人工到自动的质变。

    今天,企业在云上需要管理数十万的云服务器,如何高效地批量管理成为重要问题;即便是中小型客户,自建机房还是在云上,都需要完成类似上线下线、扩缩容、升级回滚等主要运维操作,成熟的自动化运维能力无疑已经成为了企业的必备能力。

    如果运维团队都选择自己写脚本或开发自动化工具,可能开发多达数十种自动化工具。不同业务方使用的开发环境和组件不同,可能需要为不同业务方开发不同的自动化工具,这无疑再次提升了成本。云则提供了一种标准化和低成本的选择。

    阿里云透露,在过去一年,新推出的运维编排工具OOS用户量翻了10倍,每月有100万次的自动化运维操作通过OOS模板完成;超过100万云资源通过资源编排ROS创建;弹性伸缩功能ESS每月所支撑的扩缩容资源量超过30万台云服务器,这些数据体现云上自动化运维工具对企业的巨大价值。相关的功能已经服务了超过近万家企业客户以及数十万个人用户。

    如今,阿里云弹性计算将一整套自动化运维能力体系化、产品化输出,重磅发布“阿里云ECS自动化运维套件”,让用户可以在云上构建全流程的自动化运维体系。

    ECS自动化运维套件的四大特点

    受制于历史遗留、企业规模或成本等因素,不同企业的IT运维自动化程度参差不齐。阿里云在调研过程发现,当前企业的自动化运维离完全的AIOps还有很大距离。但很多企业都已经实现了半自动化,甚至有企业实现了高度自动化。

    image.png

    如今,基础设施即代码、自动化、智能化等趋势在运维领域已是大势所趋,阿里云ECS自动化运维套件的设计充分体现了这些特点。同时,作为一套通用的运维工具,它考虑到不同企业业务场景的多样性,给企业提供了大量基础能力与原子能力,有很大自由度。

    相关产品负责人总结,ECS自动化运维套件有以下四大优势。

    全流程覆盖:该套件涵盖从迁云、部署、紧急扩缩容到日常自动化运维等环节,覆盖了企业使用云服务器的全生命周期管理,真正实现基础设施即代码。

    灵活自定义:其中事件驱动体系、基于自动化部署与编排等工具,允许客户根据自身高频业务场景,制作适合自身的业务模板让机器自动完成,支持对外分享。同时该套件支持terroform等开源工具。

    敏捷高效:模板化、代码化的设计,将高频、批量或要求快速响应的操作,用机器代替人工,帮助企业快速实现运维基础服务自动化,从而加速DevOps,最大化提高运维效率,告别人肉操作,提升运维人员幸福感。

    智能易用:套件中所有自动化运维工具无需安装开箱即用。其中的自动化选型、实例智能诊断与修复、资源顾问和一键迁云工具等多种能力,都可以智能地完成复杂任务,免去人工学习与操作。

    同时,该套件体现了模板化或代码化的理念。阿里云相信,标准化、模板化、代码化的自动化运维,将是AIOps的基础,因为只有所有运维工作都可以被自动化、所有自动化工作都非常规范和标准时,AI才有机会进行学习,AIOps 才可能成为现实。

    助力企业低成本构建自动化运维体系

    在传统IT时代,建设成熟的运维平台只是大型企业的专利,小型企业只能使用开源工具,或者自己开发简单的自动化工具。而今天,无论是只有两个人的初创团队,还是成千上万人的成熟企业,都能够在阿里云上建设自己的自动化工具。

    阿里云作为聚合了百万用户的云平台,积累下了丰富的应用架构模板、场景化的自动化运维模板。这使得所有阿里云的用户都可以零成本获取最成熟的自动化运维方案。多样化的自定义功能加上事件体系,让用户可以低成本的构建一套稳定安全的云上DevOps方案。

    再者,阿里云提供的产品能力是不断的向前迭代,使得企业不仅仅是依靠自身能力去构建DevOps体系,而是有了云平台能力进化的加成。

    “每家企业上云之后就像配备了一个先进的、不断进化的工厂,不需要从零开始搭建,每一台机器和每一条流水线都随时听从调遣。这也是我们倡导Cloud DevOps的原因。”张献涛表示。

    展开全文
  • 作者:赵玉开,十年以上互联网研发经验,2013年加入京东,在运营研发部任架构师,期间先后主持了物流系统自动化运维平台、青龙数据监控系统和物流开放平台的研发工作,具有丰富的物流系统业务和架构经验。...

    作者:赵玉开,十年以上互联网研发经验,2013年加入京东,在运营研发部任架构师,期间先后主持了物流系统自动化运维平台、青龙数据监控系统和物流开放平台的研发工作,具有丰富的物流系统业务和架构经验。在此之前在和讯网负责股票基金行情系统的研发工作,具备高并发、高可用互联网应用研发经验。


    简单来理解,自动化运维就是要通过机器的方式来简化整体的运维过程,特别是优化重复类型的工作,以提高运维效率,减少因人工而引起的失误操作。随着运维管理的复杂度和难度增大,自动化运维也基本成为了运维平台演进的必经之路。但如何落地自动化运维平台,不同的企业因为运维发展阶段和业务体量的不同,都有不一样的实现路径。


    以京东为例,它的物流系统有很多分支机构, 比如仓库、分拨中心、转运中心等, 业务复杂的分支机构可能会有自己的信息系统, 这些信息系统往往分布式地部署到全国各地,那如何基于自动化运维平台管理好这些分支机构的服务器、 信息系统, 降低因为地域分布造成的运维维护成本呢?京东资深架构师赵玉开向 InfoQ 记者深入介绍了他们在自动化运维平台方面的一些探索和实践。另外,赵玉开也将会在 9 月 10 日举行的 CNUTCon 全球运维技术大会 上分享相关话题,欢迎关注。


    InfoQ:可以先介绍下目前京东物流系统自动化运维平台的一些基本情况吗?


    赵玉开: 京东物流系统自动化运维平台从 2014 年开始启动到现在已经历了三各阶段,到目前管理了 MySQL、JMQ、 Redis 及自研应用等多种实例。


    众所周知,京东业务发展迅猛,每周都需要开仓,数量多达十几个。最初开仓过程特别冗长和复杂,开仓过程中涉及到研发人员部署系统、运营人员手动填写多种申请、运维人员不仅要负责中间件安装,还要负责整个流程中每个环节的进展确认及协调,这直接导致了开仓慢,且涉及到的各部门都需要投入大量的人力成本。


    基于此,2014 年初我们启动了一期自动化运维平台研发的项目,2014 年 10 月项目一期上线时,已基本解决了开仓慢和人力成本的问题,也减少了开仓过程中运维同学的重复性工作内容,制定标准化模板,解放了研发人员的重复性部署工作。运营人员可通过模板直接设置,将之前一些繁琐的密码、JMQ Token 等数据实现自动化配置,大大减少了流程耗费的时间。


    一期上线后,得到了流程中各环节涉及部门的赞赏,并在得到大家积极反馈后,迅速进入到二期项目。二期项目完成后,数据的初始化问题和研发日常批量部署问题也得到了解决,系统的自动化程度已可以满足日常的工作需求。


    今年初,为接入更多物流作业单位,如分拣中心, 亚洲一号自动化物流中心等,我们开启了三期项目,目前项目还在持续前行中。


    InfoQ:谈谈你们的自动化运维架构?以及具体涉及到的技术栈?


    赵玉开: 我们的自动化运维的核心组件是 SaltStack, 我们基于 SaltStack 做了很多自定义的模块、Grains 和 Runner, 通过这些自定义的模块、Grains 以及 Runner 来支撑我们的开仓、部署、数据同步等功能。


    如下图是一个指令执行过程图, 分为两个部分, 上面部分为部署在 IDC 的模块, 下半部分则是部署在库房机房的模块。

    我们先逐个介绍部署在 IDC 部分的模块:

    1. Web 使用 Java 技术, 为用户提供操作界面, 控制操作权限, 使用 Activiti 工作流引擎驱动各种流程, 下发开仓过程中的自动化运维指令;

    1. Salt-API-Proxy 是 Salt-API 的代理层, 通过 Nginx 实现了反向代理, 在 Nginx 的配置中对发送指令的服务器 IP 做了限制, 另外可以通过配置指向工作的 Salt-API 服务器;

    1. Salt-API 负责和 Salt-Master 交互发送 SaltStack 的 Runner 与 Module 的 API 指令, Runner 指令是运行在 Salt-Master 服务器上的, 可以读取 master 配置, 也可以在一个 Runner 中协调执行多个 Module 运行结果;

    1. Salt-Master 有两个职责, 一是接受 salt-api 指令, runner 在本地执行, module 下发指令到对应的 salt-minion, 另一职责是运维同学手动下发指令, 完成一些非常见的 minion 配置工作;

    2. RsyncServer 负责中间件安装文件, 自研软件的文件存储和下发, RsyncServer 的文件存储是由 Salt-Master 发起的, Salt-Master 接受到 salt-api 的应用部署指令后, 会从部署指令中获得部署包下载地址, 然后下载到指定部署包存储目录, 并做解压操作; RsyncServer 的文件下发指令则是有 salt-minion 端的 Module 执行触发的。


      仓库部门和 IDC 之间通过 VPN 联通, 每个仓库的服务器上都安装了 SaltStack 的 minion 端, minion 端是一个 Python 进程, 负责接收 Master 的 Module 指令, 并在本地执行。另外 minion 端在执行指令过程中需要将执行过程中的输出及时的输出给用户端, 让用户可以通过 Web 端查看执行过程的情况, 即运维的可视化, 我们是通过 minion 端的可视化模块, 将执行过程输出通过 HTTP POST 方式发送给 Web 端, Web 端将 POST 内容存储到任务执行过程输出表中, 前端通过轮询方式读取输出表中的增量消息显示给用户端。


      我们采用的技术栈是 Java + Python。  前端界面展示、 工作流、权限控制、任务下发这些都是用的 Java 的 Spring MVC + MyBatis; 后端用的是 Python + Shell, Python 写了大量的 SaltStack 自定义模块。


      InfoQ:为什么当初要选择 SaltStack 而没有选择 Ansible?


      赵玉开: 不可否认 Ansible 也是一个非常好的自动化运维工具, 但是基于以下两点我们最终选择了 SaltStack:

      1. API 的易用性方面和 SaltStack 有差距, 我们的自动化运维系统一开始就有一个目标, 将开仓部署以及推广版本这些功能开放给物流运营人员, 所以必须做好前端用户体验, 这需要好用的 API, SaltStack 恰好有;

      1. 性能,标准 SSH 连接的时候比较耗时,ZeroMQ 传输的速度会快很多。


      InfoQ:在应用部署自动化这块,你们是怎么做的?


      赵玉开: 应用部署大致分为这么几个步骤: 打包、下发文件、更新配置、停止启动实例、备份部署版本, 具体如下。

      1. 我们使用的公司统一的打包系统, 打包系统打好包, 部署任务审批通过,自动化运维系统就可以通过 API 获得打包文件, 然后将部署包上传到版本服务器, 并解压缩,放到对应版本目录下;

      1. 通过 SaltStack 的 API 下发部署指令给部署目标服务器, 部署指令是一个 SaltStack 自定义模块, 该模块首先会执行 rsync 指令从版本服务器上同步变更文件;

      1. 文件下发之后更新配置, 通过 Web 接口请求自动化运维的 Web 端下发配置文件, 然后更新配置文件, 我们线上的配置文件是通过环境变量来配置的, 所以不管有多少个库房, 都不需要更新配置文件, 只有在特殊需求是设置环境变量, 就可以依据当前作业单位的不同改变下发的配置文件的内容;

      1. 调用应用的 stop.sh 脚本停止当前实例, 再调用 start.sh 脚本启动实例, 这里有一个约定, 不管是 Web 应用还是非 Web 应用必须在部署目录有一个 bin 目录下面有 start.sh 和 stop.sh 两个文件;

      2. 如果步骤 4 执行成功, 那么将此版本的文件备份到当前服务器上, 以备回滚使用。


        InfoQ:自动化运维解决了你们哪些问题?没有解决哪些问题?


        赵玉开: 自动化运维解决了我们开仓周期长,人力成本高的问题, 提升了全国部署推广的效率, 大大减少了运维同事的重复性工作, 把对成熟版本的推广工作交给了运营人员, 减少了研发同事在推广上线工作上的时间。


        现阶段正在探索如何通过自动化运维技术快速排查问题, 另外就是我们未来会有一些自动化的物流作业单位,如何用自动化运维平台管理好这些自动化的设备和设备软件也是我们在探索的。


        InfoQ:自动化运维平台上线了这么长时间,有做过复盘吗?有哪些经验可以分享给读者?未来有什么计划?


        赵玉开: 做过一些复盘, 每一期开发结束下一迭代开始的时候都会做复盘, 对现有问题进行总结, 同时收集下一步的需求。  目前看最深刻的体会是做自动化运维系统一定要做好元数据的管理,元数据要管理好服务器信息属性、 应用信息、应用配置、实例管理以及作业单位, 这些元数据要在一开始就做好, 能自动化收集的要自动化收集, 动态的参数一定要动态控制, 比如 Redis、MySQL 都有主从关系, 元数据中要存储这个主从关系, 但是不能写死, 必须有机制来更新主从关系, 否则 Redis 哨兵程序更新了 Redis 主从关系, 或者 MySQL DBA 因为某些原因切换了 MySQL 的主从, 自动化运维系统的元数据没有做对应更新,再执行指令时就会出问题, 甚至发生事故。


        未来计划有两个方面:

        1. 继续通过自动化运维系统来提升运维效率、 降低研发对应用运维的投入;

        1. 做自动化物流作业系统的自动化运维, 管好其中的设备和软件服务。


        InfoQ:在 CNUTCon 全球运维技术大会 上,你将会为读者分享哪些技术点?


        赵玉开: 这次大会我会给大家介绍下京东物流自动化运维平台的技术架构, 并详细介绍自动化开仓、批量部署的技术细节。




        CNUTCon 全球运维技术大会将于 9 月 10-11 日在上海举行,大会以“智能时代的新运维”为主题,涵盖 AIOps、SRE、DevOps、运维监控与安全等专场,邀请了来自 Google、Uber、eBay、BAT、携程、京东等公司大咖分享他们在最新运维技术实践过程中遇到的坑与经验,现场为你解疑答惑,点击“阅读原文”了解更多精彩!9 折限时优惠,报名时输入 CNUTCon-KAITAO 还可再减 200 !




        展开全文
      1. 自动化运维-系统部署

        2018-12-13 11:05:07
        网站业务上线,需要运维人员在短时间内完成几百台服务器部署,包括系统安装、系统初始、软件的安装与配置、性能的监 控......
      2. 自动化运维介绍 随着信息时代的持续发展,IT运维已经成为IT服务内涵中重要的组成部分。面对越来越复杂的业务,面对越来越多样化的用户需求,不断扩展的IT应用需要越来越合理的模式来保障IT服务能灵活便捷、安全稳定...

        自动化运维介绍

        随着信息时代的持续发展,IT运维已经成为IT服务内涵中重要的组成部分。面对越来越复杂的业务,面对越来越多样化的用户需求,不断扩展的IT应用需要越来越合理的模式来保障IT服务能灵活便捷、安全稳定地持续保障,这种模式中的保障因素就是IT运维(其他因素是更加优越的IT架构等)。从初期的几台服务器发展到庞大的数据中心,单靠人工已经无法满足在技术、业务、管理等方面的要求,那么标准化、自动化、架构优化、过程优化等降低IT服务成本的因素越来越被人们所重视。其中,自动化最开始作为代替人工操作为出发点的诉求被广泛研究和应用。

        IT运维从诞生发展至今,自动化作为其重要属性之一已经不仅仅只是代替人工操作,更重要的是深层探知和全局分析,关注的是在当前条件下如何实现性能与服务最优化,同时保障投资收益最大化。自动化对IT运维的影响,已经不仅仅是人与设备之间的关系,已经发展到了面向客户服务驱动IT运维决策的层面,IT运维团队的构成,也从各级技术人员占大多数发展到业务人员甚至用户占大多数的局面。

        因此,IT运维自动化是一组将静态的设备结构转化为根据IT服务需求动态弹性响应的策略,目的就是实现IT运维的质量,降低成本。可以说自动化一定是IT运维最高层面的重要属性之一,但不是全部。

        传统运维的缺陷:

        • 传统运维效率低,大多工作人为完成
        • 传统运维工作繁琐,容易出错
        • 传统运维每日重复做相同的事情
        • 传统运维没有标准化流程
        • 传统运维的脚本繁多,不能方便管理

        自动化运维就是要解决上面所有问题。

        常见自动化运维工具:

        • Puppet (www.puppetlabs.com)基于rubby开发,c/s架构,支持多平台,可管理配置文件、用户、cron任务、软件包、系统服务等。 分为社区版(免费)和企业版(收费),企业版支持图形化配置。
        • Saltstack(官网 https://saltstack.com,文档docs.saltstack.com )基于python开发,c/s架构,支持多平台,比puppet轻量,在远程执行命令时非常快捷,因为Saltstack有一个消息队列。Saltstack配置和使用比puppet容易,能实现puppet几乎所有的功能。
        • Ansible (www.ansible.com )更加简洁的自动化运维工具,不需要在客户端上安装agent,基于python开发。可以实现批量操作系统配置、批量程序的部署、批量运行命令。
        展开全文
      3. 文章目录自动化运维 自动化运维 新建一个django项目 查看django版本 连接远程服务器 上传文件到服务器 安装virtuaenv 在服务器上见虚拟环境 [root@docker CMDB]# virtualenv -p /usr/bin/python3 env ...
      4. 自动化运维

        千次阅读 2019-05-28 21:22:46
        一、传统运维方式简介 传统的IT运维仍然是等到IT故障出现后再由运维人员采取相应的补救措施...二、自动化运维简介 IT运维已经在风风雨雨中走过了十几个春秋,如今它正以一种全新的姿态摆在我们面前,运维自动化是IT...
      5. Python在自动化运维业务中的设计与实现.pdf
      6. 自动化运维要点

        千次阅读 2017-08-29 13:22:59
        Source什么是自动化运维自动化运维是指将IT运维中日常的、大量的重复性工作自动化,把过去的手工执行转为自动化操作。自动化是IT运维工作的升华,自动化运维不单纯是一个维护过程,更是一个管理的提升过程,是IT运维...
      7. IT运维之自动化运维

        2021-03-31 11:54:43
        所谓自动化运维,即在最少的人工干预下,结合运用脚本与第三方工具,保证业务系统7*24小时高效稳定运行。这应该是所有业务系统运维终极目标。 按照运维的发展成熟度来看,运维大致可分为三个阶段: 依靠纯手工,...
      8. 自动化运维之saltstack

        2021-02-24 11:29:15
        通过部署SaltStack,我们可以在成千万台服务器上做到批量执行命令,根据不同业务进行配置集中管理、分发文件、采集服务器数据、操作系统基础及软件包管理等,SaltStack是运维人员提高工作效率、规范业务配置与操作...
      9. Python自动化运维基础

        2020-10-21 11:07:24
        自动化运维就是将大量的重复性操作自动化,让工具或系统代替人工来自动完成具体的运维工作,解放生产力,提高效率,降低运维成本 为什么要进行自动化运维 自动化运维势在必行,主要有以下几点: 手工运维缺点多:...
      10. 自动化运维工具ansible简介

        千次阅读 2018-08-16 15:08:52
        自动化运维ansible配置,各模块的使用 地址:https://blog.csdn.net/su_use/article/details/81739207 自动化运维常用工具 安装系统 工具pxe/cobbler 用途:安装系统 虚拟化系统 KVM/xen/...
      11. 一、基础数据概况CMDB中文是配置管理数据库,存储与管理企业IT架构中设备的各种配置信息,与未来的IT运维管理标准和流程紧密关联,并且支持流程的运转。运维管理平台创建初期或初版中的CMDB更多是偏向IT资产管理...
      12. 根据现在云计算和DevOps的现态,我觉得一个成熟的自动化运维平台应该包括以下的特性: 一、支持混合云的CMDB 现在越来越多的服务器都转到了云上,而主流的公有云、私有云平台都拥有比较完备的资源管理的API,这些...
      13. 随着近年全球运维大会的火热举办,自动化运维话题被推向了前所未有地热度。自动化运维并不是炒作的概念,而是随着信息技术发展的必要趋势。“大数据”“容器”“DevOps”“微服务”……,不断涌现出新的技术,而它们...
      14. Python自动化运维介绍

        万次阅读 2019-01-07 21:19:37
        自动化运维 3 云运维 三 传统运维特点 1 资源少 2 业务结构简单 3 运维工作简单 四 传统运维确定 1 效率低 2 无法跨平台 3 资源分散 4 无标准 五 什么是自动化运维 1 错误定义 ...
      15. 自动化运维与python

        2020-04-01 19:28:50
        自动化运维就是将这些原本大量重复性的日常工作自动化,让工具或系统代替人工来自动完成具体的运维工作,解放生产力,提高效率,降低运维成本。可以说自动化运维是当下IT运维工作的必经之路。 自动化运维之所以...
      16. 自动化运维与Python

        2020-07-25 12:17:10
        1、为什么自动化运维?...自动化运维就是将这些原本大量重复性的日常工作自动化,让工具或系统代替人工来自动完成具体的运维工作,解放生产力,提高效率,降低运维成本。 原因: (1)手工运维缺点多。手工
      17. 2013年,我加入了聚美优品,当时成都团队仅有四五个人,负责一些辅助系统...先说一下传统运维的痛点和运维自动化的意义。我们日常运维工作是比较繁琐的,一些研发同学会经常让我们帮他们到服务器上查一下日志、或者是说
      18. 一、自动化运维的背景网站业务上线,需要运维人员在短时间内完成几百台服务器部署,包括系统安装、系统初始化、软件的安装与配置、性能的监控......所谓运维自动化,即在最少的人工干预下,利用脚本与第三方工具或...
      19. 万丈高楼平地起,高楼稳不稳取决于地基是否扎实。基础数据便是运维管理这座高楼的地基。 首先介绍一下我们在运维管理中所涉及到的基础数据有...
      20. 自动化运维平台分析

        2020-10-26 11:44:22
        在项目上线完成后,业务系统或平台自然就转入了运维管控期,而...而今天要谈自动化运维平台,里面一个重点就是基于我们面对的运维场景,如何将运维操作或任务进行细粒度分解,然后再对运维操作进行组合和编排。 为...

      空空如也

      空空如也

      1 2 3 4 5 ... 20
      收藏数 86,131
      精华内容 34,452
      关键字:

      业务系统自动化运维