精华内容
下载资源
问答
  • 什么是“宕机”服务器宕机的原因:重启服务器的危害: 什么是“宕机” 宕机,指操作系统无法从一个严重系统错误中...(2)其次,一些服务器例如数据库死锁也可以称为宕机,一些服务器的某些服务掉了,就可以这么说...

    什么是“宕机”

    宕机,指操作系统无法从一个严重系统错误中恢复过来,或系统硬件层面出问题,以致系统长时间无响应,而不得不重新启动计算机的现象。它属于电脑运作的一种正常现象,任何电脑都会出现这种情况。

    (1)一般情况下指的就是计算机主机出现意外故障而死机。
    (2)其次,一些服务器例如数据库死锁也可以称为宕机,一些服务器的某些服务挂掉了,就可以这么说。

    服务器宕机的原因:

    1、由操作员意向操作的重启——用于维护或更新服务器、部署机房或特殊情况等等。

    2、非操作员本身意愿造成的重启——如供电(欠压,过载,波动)、震动、硬件质量(热稳定性(热敏度)和抗干扰能力)、资源冲突、DirectX文件的损坏、系统不完善或瓶颈问题、病毒、灰尘、散热不良……等等原因而造成重启。

    3.、由于用户访问量过大,造成资源耗尽,或者你网站的数据超出你的空间限制范围大小也会出现宕机。

    重启服务器的危害:

    1、正在进行写硬盘操作时,即硬盘灯在不停地闪动时,断电或者强制重启,对硬盘的伤害最大。

    2、热启动(CTRL+ALT+DEL),对硬件上不会有损伤(软件上有时会发生程序非法中止导致数据丢失的问题);如果是冷启动(直接开关电源),就会对硬件尤其是硬盘造成伤害。除非无法正常关机可以考虑热启动。

    3、重启后,突然来电会有大量电流涌入电源,反复进行会使机器寿命大大降低,而且在硬盘正在读写的时候突然地断电也非常容易引起硬盘出现坏道从而损失数据。

    4.非正常重启的危害:首先,这样轻则会使硬盘掉数据,造成逻辑坏道,重则造成物理的坏道,损坏硬盘磁头伺服电路。还有,这也会造成主板的二度伤害,主板在一通一断当中对电路部分的冲击是比较大的。再则也会对电源造成一定的损害。

    展开全文
  • -End- 往期精彩: Hi,我是二毛,一个在大城市漂泊的程序员 图解数字签名 【故事】为什么C盘太满系统会卡? 欢迎来到程序员二毛的世界,在这里你将走进程序员的生活,感受职场冷暖,体会生活感悟,并学习到有趣的...

    点击蓝字,一起变强

    前晚 11 点,朋友圈被周董的新单曲 【说好不哭】刷屏了。

    QPS

    QPS(Query Per Second),指的是系统每秒能处理的请求数。这个是衡量系统性能的重要指标。有时候,我们也称之为吞吐量。

    RT

    响应时间(Response Time),是指从客户端发一个请求开始计时,到客户端接收到从服务器端返回的响应结果结束所经历的时间。

    如果一个网站的RT很长的话,就会特别的影响用户体验。所以,RT是很重要的一个指标。也是各个网站需要重点优化的。

    当我们评价一个网站的"快"和"慢"的时候,其实说的就是他的RT时间的长和短。当我们访问某个网站,有时候我们会说这个网站很"卡",其实言下之意说的就是这个网站的RT很长。

    在这里,其实可以把QQ音乐比喻成一家饭店。

    饭店平日里生意一般,每天招待几十个人完全没有问题。但是某一天,饭店突然被网红美食节目宣传了一波,引得一大批人关注,争相前往。

    饭店由原本客流量的几十人,一下子增加为几百上千人。为了服务大量的顾客,就会导致整个饭店的服务员异常忙碌,不得停歇。这将很容易导致服务员累坏崩溃。

    这个例子中,美食节目的宣传就相当于周杰伦发唱片,吸引了一波粉丝流量;过多的人前来吃饭导致服务员忙碌,就如流量过大使得服务器内存、CPU资源使用占比飙升,变得容易吃不消而瘫痪。RT就相当于顾客去饭店排队到吃完走人的时间;QPS相当于饭店这一天之内能够接纳的顾客数量。

    服务降级

    举个例子,有的时候我们去饭店吃饭,吃完饭以后服务员会拿一张问卷,让就餐者填写一下用户反馈。但是,这种让用户填写反馈的请求,只有在店里不忙的时候才会出现。如果店里非常忙,顾客很多的话,店员就不会再找就餐者填写问卷了。这种就是服务降级。

    在人流量大的时候,用户反馈这个功能就被降级了。因为他相对来说并没有那么重要。回到QQ音乐上面来说,在访问流量过大的时候,就可以把不那么重要的歌曲评论等功能降级掉先。

    限流降级

    饭店的人看到顾客太多源源不断,则可以设定一个最大招待人数,一旦超过这个人数,则让后面想要过来排队的顾客不用过来排了,因为名额已经用完。

    这其实也是电商网站常见的策略。对于某些功能,设定一个流量阈值,一旦流量达到阈值的话,就进行降级。

    比如秒杀功能,如果一瞬间流量太大,就可以进行限流降级。对于后续访问的用户直接提示已售空、跳转错误页、或者让他输入验证码重试等。而QQ音乐让部分人下不了单,也是这个道理。

    以上介绍的是在原有硬件架构不变的降级措施,相对应的还有扩容措施。

    (鹿晗宣布恋情之后,新浪程序员在扩容)

    扩容其实就相当于扩大饭店的经营面积,增加更多的服务员来服务,在这里就不展开介绍了。


     

     -End- 

    往期精彩:

    Hi,我是二毛,一个在大城市漂泊的程序员

    图解数字签名

    【故事】为什么C盘太满系统会卡?


        欢迎来到程序员二毛的世界,在这里你将走进程序员的生活,感受职场冷暖,体会生活感悟,并学习到有趣的编程技术。

        关注公众号《程序员二毛》,后台回复 1024 领取变强秘籍;点击“菜单栏-加群交流”可进入攻城狮交流群。

    “在看”我吗?

    展开全文
  • Keepalived ...Keepalived软件最初是专LVS设计的,用来管理并监控LVS集群系统中的各个服务节点状态,后来又加入了实现高可用的 VRRP功能。因此,Keepalived除了能管理LVS外,还可以作为Nginx、H...

    源自Keepalived高可用:https://www.jianshu.com/p/3e55e7449898 …Zhang21

    Keepalived

    Keepalived介绍

    Keepalived软件最初是专为LVS设计的,用来管理并监控LVS集群系统中的各个服务节点状态,后来又加入了实现高可用的 VRRP功能。因此,Keepalived除了能管理LVS外,还可以作为Nginx、Haproxy等的高可用解决软件。

    Keepalived主要是通过VRRP协议实现高可用功能。
    VRRP(Virtual Router Redundancy Protocol),虚拟路由冗余协议。
    VRRP目的是为了解决静态路由单点故障问题,它能保证当个别节点宕机时,整个网络可以不间断地运行。

    所以,Keepalived一方面具有配置管理LVS的功能,同时还具有对LVS下面节点进行健康检查的功能,另一方面也可实现系统网络服务的高可用功能。

    Keepalived的三个重要功能
    管理LVS负载均衡软件

    可以说,Keepalived起初是专为解决LVS的问题而诞生的。因此,Keepalived和LVS的关系如夫妻一样,可紧密结合。

    实现对LVS集群节点健康检查

    当LVS集群中某个节点服务器发生故障时,Keepalived服务会自动将失效的节点从正常队列中剔除,并将请求调度到别的正常的节点服务器上,从而保证用户访问不受影响。当故障节点被修复后,Keepalived服务又会自动把它切换回来。

    系统网络服务的高可用功能

    Keepalived可以实现任意两台主机之间,如Master和Backup间的故障转移和自动切换。这个主机是不能停机的业务服务器,如LVS负载均衡、Nginx反向代理服务器等。

    Keepalived高可用功能的简单原理。Mater获得所有资源并对用户提供服务,Backup主机为Master的热备。当Master失效或出现故障时,Backup将自动接管Master主机的所有工作,包括VIP资源;当Master恢复后,自会自动接管回它原来的工作,Backup则同时释放它接管的工作。
    此时,两台主机将恢复到最初启动时各自的原始角色及工作状态。

    Keepalived高可用故障切换转移原理

    Keepalived高可用服务的故障切换转移,是通过VRRP来实现的。

    在Keepalived服务正常运行时,主Master节点会不断向备用结点发送(多播方式)心跳信息,用以告诉Backup节点自己还活着。
    当Master节点发生故障时,就无法发送心跳信息,Backup节点也就无法检测到来自Master的心跳信息,于是调用自身的接管程序,接管Master的IP资源和服务;
    当Master恢复时,Backup又会释放Master故障时自身接管的IP资源和服务,恢复到原来的备用角色。

    VRRP(Virtual Router Redundancy Protocol)虚拟路由协议,为了解决静态路由的单点故障问题,VRRP通过一种竞选机制来将路由的任务交给某台VRRP路由器。
    VRRP早期是用来解决交换机、路由器等设备单点故障。交互、路由的Master和Backup的切换原理同样适用于Keepalived的工作原理。
    在一组VRRP路由器集群中,有多台物理VRRP路由器,但并不是同时工作,而是由一台Master的机器负责路由工作,其他机器都是Backup。Master并不是一成不变,VRRP会让每个VRRP路由参与竞选,最终获胜的就是Master。获胜的Master有一些特权,比如拥有虚拟路由器的IP地址等。
    拥有系统资源的Master负责转发发送给网关地址的包和响应ARP请求。

    VRRP通过竞选机制来实现虚拟路由器的功能,所有的协议报文都是通过IP多播(Multicast)包形式来发送,默认多播地址224.0.0.18。在一组虚拟路由器中,不管谁是 Master,对外都是相同的MAC和IP,称之为VIP。客户端主机并不需要因Master的改变而修改自己的路由配置。对他们来说,这种切换时透明的。

    在一组虚拟路由器中,只有作为Master的VRRP路由器会一直发送VRRP广播包,此时Backup不会抢占Master。当Master不可用时,Backup就收不到来自Master的广播包了,此时多台Backup中优先级最高的路由器会抢占为Master。
    这种抢占非常快速,以保证服务的连续性。处于安全性考虑,VRRP数据报使用了加密协议进行加密。

    Keepalived挂掉后,VIP实现了自动漂移切换。因此,仅适合两台服务器提供的服务均开启的应用场景,这也是工作中常用的高可用解决方案。

    Keepalived高可用服务的裂脑问题

    什么是裂脑

    由于某些原因,导致两台高可用服务器在指定时间内,无法检测到对方的心跳消息,各自取得资源及服务的所有权,而此时的两台高可用服务器对都还活着并正常运行,这样就会导致同一个ip或服务在两端同时存在而发生冲突。
    最严重的是两台主机占用同一个VIP地址,当用户写入数据时可能会分别写入到两端,这可能会导致服务器两端的数据不一致或造成数据丢失,这种情况被称为裂脑。

    裂脑发生的原因

    一般来说,有以下几种原因:

    • 高可用服务器对之间心跳线路发生故障,导致无法正常通信;
    • 高可用服务器上开启了防火墙阻挡了心跳信息传输;
    • 高可用服务器网卡等信息配置不正确,导致心跳信息发送失败;
    • 其他服务配置不当,如vrrp实例的virtual_router_id不一致;
    解决裂脑常见方案
    • 保证通信线路完整;
    • 当检测到裂脑时强行关闭一个心跳节点;
    • 做好多裂脑的监控报警,发生问题时及时解决;
    • 如果有防火墙,要让心跳信息通过;
    解决多组Keepalived服务器在同一个局域网的冲突问题

    当在同一个局域网内部部署了多组Keepalived服务器对,而又未使用专门的心跳线通信时,可能会发生高可用接管的严重故障问题。
    Keepalived高可用是通过VRRP协议来实现的,VRRP协议默认通过IP多播的形式实现高可用对之间的通信。多组Keepalived服务器对会造成IP多播地址冲突问题,导致接管错乱,不同组的Keepalived都是使用默认的 224.0.0.18 作为多播地址。
    此时解决办法是,在同组的Keepalived服务器所有的配置文件里指定独一无二的多播地址。
    不同实例的通信认证密码也最好不同,以确保接管正确。

    指定Keepalived日志

    默认情况下,Keepalived服务的日志会输出到 /var/log/messages ,和其他日志混杂在一起,很不方便。

    开发检查Keepalived脑裂的脚本

    思路:在备节点上执行脚本,如果可以ping通主节点,并且备节点有VIP就报警,让人员介入检查。

    展开全文
  • 最近,在学习使用elasticsearch,启动elasticsearch后,过一段时间自己掉,由于刚接触elasticsearch,一脸懵逼。发现前台页面怎么就加载不出来查询结果,以为是后台逻辑代码写错了,捣鼓一上午,原来是elastic...

    发现问题

    最近,在学习使用elasticsearch,启动elasticsearch后,过一段时间会自己挂掉,由于刚接触elasticsearch,一脸懵逼。发现前台页面怎么就加载不出来查询结果,以为是后台逻辑代码写错了,捣鼓一上午,原来是elasticsearch自己挂掉了。

    解决方案

    1. 可能是内存不够,

    2. 编辑jvm.options文件 我的放在了/usr/local/server/elasticsearch/config

      [root@999 config]# vim jvm.options 
      
    3. 修改占用内存

       -Xms256m
       -Xmx256m
      

    在这里插入图片描述

    1. 启动时添加守护进程

       [root@999 bin]# ./elasticsearch -d
      

    效果如下在这里插入图片描述
    完美解决,妈妈再也不用担心我的学习了😂😂

    展开全文
  • 去年服务器遇到被比特币勒索的病毒,可以看下这篇: 《ElasticSearch安全问题不容忽视,被黑客勒索0.1个比特币》 现在服务器又遇到被挖矿程序植入的病毒,下面就来...今天,看着自己的网站出现504,应该就是了...
  • 带宽是对云服务器价格的影响也很大,它对访问速度和运行速度有很大的...数据中心可能有几万,几十万台服务器,如果都能很高的宽带,可能把网络设备弄,反正要投入的成本很高的。4、许多网站,应用,其实用不了很
  • 服务器

    2011-03-04 00:27:45
     尽管很想说“重现Bug很重要”,但我还是对你鸡蛋里挑骨头的才智心怀敬畏,我这儿正忙你准备庆功呢!  9. “不,我不知道我在用什么浏览器。”  我最近用HTML5写了一个尖端AJAX应用程序,它能让iPhone、...
  • 为什么会出现程序运行时掉的情况呢? 刚接触mqttclient,请多指教!问题大致出在哪?修改大致思路是? 我想达到的效果是:1.程序初启动时,即使mqtt服务器连接不上&#...
  • 如今不少游戏玩家和游戏工作室都使用模拟器来进行游戏,为什么会这样呢?随着移动设备的大规模普及,游戏也通过电脑游戏向移动端手游市场进军,而这也进一步促进了游戏模拟器的发展,如今通过电脑运行手机模拟器玩手...
  • 以爬虫例,爬虫在采集数据的时候经常被封IP。这时候就挂机精灵就正好派上用场。当爬虫IP被封之后,通过在拨号服务器重新拨号就能更换IP,绕开IP限制。并且不用重启服务器,在线即可完成IP切换操作。 平常我们...
  • adsl拨号 服务器 又叫...以爬虫例,爬虫在采集数据的时候经常被封IP。这时候就云立方拨号服务器就正好派上用场。当爬虫IP被封之后,通过在拨号服务器重新拨号就能更换IP,绕开IP限制。并且不用重启服务器,在线即
  • ![图片说明](https://img-ask.csdn.net/upload/201610/28/1477636164_149578.png) 然后服务器应用程序日志中记录的是:failed to process request。为什么处理请求失败?大神帮帮忙
  • 关于LVS+Nginx为什么会被同时使用的思考 版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/BuquTianya/article/details/52076153最初的理解(也可以每个nginx都在上所有的应用服务器)...
  • 一、为什么要SESSION入库 SESSION默认的存储媒介是文件,php.ini中的session.sava.handler选项。当SESSION文件较多时,通过文件系统的操作SESSION数据,产生访问速度瓶颈问题。 SESSION数据被系统序列化存储在...
  • 周日,公司CTO给我打电话说,监控系统的数据从下午1点就不更新了。我登录服务器排除了数据同步问题,... Spring定时任务为什么会被阻塞呢?  原因:  周一中午,我在进行接口状态监控测试时发现,接口状态查
  • (也可以每个nginx都在上所有的应用服务器)nginx大家都在用,估计也很熟悉了,在做负载均衡时很好用,安装简单、配置简单、相关材料也特别多。 lvs是国内的章文嵩博士的大作,比nginx被广泛接受还要早7年,并且...
  • 服务器相关知识

    2021-06-07 17:08:39
    为什么程序都需要一个自己的服务器 你作为一个程序员,必须要发布自己的网站和项目! 练习Linux操作 自己的远程仓库,远程数据库,远程tomcat。。。搭建在服务器上 练习,Linux进行任意的环境部署操作!Windown下...
  • 服务器的购买和宝塔面板的使用

    万次阅读 2021-01-16 14:11:45
    为什么程序员都需要一个自己的服务器 1、作为一个程序员,必须要发布自己的网站和项目 2、练习Linux操作 3、自己的远程仓库、远程数据库、远程tomcat…搭建在服务器上 4、练习,Linux进行任意的环境部署操作 服务器...
  • 阿里云服务器购买

    2021-03-02 17:39:45
    为什么程序员都需要一个自己的服务器? 1、作为一个程序员,必须要发布自己的网站和项目 2、练习Linux操作 3、自己的远程仓库、远程数据库、远程tomcat…搭建在服务器上 4、练习,Linux进行任意的环境部署操作 ...
  • 1、什么是雪崩问题? 为了加快网站访问速度,...假如一个网站的并发性很高,这一瞬间的访问量可能也很高,而数据库是非常脆弱的,对数据库过高的访问请求数可能导致数据库直接掉,造成服务器瘫痪,这就是缓存失...
  • 12-服务器的几种异常

    千次阅读 2018-09-16 20:46:42
      所谓服务器崩溃就是服务器挂了,导致网络断开,那么当服务器崩溃时发生什么?   为了模拟这种情况我们需要在不同机器上启动服务器和客户端,先启动服务器,再启动客户端,在客户端输入hello以确认连接正常...
  • Activemq搭建集群共3台服务器分别为A,B,C,当A为Master时,并往A发消息,由于没有及时去消费,当A了,并B选举为Master时,之前发给A的消息全部丢失了,为什么配置了LevelDB高可用,消息还是丢失了? Queue和...
  • 为什么程序员都需要一个自己的服务器? 1、作为一个程序员,必须要发布自己的网站和项目 2、练习Linux操作 3、自己的远程仓库、远程数据库、远程tomcat…搭建在服务器上 4、练习,Linux进行任意的环境部署操作 ...
  • Redis服务器集群搭建

    2019-06-12 15:24:14
    为什么要有集群? 一主可以多从,如果同时的访问量过大(1000w),主服务肯定就会挂掉,数据服务就挂掉了或者发生自然灾难 大公司都会有很多的服务器(华东地区、华南地区、华中地区、华北地区、西北地区、西南地区、...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 382
精华内容 152
关键字:

服务器为什么会挂