2017-09-18 18:58:35 zd199218 阅读数 387

今天遇到一个已删除文件占用磁盘的情况,这里记录简单的分析和处理流程

背景:

1、接收到磁盘告警后,用df -h查看,磁盘的使用率是93%。
2、使用du -h --max-depth=1查看高负载磁盘时,各文件占用都不是很高。

问题:

df和du的执行结果不一致,无法定位到大文件路径并清理文件

问题分析:

初步怀疑有进程占用已经被删除的大文件,导致文件无法被释放

具体原因:

Linux下的文件,只有在引用数为0的情况下才会真正被删除掉,之前所占用的空间是不会被释放的。
如果存在文件引用,系统会将该文件标记为已删除,在引用此文件的进程都关闭时(文件引用数为0时),最终删除文件,释放空间资源。

解决方案:

1、【找出被删除的占用文件】lsof -n | grep grep deleted
2、【释放被占用空间】使用kill pidkill -9 pid杀掉进程后,再重启服务

总结:

这里可以看出,df和du的执行结果是有区别的,那这两个命令的执行流程如何?是什么导致输出结果不同,【Linux-运维】df和du的命令区分

2019-02-14 09:26:28 Leftmumu 阅读数 110

在Linux中,当我们使用rm在linux上删除了大文件,但是如果有进程打开了这个大文件,却没有关闭这个文件的句柄,那么linux内核还是不会释放这个文件的磁盘空间,最后造成磁盘空间占用100%,整个系统无法正常运行。这种情况下,通过df和du命令查找的磁盘空间,两者是无法匹配的,可能df显示磁盘100%,而du查找目录的磁盘容量占用却很小。


遇到这种情况,基本可以断定是某些大文件被某些程序占用了,并且这些大文件已经被删除了,但是对应的文件句柄没有被某些程序关闭,造成内核无法收回这些文件占用的空间。


那么,如何查找那些文件被某些程序占用呢:


lsof -n | grep deleted
COMMAND     PID      USER   FD      TYPE             DEVICE        SIZE       NODE NAME
dd        31708      higkoo    1w      REG                8,2 5523705856     429590 /data/filetest (deleted)
命令:lsof -n | grep deleted打印出所有针对已删除文件的读写操作,这类操作是无效的,也正是磁盘空间莫名消失的根本原因。
解决办法:kill -9 PID   —-只需把进程删掉就能释放空间。

 

lsof -n |grep deleted |awk -F’ ‘ ‘{printf “kill -9 %s\n”, $2}’ > freedisk.sh

原文:http://www.androidstar.cn/处理linux系统下已删除文件继续占用空间问题/

2015-12-23 09:58:53 Meiyang1990 阅读数 1810

      前些天,我们系统装有mysql服务器的那台机器磁盘使用率达到了92% ,顿时感觉很奇怪,我们那台服务器的磁盘大小为500G,其实我们的数据内容大小怎么的也不会超过20G,为什么会占用这么大的磁盘空间呢?  

      最后,一层一层的查找,发现是我们没有关闭mysql的general_log,也就是这个文件会记录所有的SQL记录,导致这个文件越来越大。然后,我也没有多想,就直接用rm -rf 命令将这个general_log.csv文件删除了。之后用df -hl文件发现磁盘空间使用率竟然还是92% ,百思不得其解。最后,找到了原因。

   

在Linux中,当我们使用rm在linux上删除了大文件,但是如果有进程打开了这个大文件,却没有关闭这个文件的句柄,那么linux内核还是不会释放这个文件的磁盘空间,最后造成磁盘空间占用100%,整个系统无法正常运行。这种情况下,通过df和du命令查找的磁盘空间,两者是无法匹配的,可能df显示磁盘100%,而du查找目录的磁盘容量占用却很小。

遇到这种情况,基本可以断定是某些大文件被某些程序占用了,并且这些大文件已经被删除了,但是对应的文件句柄没有被某些程序关闭,造成内核无法收回这些文件占用的空间。

那么,如何查找那些文件被某些程序占用呢:

使用lsof -n | grep deleted命令可以查找出那些已经删除但是继续占用内存空间的文件。

之后,关掉或者重启占用这些文件的应用程序就可以释放磁盘空间了。


2017-05-02 10:46:22 babymouse1212 阅读数 747

 

问题

文件被删除后,空间没有被释放

 

原因

在Linux或者Unix系统中,通过rm或者文件管理器删除文件将会从文件系统的目录结构上解除链接(unlink).然而如果文件是被打开的(有一个进程正在使用),那么进程将仍然可以读取该文件,磁盘空间也一直被占用。

 

解决方法

 

首先我们获得一个已经被删除但是仍然被应用程序占用的文件列表:

 

$ /usr/sbin/lsof|grep deleted
ora    25575 data   33u      REG              65,65  4294983680   31014933 /oradata/DATAPRE/UNDOTBS009.dbf (deleted)

从lsof的输出中,我们可以发现pid为25575的进程持有着以文件描述号(fd)为33打开的文件/oradata/DATAPRE/UNDOTBS009.dbf。

 

在我们找到了这个文件之后可以通过结束进程的方式来释放被占用的空间。

通过截断proc文件系统中的文件可以强制要求系统回收分配给正在使用的的文件。这是一项高级技术,仅到管理员确定不会对运行中的进程造成影响时使用。应用程序对这种方式支持的并不好,当一个正在使用的文件被截断可能会引发不可预知的问题

$ echo > /proc/pid/fd/fd_number

例如,根据之前lsof的输出:

$ file /proc/25575/fd/33
/proc/25575/fd/33: broken symbolic link to `/oradata/DATAPRE/UNDOTBS009.dbf (deleted)’
$ echo > /proc/25575/fd/33

2019-04-18 18:08:04 fgf00 阅读数 1538

一、现象:

Linux主机:用df -hT 查看磁盘占用已经满了,但是用du -sh * 又找不到是哪些文件目录占满了磁盘。

二、解决,lsof

lsof |grep delete

用lsof检查后才发现原因是,有文件被删除,而进程还活着,因而造成还占用空间的现象。

根据lsof列出的进程号,kill这些进程或重启进程后,空间就释放出来了。重要服务进程pid,注意确认,别发重要服务kill了。

三、总结

  1. 日志文件等,不要多个进程公用同一个文件,这样有的进程下线清理文件,由于其他进程占用,空间不会释放。
  2. 清理一些文件,不要直接 rm -rf,如果进程读取的文件,文件删了由于进程占用,空间不会释放。可以echo > filename 清空文件
没有更多推荐了,返回首页