Linux 磁盘空间满(含inode满)问题排查方法

 每日运维   2022-02-28 17:27   96 人阅读  0 条评论

问题描述

在云服务器ECS Linux系统内创建文件时,出现类似如下空间不足提示:

  1. No space left on device 

问题原因

导致该问题的可能原因包括:

  • 磁盘分区空间使用率达到百分之百。

  • 磁盘分区inode使用率达到百分之百。

  • 僵尸文件:已删除文件因句柄被占用未释放导致相应空间未释放。

  • 挂载点覆盖:在原有文件系统的相应目录下已经存在大量文件。挂载了新磁盘后,导致使用 df 命令能统计到相关空间使用,而使用 su 命令统计不到。

处理办法

不同的原因需要通过不同的方法解决:

分区容量满

如果是分区容量满导致磁盘空间满,按以下步骤操作:

  1. 远程连接Linux实例

  2. 运行 df -h 查看磁盘使用率。返回结果如下图所示。

9d91ffd461331c394d74b0b661a47832_2994b-TB182cUKXXXXXc_XpXXXXXXXXXX.png

循环执行如下指令,找到容量比较大的目录并进入目录,直到找到最精确的文件或目录,再结合业务情况等判断,删除相关文件或目录。您也可以购买更大的数据盘来分担处理。

  1. cd /

  2. du -sh *

a6982140a0d576135d1f8f3d5c3d6ba9_bc7a7-TB1UawSKXXXXXaDXFXXXXXXXXXX.png

inode容量满

如果是inode容量满导致磁盘空间满,按以下步骤操作:

  1. 远程连接Linux实例

  2. 运行以下命令分析根目录下每个目录下面有多少个文件。

    返回结果如下图所示。

    1. for i in /*; do echo $i; find $i | wc -l; done

ebbf28ff48cf9852f03da6d27da83064_9dc04-%E7%A3%81%E7%9B%98%E7%A9%BA%E9%97%B4%E6%BB%A1_inode%E7%A9%BA%E9%97%B4%E6%BB%A1.png

  1. 逐层进入inode占用最高的目录,继续执行上述指令,逐步定位占用过高空间的文件或目录,最后进行相应清理。

修改inode数量

ECS Linux 实例的inode节点中,记录了文件的类型、大小、权限、所有者、文件连接的数目、创建时间与更新时间等重要的信息,还有一个比较重要的内容就是指向数据块的指针。一般情况不需要特殊配置;如果存放文件很多,需要配置。有时磁盘空间有剩余但是不能存放文件,可能是由于inode耗尽所致。

按以下步骤调整inode节点数量:

注意
inode的调整需要重新格式化磁盘,请确保您已经备份了数据再执行以下操作。

  1. 远程连接Linux实例

  2. 运行以下命令查询inode使用情况。

    返回结果如下图所示。

    1. df -i

a741b8b2d7843d1a79e117e0a2519bf3_573b3-%E6%9F%A5%E7%9C%8Binode%E4%BD%BF%E7%94%A8%E6%83%85%E5%86%B5.png

  1. 运行以下命令卸载系统文件。假设卸载的文件系统为 /home。

    1. umount /home

  2. 运行以下命令重新建立文件系统,指定inode节点数。

    1. mkfs.ext3 /dev/xvdb -1638400

  3. (可选)运行命令 vim /etc/fstab 修改fstab文件。

  4. 运行以下命令查看修改后的inode节点数。

    返回结果如下图所示。

    1. dumpe2fs -/dev/xvdb | grep node

061765263d6cff6afe5e3cf42a78d186_7a8e9-TB1F4I1KXXXXXarXpXXXXXXXXXX.png

僵尸文件分析删除

如果磁盘和inode都没有问题,则需要查看是否存在未被清除句柄的僵死文件。这些文件实际上已经被删除,但是有服务程序在使用这些文件,导致这些文件一直被占用,无法释放磁盘空间。如果这些文件过多,会占用很大的磁盘空间。

按以下步骤查看并删除僵尸文件:

  1. 远程连接Linux实例

  2. 运行以下命令安装lsof。

    1. yum install lsof -y

  3. 运行以下命令查看僵尸文件占用情况。

    返回结果示例如下图所示。

    1. lsof |grep delete | more

image.png

  1. 采用以下方法释放句柄,以清除僵尸文件:

    • 重启服务器。

    • 正常停止或杀掉占用这些文件的服务进程。

挂载点覆盖

先取消磁盘挂载,再检查原挂载目录下的空间占用情况。









本文地址:https://linux365.cn/post/71.html
版权声明:本文为原创文章,版权归 每日运维 所有,欢迎分享本文,转载请保留出处!
NEXT:已经是最新一篇了

评论已关闭!