【转载】vSAN其实很简单-更换磁盘可以是件美丽的事情

发布时间 2023-07-24 11:52:42作者: .dier

vSAN其实很简单-更换磁盘可以是件美丽的事情-连载(1)

 

 日常的IT维护中,磁盘故障是最常见的硬件故障之一了。根据vSAN的设计,vSAN在检测到磁盘故障后会自动在其他可用节点上重建数据(具体机制以后再细说)。我曾经遇到过有些用户的磁盘已经坏了几个月却没有发觉出来,因为vSAN已经默默的在后端重建好了数据,而且用户也没有定期检查vSAN健康检查的习惯... 但是无论怎样,故障的磁盘总要更换的,那么如何“优美”的更换vSAN磁盘也是一件颇有学问的事情。

 

大概分为几个方面来说吧:

  • vSAN磁盘组的组成

  • 常见故障场景

  • 图形界面更换容量层磁盘

  • 图形界面更换缓存层磁盘

  • 命令行更换容量层磁盘

  • 命令行更换缓存层磁盘

  • 常见问题

  • 参考文档

 

篇幅有限,所以这次先说前4点。

 

vSAN磁盘组的组成

=================

    每个vSAN主机可以支持最多5个磁盘组,每个磁盘组包括1个缓存层磁盘,以及最少1个最多7个容量层磁盘。

 

常见故障场景

=================

  • 缓存层磁盘故障:整个磁盘组都无法使用,这个磁盘组数据会进行重建

  • 容量层磁盘故障:故障磁盘无法使用,该磁盘数据会进行重建

  • 开启了去重压缩模式的缓存层磁盘或者容量层磁盘故障:整个磁盘组都无法使用,这个磁盘组数据会进行重建

 

图形界面更换容量层磁盘

====================

    在vSAN6.0以后的版本,vSAN支持把单独的磁盘或者磁盘组上面的数据迁移出去,所以就不再用把整个主机进入到维护模式了。

 

(1)选择“vSAN集群”-配置-磁盘管理-故障的容量层磁盘

(2)点击“从磁盘组中移除所选磁盘”

(3)出现对话框选择数据迁移模式

 

    VMware官方建议选择“全部数据迁移”。实际情况中如果是故障磁盘更换,因为磁盘已经损坏,多数情况下数据是无法被迁移的。因此在确保数据完整的前提下,我个人更喜欢选择“确保数据可访问性”或者“不迁移数据”。如果你不确定数据的状态,强烈建议联系VMware售后部门进行确认。

(4)等待移除动作执行完成。

(5)更换物理磁盘(如果使用Raid模式的话,还需要在底层创建Raid)

(6)确保主机可以正常识别到新加入的磁盘(绝大多数情况下重新扫描即可,少数情况下需要重启主机)

(7)点击主机-配置-存储设备,确认新插入的磁盘正确的标示为HDD或SSD

(8)选择“vSAN集群”-配置-磁盘管理-目标磁盘组,点击添加磁盘

(9)选择新加入的磁盘

(10)确认磁盘正常添加完成

 

图形界面更换缓存层磁盘

=====================

    更换缓存层磁盘的方法与更换容量层磁盘的方法基本一致,有以下几个注意点:

(1)移除的缓存层磁盘时会提示整个磁盘组的数据也会被移除。

(2)移除磁盘组的比移除单个容量磁盘需要的时间要长,所以请耐心等待

(3)更换缓存层磁盘后也需要去确认新插入的磁盘是否正确被标示为SSD

(4)新建磁盘组后可以手工触发磁盘平衡,来确保新建磁盘组与其他磁盘组空间使用率基本一致。

 

vSAN其实很简单-更换磁盘可以是件美丽的事情-连载(2)

 

在上一篇文章中介绍了vSAN磁盘组的组成、常见故障以及如何通过图形界面对vSAN磁盘进行维护,这次来聊聊其余的内容

 

  • vSAN磁盘组的组成

  • 常见故障场景

  • 图形界面更换容量层磁盘

  • 图形界面更换缓存层磁盘

  • 命令行更换容量层磁盘

  • 命令行更换缓存层磁盘

  • 常见问题

  • 参考文档

 

 

检查vSAN磁盘状态

======================

我们可以通过下述命令来检查vSAN节点上vSAN磁盘的状态:

esxcli vsan storage list

(一共有3个磁盘,包括1个SSD和2个HDD)

 

需要关注几个内容:

Device:  磁盘的唯一标识符,这里是NAA ID

IS SSD:  True (固态硬盘)/ False(机械硬盘)

vSAN UUID: 该磁盘在vSAN集群中唯一的标识符UUID

vSAN Disk Group UUID: 所在磁盘组的UUID,每个磁盘组的唯一的识别符

vSAN Disk Name UUID: 所在磁盘组的名称,磁盘组中缓存层SSD的NAA ID 

In CMMDS:是否正常挂载,如果磁盘故障的话这个状态为false

 

或者使用 vdq -iq 这个命令来获取磁盘组信息: 

    

 

 

命令行移除容量层磁盘

======================

例如:

我们要移除容量层机械硬盘 naa.6000c2906a53576a86da43a909cdfd0d

 

(1)使用下述命令进行移除:

esxcli vsan storage remove -d  naa.6000c2906a53576a86da43a909cdfd0d -m ensureObjectAccessibility

 

-d: 指定容量层磁盘的NAA ID

-m: 数据迁移模式 默认为 noAction

ensureObjectAccessibility 确保数据可访问性

evacuateAllData 迁移所有数据

noAction 不迁移数据

 

(2)检查是否移除成功:

(删除了一个HDD后,这个磁盘组只剩下1个SSD和1个HDD)

 

注意:

    磁盘组中最后一块容量层磁盘是无法通过这个命令删除的。

 

命令行移除缓存层磁盘(磁盘组)

======================

esxcli vsan storage remove -s  naa.6000c29d2d88a3e5299d1730bb2a2fa4

或者

esxcli vsan storage remove -u  磁盘组UUID 

 

(这时磁盘组就已经删除了)

 

命令行创建磁盘组

======================

esxcli vsan storage add -s naa.6000c29d2d88a3e5299d1730bb2a2fa4 -d naa.6000c299907ede4394c49841b438316c

-s 缓存层SSD NAAID

-d 容量层磁盘 NAAID

(新建的磁盘组中包括一个SSD一个HDD一共两个磁盘)

 

命令行添加容量层磁盘

======================

向现有的磁盘组中添加容量层磁 naa.6000c2906a53576a86da43a909cdfd0d 也使用同样的命令

esxcli vsan storage add  -s naa.6000c29d2d88a3e5299d1730bb2a2fa4 -d  naa.6000c2906a53576a86da43a909cdfd0d

 

-s 现有磁盘组的缓存层SSD UUID

-d 容量层磁盘 NAAID

 

(这个磁盘组中包括一个SSD两个HDD一共三个磁盘)

 

常见问题:

==========================

有时候新加入的磁盘包含有一些原来的分区信息会导致无法加入新的磁盘组

解决方法是通过图形界面或者命令行清除分区

 

  1. 如果更换磁盘前没有从磁盘组中移除磁盘会发生什么事情?

    有可能会出现主机残留原磁盘的信息,导致无法添加磁盘的问题

     

  2. 还有什么情况会导致磁盘无法添加到现有磁盘组?

  3. 进行操作前如何确认数据的健康状态?(非常非常非常重要)

    选择“vSAN集群”-监控-vSAN-运行状况-数据

     

  4. 是否有命令可以挂载/卸载磁盘或者磁盘组

有些情况下,我们需要挂载/卸载某个特定的磁盘或者整个磁盘组,命令如下:

  • 卸载容量层磁盘: 

esxcli vsan storage diskgroup unmount -d naa.6000c2906a53576a86da43a909cdfd0d

-d 容量层磁盘UUID

(该容量层磁盘的In CMMDS状态为false)

 

  • 挂载容量层磁盘: 

esxcli vsan storage diskgroup mount -d naa.6000c2906a53576a86da43a909cdfd0d

 

  • 卸载磁盘组: 

esxcli vsan storage diskgroup unmount -s naa.6000c29d2d88a3e5299d1730bb2a2fa4

-s 缓存层SSD的UUID

(所有磁盘的In CMMDS状态均为false)

 

  • 挂载磁盘组:  

esxcli vsan storage diskgroup mount -s naa.6000c29d2d88a3e5299d1730bb2a2fa4

或者

esxcli vsan storage diskgroup mount -u 52988507-9289-7fd8-b8b0-c787bce09fc7    

-s 缓存层SSD的UUID

-u 磁盘组的UUID

 

参考文档:

==========================

How to manually remove and recreate a vSAN disk group using esxcli (2150567)

https://pubs.vmware.com/vsphere-6-5/index.jsp?topic=%2Fcom.vmware.vcli.ref.doc%2Fesxcli_vsan.html

https://blogs.vmware.com/storage/2014/12/02/vmware-virtual-san-operations-replacing-disk-devices/

https://blogs.vmware.com/virtualblocks/2016/02/18/choosing-the-correct-vsan-maintenance-mode-option/

转载自:https://blog.csdn.net/z136370204/article/details/97810307