Nutanix vSphere平台集群环境下单台主机停机维护

1. 步骤概要

在Nutanix的vSphere集群环境下,如果需要对于单台主机进行计划停机维护,如添加内存,更换故障硬件等等,其维护步骤主要包含:

停机:

  • 检查数据同步状态
  • 迁移虚拟机
  • CVM进入维护模式
  • 主机进入维护模式
  • 关闭CVM
  • 关闭主机

开机:

  • 主机开机
  • 主机退出维护模式
  • CVM开机
  • CVM退出维护模式
  • 检查集群状态
  • 数据同步
  • 虚拟机回迁

2. 操作步骤

2.1      停机步骤

  1. 检查数据同步状态:

在Prism中检查Data Resilience状态,确保集群的数据保持冗余。

  • 迁移虚拟机;

迁移虚拟机的方法可以分为2种,命令行模式或者图形界面模式:

图形界面模式

如果虚拟机数量不多,可以采用图形界面模式,具体步骤为:使用vSphere WEB Clientd登录vCenter,选择需要维护的主机,在右侧的“虚拟机”页面,选择需要迁移的虚拟机(除CVM外的虚拟机)--右键点击迁移—选择需要迁移到的目标主机,根据想到进行迁移。

命令行模式

需要使用VMware PowerCIi进行迁移;

使用PowerCLi登录vCenter

connect-VIserver -server vCenter主机名或者IP -username "administrator@vsphere.local" -password "vCenter的SSO密码"

查看需要维护的主机的虚拟机列表:

get-vmhost  -Name "需要维护的主机的名称或者IP" | get-vm

对虚拟机进行迁移(一次可以同时迁移多个VM,VM的名称用,分开)

move-vm -vm vm1,vm2 -Destination 迁移虚拟机的目标主机IP或者主机名

  • 关闭CVM

关闭维护主机的CVM虚拟机

nutanix@NTNX-J32X62B-A-CVM:15.2.21.244:~$ cvm_shutdown -P now

2017-06-05 21:37:20 INFO cvm_shutdown:72 Setting up storage traffic forwarding

2017-06-05 21:37:20 INFO cvm_shutdown:75 Establishing Zookeeper connection...

2017-06-05 21:37:20 INFO zookeeper_session.py:76 Using host_port_list: zk1:9876,zk2:9876,zk3:9876

2017-06-05 21:37:20 INFO ipv4config.py:800 Discovered network information: hwaddr 52:54:00:18:84:93, address 15.2.21.244, netmask 255.255.255.0, gateway 15.2.21.254

2017-06-05 21:37:20 INFO cvm_shutdown:94 Executing cmd: sudo shutdown -P now

Broadcast message from nutanix@NTNX-J32X62B-A-CVM

        (/dev/pts/0) at 21:37 ...

The system is going down for power off NOW!

  • 将ESXi主机进入维护模式:

在vCenter中右键选择需要维护的主机,选择“维护模式”—“进入维护模式” ,此时主机将进入维护模式

  • 关闭主机

在vCenter中右键选择需要维护的主机,选择“电源”—“关机“,即可关闭主机

2.2      开机步骤:

  1. 维护完成后,开启主机电源;
  2. 主机退出维护模式

在vCenter中右键选择需要退出维护模式的主机,选择“维护模式”—“退出维护模式” ,此时主机将退出维护模式。

  • CVM开机

默认情况下CVM在主机ESXi操作系统开机后自动开启,但是如果主机是进入维护模式后再关机的,将无法自动开启。

在vCenter中选择刚刚退出维护模式的主机,在右侧的“虚拟机”页面,右键选择CVM虚拟机—“启动“—”打开电源“,此时CVM虚拟机开启。

  • 检查集群状态和CVM的Ring的状态

SSH登录到任何一台CVM,执行命令:

  • cluster status: 检查集群的状态。
  • cluster start 如果cluster status查看cvm服务是down,执行拉起服务
  • cluster status | grep -v UP:简要查看每台CVM的状态:
  • nodetool -h 0 ring  检查ring上的CVM节点

如果以上命令的输出包含所有的CVM,则说明CVM启动正常。

  • 数据同步

等待集群进行数据同步,在Prism管理页面主页的Data resilience状态栏中需要显示为绿色的OK(一般时间不长只需要几分钟即可同步完成)。

  • 虚拟机回迁

此时可以将虚拟机回迁回主机,迁移的步骤参见停机步骤中的虚拟机迁移步骤。

点赞
  1. 头像 swz184563861说道:
    Google Chrome Windows 10
    123
  2. 头像 407说道:
    Google Chrome Windows 10
    牛啊阿政

swz184563861进行回复 取消回复

电子邮件地址不会被公开。必填项已用 * 标注