VMware vSphere

5.1

Clustering Deepdive

 

HA.DRS.Storage DRS.Stretched Clusters

 

Duncan Epping &Frank Denneman

Translate By Tim2009 / 翻译:Tim2009

 

目录

版权

关于作者

知识点

前言

第一部分 vSphere高可用性

第二部分 vSphere DRS(分布式资源调度)

第一章 vSphere DRS介绍

第三部分 vSphere存储DRS

第四部分 群集架构的扩展

 

第二部分 vSphere DRS(分布式资源调度)

第一章 vSphere DRS介绍

VMware vSphere 分布式资源调度(DRS)是运行在VMware vCenter服务器(vCenter)上的基础设施服务,DRS聚合群集中ESXi主机资源,通过监控利用率,自动分配这些资源给虚拟机,并能够跨ESXi主机不断进行虚拟机资源优化。

DRS基于静态资源配置、动态资源利用率和动态资源争用级别来为虚拟机计算资源。

DRS利用vMotion,以满足虚拟机在群集中的可用资源配额,vMotion将虚拟机迁移到有更多可用资源的ESXi主机上来平衡利用率,DRS也可以使用vMotion进行分散资源整理,使得虚拟机有更多的资源利用。

基本设计原则

我们建议启动DRS来提高整合率

群集资源管理级别

群集组ESXi主机的各种资源,把他们当做一个资源池。DRS聚合这些资源,对于虚拟机来说相当于一个大的主机,资源池允许DRS群集中所有的主机创建资源池和应用资源分配策略。还有一点也许不必要指出,尽管资源被DRS池化但是虚拟机资源使用量不能超过其主机资源,DRS依赖本地主机的资源调度来分配资源,除了资源池和资源分配策略,DRS提供了以下资源管理功能。

初始放置位置:当群集内虚拟机开启电源,DRS放置虚拟机到合适的主机上,或根据自动化级别提示建议。

负载均衡:DRS分配群集内ESXi主机上虚拟机的工作负载,DRS持续健康活动的工作负载和可用资源,DRS对比监控结果来完成理想的资源执行和分配,或者建议虚拟机进行迁移,以确保工作负载获得该得到资源,也就是为了性能最大化的目标。

电源管理: 当启用分布式电源管理(DPM),DRS会对比群集级别和主机级别的容量和虚拟机的需求,包括最近的历史需求,历史位置或者如果检测到产能过剩,推荐ESXi主机在待机模式下,或者需要更多的资源,推荐开启ESXi主机。

群集维护模式:DRS评估一组主机,可以将它们置于维护模式,同时也能加快VMware Update Manager的修复过程。当确定哪些主机进入维护模式的同时,DRS也将考虑HA,DPM,FT(Fault Tolerance),vMotion等的兼容性等因素。

规则修订:当主机进入维护模式或者待机模式,DRS会撤离用户请求重新分配虚拟机到ESXi,主机,迁移虚拟机时需要坚持用户定义的关联或者反关联规则。

支持代理虚拟机:代理虚拟机是一台用来根据需求,在每个主机上被配置和激活的虚拟机,属于ESX代理管理工具的解决方案,DRS和DPM完全支持ESX代理和遵从ESX代理虚拟机的要求,DRS和DPM理解如下:

  • 即使虚拟机不通电,代理虚拟机预留规则仍要遵从

  • 主机进入维护模式或待机模式,代理虚拟机不会被撤出

  • 在虚拟机完成迁移或者主机上开启之前,代理虚拟机必须可用

需求

为了DRS正常工作,虚拟基础环境需要满足以下要求:

  • ESXi在一个群集中

  • VMware vCenter Server

  • VMware vSphere Enterprise或者Enterprise Plus License

  • 满足vMotion需求(不强制要求,但强烈建议)

  • 群集内ESXi主机都能访问共享存储

  • 私有迁移网络

  • 千兆网络

  • CPU兼容性

DRS允许自动负载均衡,vMotion是必需的,如果设置了初始位置,vMotion就不是必需的

基本设计原则

配置vMotion将充分从DRS中受益。

DRS群集设置

当群集里开启DRS功能,您需要选择自动化级别和设置迁移临界值,当群集在使用时可以手工配置DRS,且不会对提供服务有影响,接下来的步骤将向您展示怎样创建群集开启DRS:

1. 选择登陆到vCenter视图

2. 选择群集

3. 在图46中我们选择建立新的群集

4. 给新群集一个合适的名称,我们建议名称中包含群集的本地位置和序号信息,如ams-hadrs-001

5. 选择位置

6. 选择开启DRS,点击下一步

7. 设置自动级别为全自动

 

1. 迁移临界值保持默认,点击OK

2. 选择合适的EVC模式(图47)

图46:新建群集

图47:DRS选项扩展

 

请注意,在选择群集的位置之前无法选择EVC模式。

自动级别

自动级别决定了DRS的自动响应级别,包括位置生成和负载均衡,建议选择默认值。

手工:DRS为每台虚拟机产生初始的所在位置建议,如果群集资源不均衡,DRS会产生迁移的建议,通过群集的DRS选项提示给管理员,管理员必须手工逐个接受建议。

半自动: 当虚拟机开启,DRS自动安排虚拟机到合适的主机上,如果群集资源不均衡,通过群集的DRS选项提示管理员需要进行迁移,管理员也必须手工逐个接受建议。

全自动:当虚拟机开启,DRS自动安排虚拟机到合适的主机上,如果群集资源不均衡,DRS自动迁移虚拟机到合适的主机上。

表6:DRS自动级别

初始位置

当虚拟机开启或者重新启动,就会产生其初始的位置,因为缺少历史性能数据,DRS会假定虚拟机资源使用为100%,将选择可以承载该虚拟机的ESXi主机,在初始选择位置期间,DRS将收集当前虚拟机的需求,计算每个主机的容量。

例如,如果一个4vCPU的虚拟机,在一个包含不同类型主机的群集中开启,假设群集内由一个4核的主机和一个8核的主机组成,在初始选择位置时,根据当前虚拟机的活动负载, 8核的ESXi主机貌似会是个不错的候选,但是,比较群集内其它ESXi主机的负载需求之和。

DRS可能会选择4核的ESXi主机作为初始位置。

如果群集配置的手工级别,DRS会建立一个优先级的清单,来为虚拟机推荐初始位置的主机,这个清单用来帮助用户选择合适的主机。

自动级别的影响

当选择手动级别或者半自动级别,用户必须手工接受来自DRS的建议,DRS每间隔5分钟检测群集的状态,如果群集中出现资源计算不均衡,将提示建议操作。因此,管理员应该在每个DRS提示解决群集资源使用不均衡时,检测核对建议。除了效率比较低以外,管理员频繁的接收建议可能会与DRS的规则相冲突。DRS的规则将在15章节的“规则”部分进行解释。

改变群集的DRS自动级别不会使虚拟机变得混乱,并且很容易更改,所以为什么不试下全自动级别,也许会适合你。

基本设计原则

设置全自动的级别的DRS功能会更受益。

vCenter sizing

在DRS调整资源利用率时,也必须要考虑vCenter 服务器的规格和群集的设计。

为了确保vCenter的性能,一定要提供足够的CPU数/核数和内存,技术白皮书上写到:“VMware vCenter服务器性能和最佳实践”清单上列出了在三种场景下推荐最低硬件配置,范围分别为50台主机、500虚拟机到1000台主机、10 000开启的虚拟机。

群集数量

群集上较少的虚拟机会减少负载值,为了DRS的性能,少量的虚拟机应放到群集主机较少的主机上,但是,潜在的问题是创造太多的小群集,200主机3个群集代替100主机6个群集会提高vCenter服务器的CPU利用率,就像每个群集5分钟一次的负载平衡检测也会提高CPU利用率,所以无论什么决定,请考虑vCenter的规格。

DRS群集配置

群集的规格,负载类型的组合,虚拟机的管理,虚拟机的数量,所有这些都可以影响到vCenter的行为和性能,因此也影响到DRS的线程,这些执行的不给力也同样影响了虚拟机的性能或者为了满足负载均衡而生成迁移提示,

注意

DRS本身并不执行迁移,这些都是由vCenter来处理,在迁移的过程中DRS也能运行。

每群集DRS线程

每个群集中vCenter会建立和运行一个DRS线程,DRS线程与群集内每台ESXi主机的管理代理(VPXA)进行通信。

图48:DRS线程组件

默认情况下,负载均衡的计算线程每五分钟一次,计算群集的不平衡资源,应用资源设置,如果需要,生成迁移建议,在实践中,该线程可能更频繁的被调用,例如,如果检测

群集的资源池结构、操作和事件发生改变,DRS将被调用改变资源供应和资源设置。

表7:事件调用DRS计算

DRS事件和统计

群集的每台ESXi主机运行着vCenter的代理(VPXA),ESXi主机和vCenter之间实现双向通信,VPXA保持ESXi主机和虚拟机的状态同步,并显示在vCenter界面上

当虚拟机电源状态发生改变或者虚拟机触发vMotion正在迁移,VPXA就会发送信息给vCenter,每隔一段时间,VPXA还会发送额外的通知和统计信息给vCenter服务器,DRS会发送信息和ESXi主机,例如迁移的意图和信息请求。

在虚拟桌面环境(VDI)中vCenter 服务器会体验更多数量的虚拟机和更频繁的虚拟机电源状态改变,导致更频繁的DRS线程调用。

从服务器虚拟化(VSI)中分离桌面虚拟化(VDI)

在大型的网络环境中,我们建议分开虚拟桌面的负载和虚拟服务器的负载,分配不同的群集不同的工作量以减少DRS的调用次数,从虚拟桌面的负载中隔离虚拟服务器负载,这样只有虚拟桌面的群集会增加DRS的调用,但减少了总体开销和复杂性以及DRS的计算。

基本设计原则

分开虚拟桌面和虚拟服务器的负载,安排它们到不同的群集以减少DRS调用

群集规格

一般的原则是,群集内尽可能多的主机,这样DRS就有更多的机会安排虚拟机的初始位置。在vSphere 5.0中群集最大支持32台主机,警告相对于vSphere 4.0没有增加更多的主机数量,vSphere 5.0的群集是有能力运行更多的虚拟机,因为每虚拟机支持更多的vCPU和内存,预计当设计群集时DRS不会成为限制因素,但是,下面的情况会影响DRS群集和虚拟机的规格。

群集内主机规格与虚拟机的最大数量

vSphere 5.0中,群集内最多运行4000个虚拟机,当前ESXi服务器的配置较多能运行512台虚拟机,当研究规模和扩展性时应考虑其最大值。

虚拟机的数量与LUN的数量

vSphere 5允许每个ESXi 5的主机连接256个LUN,如果主机连接了同一个VMFS的数据存储,DRS仅考虑虚拟机迁移时主机的兼容性,群集中所有的主机连接同样的VMFS数据存储是最佳的做法,如果有超过256个VMFS数据存储需要连接,考虑它们的规格使用多个群集。

硬件配置-异构或者同构

异构的主机配置会影响DRS的效率,如果物理主机无法运行虚拟机,DRS不会迁移虚拟机到它上面,通过EVC,在开启DRS的群集中能有更多的不同硬件的主机存在,并允许旧的硬件和新的硬件混用,虽然我们建议启用EVC,我们同时也建议混合硬件的配置不要差异太大。

例如,vSphere 5.0及以上的版本最多允许分配虚拟机32vCPU和1TB的内存,我们希望看到虚拟架构中增加更多数量的高配置的虚拟机,而高配置的虚拟机12vCPU或16vCPU不能被托管在两个四核的系统上。

DRS是一个简单的群集解决方案,它将让您达到更高的整合率,同时提供更佳的资源利用率。了解DRS的架构将能够更好的设计vCenter和DRS群集,同时提供更佳的性能和尽可能的高效,接下来的章节我们将讨论资源管理的基本概念,我们还将讨论关键的地方确保你以合理的方式配置DRS,以使它符合您的需求或者符合客户的环境。