监视

与任何集成系统一样,监视和维护对解决方案的整体运行状况至关重要。如果没有适当的支持、操作和运行状况监视系统,用户体验将逐渐下降。

进程 1:支持

出现问题时,技术支持是第一个联系点。本部分内容介绍应用于维护 Citrix 部署的适当人员配备、组织、培训、委派管理和工具。

决策:支持结构

人们发现,多层次的支持是解决支助问题的最有效的方式。应在较低的支持级别管理和解决低紧迫性、低复杂度或经常出现的问题。高紧迫性和复杂的问题会上报给更有经验的架构师或基础结构所有者。下图概述了一种通用的多级支持结构。

监视器支持结构示意图

如果用户遇到问题,1 级支持(技术支持)是支持系统的切入点。1 级应解决遇到的所有问题的 75%,其中大多数问题都是常规问题,只需要对 Citrix 环境的了解有限。在此级别,问题可以快速解决,有些问题可以自动解决(自助服务),例如密码重置和资源预配。

超出 1 级能力的非常规问题会上报给 2 级(操作员)。此支持级别通常由支持生产型 Citrix 环境的管理员组成。有关最终用户的问题和尝试的故障排除步骤的信息将在第一个级别进行记录,使 2 级技术人员能够立即开始解决问题。2 级技术人员应仅处理 20% 的支持票证,并对 Citrix 环境具有高度了解。

超出 2 级能力的复杂问题应上报给 3 级(实施者)。2 级和 3 级支持可能通常都是 Citrix 支持团队的成员,3 级由负责维护 Citrix 环境的高级工作人员组成。3 级问题非常复杂,往往对任务至关重要,需要具备虚拟桌面和应用程序环境的专门知识。3 级支持票证应不超过所有支持问题的 5%。

最后一个级别即 4 级(架构师)专注于解决方案的战略改进、测试新技术、规划迁移和其他高级别变更。通常情况下,4 级不参与对生产环境的主动支持。

如果支持人员发现与应用程序或底层基础结构有关的问题,该票证将交给相应的团队进行故障排除。如果发现程序缺陷,则会重新上报该问题,并与相应的供应商建立票证。

决策:支持职责和技能组合

下表突出显示了建议的每个支持级别的特性。

支持级别

1 级 - 技术支持

说明

对报告的问题提供一线支持。最初,提供支持消息和电话服务。此级别需要执行初始问题分析、问题定义、票证路由和简单的问题解决。通常通过配置插件处理应用程序访问请求或支持请求。

职责

  • 执行问题定义、初始分析和基本问题解决
  • 执行初始故障排除以确定问题的性质
  • 创建票据、收集用户信息并记录执行的所有故障排除步骤
  • 使用现有知识库文章解决基本的 Citrix 相关问题、连接问题和应用程序相关问题
  • 如果需要高级技能或提升的权限,请将问题上报给 2 级
  • 能够隔离与 Citrix 相关、Microsoft 相关或第三方应用程序相关的问题
  • 如果影响生产环境或可能造成系统级中断,请直接上报给 3 级
  • 根据需要生成其他问题解决指南的请求
  • 在支持票证关闭时与最终用户进行跟进,以确保问题得到满意的解决

技能组合

  • 常规 Citrix XenApp/XenDesktop 知识(CCA、CCA-V)
  • 常规 Windows 客户端操作系统/服务器操作系统知识 (MCP)
  • 常规 Active Directory 知识
  • 常规网络连接知识 (CCNA)

支持级别

2 级(操作员)

说明

主要支持 Citrix 环境的日常操作;可能包括主动监视和管理。此外,此角色还应执行中间级别故障排除并利用可用的监视或故障排除工具。协助解决 1 级支持上报的问题。

职责

  • 执行中间问题分析和解决。
  • 确定问题的根本原因。
  • 响应服务器警报和系统停机。
  • 创建关于问题数量、关闭比率、未解决的问题等的周报。
  • 查看供应商知识库文章。
  • 响应超时技术支持电话。
  • 响应关键监视警报。
  • 生成内部知识库文章和问题解决脚本,并维护 1 级故障排除工作流程。
  • 执行基本的服务器维护和操作程序。
  • 管理用户配置文件和数据。
  • 如果需要高级技能或提升的权限,请将票证上报给 3 级或恰当的技术所有者。
  • 根据需要生成其他问题解决脚本和知识库文章的请求。
  • 能够读取 Windows 和 Citrix 的内置事件日志,以便根据通过 Google/Bing 获取的公共信息执行基本故障排除。

技能组合

Microsoft Windows Server 的经验,包括但不限于:

  • 配置操作系统选项
  • 了解远程桌面服务策略和配置文件
  • 使用 Active Directory
  • 创建/管理用户的权限和管理员权限
  • 创建和修改 Active Directory 组策略

基本管理技能,包括:

  • 了解协议 (TCP)
  • 了解防火墙概念
  • 了解电子邮件管理和帐户创建
  • 了解远程桌面服务策略和配置文件
  • 能够创建共享和授予对共享文件夹/文件的访问权限

执行以下操作的经验:

  • 管理、维护和监视 Citrix 解决方案以及对其进行故障排除
  • 在 Citrix 环境中备份组件
  • 更新 Citrix 环境中的组件
  • 创建趋势分析报告

支持级别

3 级(实施者)

说明

实施、管理和维护 Citrix 桌面和应用程序虚拟化基础结构的中心点。此角色侧重于部署新用例和引领生命周期管理举措。通常情况下,一个实施者可以一次专注于一个用例。例如,三个新的并发用例需要三个实施者。将问题上报给软件供应商特定的技术支持,并通知 4 级有关此问题。

职责

  • 执行高级问题分析和解决。
  • 执行维护和环境升级。
  • 解决高严重性问题和服务中断。
  • 管理 Citrix 环境。
  • 监视和引领 2 级执行的管理任务。
  • 管理与 Citrix 环境相关的网络和存储基础结构(取决于公司或 Citrix 环境的大小)。
  • 查看服务器运行状况、资源使用情况、用户体验和整体环境性能的定期报告。
  • 查看供应商知识库文章和新发布的更新。
  • 执行策略级别的更改并进行 Active Directory 更新。
  • 查看影响 Citrix 环境的更改控制请求。
  • 执行高级服务器和基础结构维护。
  • 查看知识库文章和问题解决方案脚本,了解准确性、合规性和可行性。
  • 创建知识库文章和问题解决方案脚本,以解决 2 级请求。
  • 如有必要,将票证上报给供应商特定的技术支持,并将问题通知 4 级。

技能组合

了解以下 Windows 组件如何与 Citrix 技术集成:

  • Active Directory 域服务
  • Active Directory 证书服务
  • 策略
  • 域名系统 (DNS)
  • 动态主机配置协议 (DHCP)
  • 组策略对象 (GPO)
  • NTFS 权限
  • 身份验证和授权
  • IIS 的知识
  • Microsoft Windows 操作系统:Windows 10、Windows 8.1、Windows 7、Windows Server 2012 R2、Windows Server 2008 R2
  • Windows Server 的角色和功能
  • SQL 2008 R2 及更新版本的知识
  • SQL 群集、镜像和 AlwaysOn 可用性组的知识。
  • 常规网络连接技能(即路由、切换)
  • 虚拟机管理程序知识。
  • 共享存储配置和管理知识。

支持级别

4 级(架构师)

说明

4 级团队很少接触到管理任务,但专注于界定、规划和执行 Citrix 特定的服务和项目请求。架构师将业务要求转化为技术设计。

职责

  • 为即将进行的项目提供技术领域的领先地位。
  • 领导设计更新和架构修订。
  • 解决高严重性的问题和服务中断。
  • 监视技术集成工作流程。
  • 查看服务器运行状况、资源使用情况、用户体验和整体环境性能的定期报告,以确定后续步骤和升级路径。
  • 启动负载测试以确定环境的容量。
  • 查看经常重复出现的技术支持问题。
  • 确保技术规范继续满足业务需求。
  • 更新设计文档。

技能组合

以下对象的高级体系结构评估和设计技能:

  • Citrix XenApp
  • Citrix XenDesktop
  • Citrix XenServer、VMware vSphere、Microsoft Hyper-V
  • Citrix Provisioning Services
  • Citrix NetScaler
  • Citrix StoreFront
  • Active Directory
  • 存储解决方案
  • 网络连接
  • 应用程序交付
  • 灾难恢复
  • 策略结构和安全限制
  • 许可
  • 方法

中级知识:

  • 常规网络连接技能
  • 更改控制过程
  • 项目管理
  • 风险评估

支持级别

供应商支持

说明

如果发现某个程序中的缺陷,则可能需要供应商协助。在此阶段,3 级工程师需要与相应的供应商建立支持票证,以帮助找到解决方案。

支持级别

自助服务

说明

自助服务门户为应该用于非关键任务,例如应用程序访问、权限、密码重置等。门户范围可以从简单的常见问题解答页面到不需要人工交互的完全自动化过程。自助服务门户的目的是为最终用户添加一个额外的接触点,以解决基本问题,从而防止创建新的支持票证。

决策:认证和培训

下表详细介绍了建议的针对每个支持级别的培训、认证和经验。

角色 建议的培训 建议的课程 建议获得的证书 相关经验
技术支持(1 级) 应为 1 级技术支持提供有关 Citrix XenApp、Citrix XenDesktop 和支持技术有关的基本培训。这可能包括由主题专家或 Citrix Authorized Learning Center 提供的内部培训。提供的培训应侧重于以下主题:XenApp 和 XenDesktop 实施的高级别概述。使用 Citrix Director 管理用户会话。对 Citrix XenApp 和 XenDesktop 会话进行故障排除。故障排除方法。此外,应定期向一级团队成员提供培训,介绍 2 级和 3 级团队的最新故障排除建议,以及环境的任何相关变化细节。这将有助于确保整个团队具有良好的基础知识水平和一致的客户服务。 CXD-105:Citrix XenApp 和 XenDesktop 技术支持 不适用 1 年以上(入门级也可接受)
操作员(2 级) 2 级人员应定期举办团队培训课程,以完善管理技能并确保整个团队的基础知识水平。当环境体系结构更新以及 2 级团队使用不熟悉的技术时,正式培训也是必不可少的。2 级团队的所有成员都应获得 Citrix XenApp 和 XenDesktop 的 Citrix 认证管理员 (Citrix Certified Associate, CCA) 认证。对于没有桌面或服务器支持经验的 2 级团队成员来说,有关 Windows 概念的高级培训也是必不可少的。最后,在职培训以及与 3 级管理员密切融合至关重要,因为 2 级角色已经正式确定,职责从 3 级转到 2 级。 CXD-210 XenApp 和 XenDesktop 7.1x 管理 Citrix 认证管理员 - 虚拟化 2-3 年
实施者(3 级) 3 级支持团队成员至少拥有三年的企业实施和支持 XenApp、XenDesktop、Provisioning Services 和 Windows 操作系统的经验。3 级工作人员还应完成 Citrix 认证工程师 (Citrix Certified Professional, CCP) 认证跟踪,因为这将使他们做好准备,以便主动管理用户社区并根据 Citrix 领先实践实施 Citrix 解决方案。 CXD-400:使用 Citrix XenApp 和 XenDesktop 设计应用程序和桌面解决方案,在完成 3 级 CXD-310 之后 Citrix 认证专家 - 虚拟化 3-4 年
建筑师(4 级) 经验对 4 级工作人员至关重要。合格的 4 级资源应至少具有 5 个针对 XenApp 和/或 XenDesktop 环境实施、支持和担任技术架构师角色的经验,以及集成技术(例如应用程序和配置文件管理解决方案)的额外管理经验。理想的候选者将在两个或更多环境中为产品曝光目的服务,并至少在一个拥有 1200 多个并发用户的环境中提供这种服务。Citrix 认证专家 (Citrix Certified Expert, CCE) 认证或类似的培训和经验应成为该角色的必备条件。 CXD-400:使用 Citrix XenApp 和 XenDesktop 设计应用程序和桌面解决方案,在完成 3 级 CXD-310 之后 Citrix 认证专家 - 虚拟化 5 年以上

决策:支持人员

下表提供了关于建议的技术支持人员数量的指导。

角色 小型环境:站点:1;用户:小于 500;映像:1-2 中型环境:站点:1-2;用户:1000-5000;映像:3-5 大型环境:站点:2 个以上;用户:大于 5000;映像:5 个以上
技术支持(1 级) 3 5-10 15-20
操作员(2 级) 1-2 2-3 4-5
实施者(3 级) 1 1-2 2-3
架构师(4 级) 1 1 1-2

注意

下表仅应用作基准。应根据组织的明确要求、预期的工作量和业务流程评价支持人员的配置决策。可以组合多个级别,例如,设计项目可能不足以拥有专门的架构师角色,或者 Citrix 团队中更高级的成员可以担任操作员和实施者。

决策:作业帮手

常规支持工具:下表详细列出了应提供给所有支持级别的工具。

工具 详细信息
票证管理系统 用于记录客户信息和问题。典型的票证管理系统提供以下功能:监视票证队列。设置待解决的票证数量限制。设置阈值,例如某种类型的票证需要多长时间才能获得答复。识别需要更高优先级帮助的一组用户或个人。通知用户何时开立、更新或关闭其票证。为支持专业人员提供内部知识库,以搜索已知已解决的问题。
调用脚本 首次联系的技术支持人员应具有记录的脚本,以确保在用户通话时捕获所有相关数据。这种做法还有助于进行适当的分类,并允许下一个支持级别在客户联系之前进行研究。提供了一个示例调用脚本以供参考。
远程协助工具 远程协助工具在解决用户问题时非常有用。支持技术人员和管理员可以远程观察用户的操作。
知识库 应在知识库或已知问题的库中创建和维护文档。文章应可搜索以便快速恢复。知识库有助于支持人员快速解决已知问题,并减少执行耗时研究的需求。

Citrix 支持工具

下表提供了有关 Citrix 支持工具的建议,这些工具应提供给每个支持级别。

工具

Citrix Director

说明

Citrix Director 提供了托管桌面和应用程序会话的概述。通过 Citrix Director,技术支持团队能够监视和解决问题。

产品

XenDesktop XenApp Provisioning Services 控制台 XenServer
X X    

支持级别

L1 L2 L3 L4
X X X X

工具

Citrix Studio

说明

Citrix Studio 使管理员能够为 XenApp 和 XenDesktop 站点以及关联的虚拟桌面或托管应用程序执行配置和维护任务。

产品

XenDesktop XenApp Provisioning Services 控制台 XenServer
X X    

支持级别

L1 L2 L3 L4
X X X X

工具

Citrix Insights Services

说明

从单个 Citrix Delivery Controller 运行可捕获所选计算机上的关键数据点和 CDF 跟踪信息,然后安全可靠地将数据包上载给 Citrix 技术支持以供上报。

产品

XenDesktop XenApp Provisioning Services 控制台 XenServer
X X X X

支持级别

L1 L2 L3 L4
    X X

工具

Provisioning Services 控制台

说明

Provisioning Services 控制台使管理员能够为 Provisioning Services 场执行配置和维护任务。

产品

XenDesktop XenApp Provisioning Services 控制台 XenServer
    X  

支持级别

L1 L2 L3 L4
    X X

HDX Monitor 是验证用户会话的 Citrix ICA/HDX 堆栈操作的工具。HDX Monitor 提供有关客户端功能、网络性能/活动、会话设置和许多其他项目的信息。

工具

XenCenter

说明

XenCenter 使管理员能够对 XenServer 资源池执行配置和维护任务。

产品

XenDesktop XenApp Provisioning Services 控制台 XenServer
      X

支持级别

L1 L2 L3 L4
    X X

HDX Monitor 是验证用户会话的 Citrix ICA/HDX 堆栈操作的工具。HDX Monitor 提供有关客户端功能、网络性能/活动、会话设置和许多其他项目的信息。

Citrix Insight Services

管理员可以利用 Citrix Insight Services 来简化 Citrix 环境的支持和故障排除过程。Citrix Insight Services 在本地运行,以收集环境信息。联机分析功能分析该信息,并根据其 Citrix 环境和配置为管理员提供建议。有关 Citrix Insight Services 的其他信息可以在以下 Citrix 支持文章中引用:CTX131233 - 常见问题解答:Citrix Insight Services。

Citrix 技术支持为帮助进行故障排除提供的可用工具的完整列表可以在 Citrix 支持包中引用。

调用脚本

以下调用脚本可以用作 Citrix 技术支持团队的初始基准。Citrix Consulting 建议您查看此示例调用指南并添加可能需要收集的任何特定于环境的详细信息。

  1. 用户的名称和位置是什么?此问题将确定用户是否从外部或内部网络位置访问环境。
  2. 此问题始终可重现吗?如果是,请获取确切的重现步骤。此问题对于支持团队解决问题而言非常重要。
  3. 位于该站点/位置的任何其他用户会遇到相同的问题吗?他们是否可以让同事从同一个和/或不同的工作站登录?这些问题有助于确定这是工作站问题还是用户问题。
  4. 用户正在使用何种类型的端点设备?(企业设备、BYOD、瘦客户端、PC、便携式计算机等) 此问题有助于确定问题是否与用户的终端有关。
  5. Citrix Receiver 版本和连接信息是什么?此问题将验证用户是否使用正确版本的 Receiver(最新的 Receiver 版本或公司标准化的版本)。
  6. 用户可以看到 StoreFront 身份验证页面吗?此问题有助于识别网络问题。
  7. 用户尝试使用的应用程序(或虚拟桌面)的名称是什么?用户是否在 StoreFront 站点上看到相应的应用程序或桌面图标?这些问题有助于确定用户访问权限和/或组成员身份是否存在问题。
  8. 选择图标时,应用程序(或桌面)是否启动?应用程序登录屏幕是否显示(如果适用)?这些问题有助于确定是否已连接到 Citrix XenDesktop 基础结构。
  9. 用户可以对应用程序进行身份验证(如果适用)吗?应用程序启动后是否出现问题?此问题有助于确定问题是否与应用程序有关,而不是与应用程序交付基础结构有关。
  10. 看到的具体错误是什么(如果适用)?此问题确定特定的错误。应要求用户提供屏幕截图(如果有)。

决策:委派管理

必须向每个支持级别提供足够的权限,以便有效地发挥其作用。下表提供了关于每个支持级别建议的权限的指导。

XenApp/XenDesktop 委派权限

管理员角色 支持级别
技术支持管理员 1 级
完全权限管理员 2 级
完全权限管理员 3 级
完全权限管理员 4 级

有关 XenApp/XenDesktop 站点内的委派权限的更多信息,请参阅 Citrix 产品文档 - XenApp 和 XenDesktop 委派管理

Provisioning Services 委派权限

管理员角色 支持级别
不适用 1 级
站点管理员 2 级
场管理员 3 级
完全权限管理员 4 级

有关 Provisioning Services 站点内的委派权限的更多信息,请参阅 Citrix eDocs - Provisioning Services 管理管理角色

StoreFront 委派权限

管理员角色 支持级别
不适用 1 级
不适用 2 级
StoreFront 服务器上的本地管理员 3 级
完全权限管理员 4 级

具有本地管理员权限的用户有权查看和管理 StoreFront 或 Web Interface 中的所有对象。这些用户可以创建新站点和修改现有站点。

Citrix 许可证服务器委派权限

管理员角色 支持级别
不适用 1 级
不适用 2 级
管理员 3 级
管理员 4 级

默认情况下,安装许可证服务器过程中使用的帐户将成为控制台管理员。通常用于安装的帐户不是常规管理任务的预期帐户。有关如何更改默认管理员的步骤,请参阅 CTX135841 - 如何更改 Citrix Licensing Server 11.10 的默认管理员。通过此过程创建的所有用户都是 Citrix 许可证服务器的完全权限管理员。

XenServer 委派权限

管理员角色 支持级别
不适用 1 级
虚拟机操作员 2 级
池管理员 3 级
完全权限管理员 4 级

有关 XenServer 资源池中的委派权限的更多信息,请参阅 XenServer 7.0 管理员指南(请参阅“基于角色的访问控制”一章)。

过程 2:操作

本部分内容定义了有助于提高稳定性和性能的 Citrix 环境的常规操作。

决策:管理任务

Citrix 支持团队应执行常规操作和维护任务,以确保稳定、可扩展的 Citrix 环境。每个操作按解决方案的相关组件以及操作频率(持续、每天、每周和每年)进行分类。任务已与决策:支持职责和技能组合中描述的角色一致。

如果执行操作的管理员与支持团队相同,指派将按如下所示进行链接:

  • 2 级支持 = 操作员
  • 3 级支持 = 实施者

每日定期任务

下表概述了 Citrix 支持团队每天应执行的任务。

组件 任务 说明 职责
通用 查看 Citrix Director、Windows 性能监视器、事件日志和其他监视软件警报 检查 Citrix Director、事件日志或其他监视软件中的警告或警报。调查警示的根本原因(如果有)。注意:可以将计算机和监视器设置为显示 Citrix Director 控制板,以便为 Citrix 部门创建“提醒显示”。这样可确保环境的状态清晰可见。《VDI 手册》的“监视”部分包含了 XenDesktop 和 XenApp 7.x 的监视建议。 操作员
通用 验证是否已成功完成备份。 验证所有计划的备份是否已成功完成。这可能包括但不限于:用户数据(用户配置文件/主文件夹);应用程序数据;Citrix 数据库;StoreFront 配置;Web Interface 配置;Provisioning Services 虚拟磁盘(虚拟桌面和应用程序服务器);XenServer VM/池元数据(或其他虚拟机管理程序的等效元数据);专用虚拟桌面;许可证文件。 操作员
通用 测试环境访问 在内部和外部模拟连接,以确保桌面和应用程序资源在多数用户登录当天之前可用。这应该全天进行测试,甚至可以自动执行。 操作员
XenApp 和 XenDesktop 虚拟机电源检查 验证是否打开了适当数量的空闲桌面和应用程序服务器并将其注册到 Delivery Controller,以确保用户工作负载的可用性。 操作员
XenApp 和 XenDesktop 执行 Citrix 相关数据库的增量备份 对以下 Citrix 数据库执行增量数据备份:站点数据库;配置日志记录数据库;监视数据库。 操作员、数据库团队(如果 Citrix 环境使用共享 SQL)
Provisioning Services 检查 Citrix Provisioning 服务器利用率 检查连接到 Citrix Provisioning 服务器的目标设备数,并根据需要在服务器之间平衡负载。 操作员
Provisioning Services 执行 Citrix PVS 数据库的增量备份 SQL Server 基础结构上托管的 Citrix Provisioning 服务器数据库的增量备份。 操作员、数据库团队(如果 Citrix 环境使用共享 SQL)

每周定期任务

下表概述了 Citrix 支持团队每周应执行的任务。

组件 任务 说明 职责
通用 查看最新修补程序 查看、测试和部署最新的 Citrix 修补程序,并确定 Delivery Controller 和基于服务器的操作系统/基于桌面的操作系统虚拟机是否需要这些修补程序。注意:任何必需的修补程序都应在生产中实现之前使用建议的测试过程进行测试。 操作员、实施者(检查过程)
通用 创建 Citrix 环境状态报告 创建有关整体环境性能(服务器运行状况、资源使用情况、用户体验)和 Citrix 问题数量(关闭率、开立问题等)的报告。 操作员
通用 查看状态报告 查看 Citrix 状态报告,以确定任何趋势或常见问题。 实施者、架构师
通用 维护内部支持知识库 创建知识库文章和问题解决方案脚本,以解决 1 级和 2 级支持请求。查看知识库文章和问题解决方案脚本,了解准确性、合规性和可行性。 操作员(2 级请求)、实施者(3 级请求和检查过程)
XenApp 和 XenDesktop 检查配置日志记录报告 确认是否已通过更改控制批准前一周实施的 Citrix 站点范围的更改。 审核员
XenApp 和 XenDesktop 执行 Citrix 相关数据库的完整备份 执行以下 Citrix 数据库的完整数据备份:站点数据库、配置日志记录数据库、监视数据库。操作员、数据库团队(如果 Citrix 环境使用共享 SQL)  
Provisioning Services 检查存储容量(仅在更新虚拟磁盘之前) 查看虚拟磁盘存储和每个虚拟磁盘的存储利用率、已用存储空间和可用存储空间。注意:只有在使用版本控制更新虚拟磁盘或在更新过程中将虚拟磁盘置于专用模式时,虚拟磁盘存储库内空间不足才会成为问题。还应调查虚拟磁盘中的存储利用率。例如,一个 20 GB 的虚拟磁盘可能只有 200 MB 的可用存储空间。如果虚拟磁盘本身被限制用于存储,则需要对其进行扩展。Citrix 不支持调整 VHD 文件的大小。有关调整 VHD 文件大小的信息,请参阅 Microsoft 链接 Resize-VHD。 操作员
Provisioning Services 执行虚拟磁盘更新(如有必要) 在实施任何更新之前,请执行虚拟磁盘的完整备份。更新主虚拟磁盘映像文件并应用以下内容:Windows 软件更新和修补程序;操作系统和应用程序更改;防病毒模式和定义更新。注意:更新应在生产中实施之前使用建议的测试过程进行测试。 审核员
Provisioning Services 检查审核报告 查看 Citrix Provisioning Services 审核日志。注意:Provisioning 服务器审核默认处于关闭状态,可以启用以记录对 Provisioning Services 场中的组件的配置操作。要启用审核,请参阅 Citrix 生产文档文章启用审核信息 操作员、数据库团队(如果 Citrix 环境使用共享 SQL)
Provisioning Services 执行 Citrix PVS 数据库的完整备份 备份托管在 SQL Server 基础结构上的 Citrix Provisioning 服务器数据库。 数据库团队(如果 Citrix 环境使用共享 SQL)

每月定期任务

下表概述了 Citrix 支持团队每月应执行的任务。

组件 任务 说明 职责
通用 执行容量评估 执行 Citrix 环境的容量评估,以确定环境利用率和任何可扩展性要求。注意:关于执行容量评估的建议包括在下面的“监视”部分中的“决策:容量管理”中。 架构师

每年定期任务

下表概述了 Citrix 支持团队每年应执行的任务。

组件 任务 说明 职责
通用 执行 Citrix 策略评估 查看 Citrix 策略,并确定是否需要新策略以及是否需要更新现有策略。 实施者
通用 查看软件升级 查看并评估新 Citrix 软件版本的要求。 实施者
通用 业务连续性计划 (BCP)/灾难恢复 (DR) 测试 执行功能性 BCP/DR 测试,以确认 DR 已准备就绪。此计划应包括年度还原测试,以验证备份数据的实际还原过程是否正常运行。 架构师
通用 执行应用程序评估 查看 Citrix 环境外部和内部应用程序的使用情况。评估向 Citrix 站点添加其他应用程序、删除不再需要的应用程序或将应用程序升级到最新版本的有效性。 架构师
Provisioning Services 存档审核报告 执行 Citrix Provisioning 服务器审核跟踪信息的存档以满足合规性要求。 审核员

决策:备份位置

备份位置直接影响 Citrix 环境的恢复时间和可靠性。建议在现场和在非现场位置存储关键数据的备份。如果由于数据相关的成本或敏感性而无法进行非现场备份,则应将备份放置在同一数据中心内的独立物理位置。

每个备份选项将在下面进一步讨论。

  • 现场备份 — 现场备份应位于数据中心中的存储设备上,以便在发生故障时快速恢复数据。现场备份是仅影响数据中心中一小组硬件的问题的理想选择。备份也可以存储在冷存储解决方案(例如磁带)上。虽然此介质恢复速度较慢,但它提供了额外的保护,因为它仅在备份过程中处于活动状态。
  • 非现场备份 — 虽然恢复的时间要长得多,但非现场备份可以在发生灾难时提供额外的保护。非现场备份可能需要通过 Internet 将数据传输给第三方提供商,或者这些数据是在现场创建的,然后传输到存储介质(例如磁带)上的远程位置。通常情况下,将有限数量的备份放在非现场。例如,每周或每月备份一次。

决策:测试过程

定期更新和维护是 IT 运营的日常部分。必须遵循标准流程,以确保更新不会对生产环境产生负面影响。这包括维护一个专门的测试基础结构,在生产中实施之前可以验证修改内容。

由于对 Citrix 基础结构所做的更改可能会影响成千上万的虚拟桌面和应用程序用户,因此多阶段测试对于环境的可靠性和性能至关重要。因此,测试过程应如下所示:

测试进度示意图

  • 开发 - 开发基础结构存在于生产网络外部。通常情况下,它由短期虚拟机组成,其配置尽可能与生产相匹配。开发阶段的目的是为更改请求者提供一个非生产环境,以执行概念证明、确定集成要求以及作为发现阶段的一部分执行迭代测试。建议的更改应记录在案,以便在测试阶段加以应用。
  • 测试 - 测试环境是生产基础结构的独立 1:1 副本,用于确认建议的更改在预生产暂存环境之前可以很容易地重复。所做的更改应遵循开发阶段的文档。如果测试在测试阶段失败,架构师必须确定故障的严重程度,并确定文档的次要更新是否足够,或者是否需要完整的开发周期。
  • 预生产 - 预生产环境应模仿当前的生产环境。暂存的目标是在风险不太大或不确定的情况下实施建议的更改。预计对暂存基础结构所做的任何更改都经过测试和记录以便实现重复性。本阶段不应进行任何迭代或调整。在此阶段和在此环境中,应执行用户验收测试 (UAT)。
  • 生产 - 生产环境是一个完全冗余和可扩展的解决方案,专为最终用户正常使用而设计。应尽可能少地改变环境。如果可能,所有批准的更改都应分阶段推向生产环境。此过程称为分阶段推出,并在必要时允许回滚更改,而不会影响整个环境,从而降低风险。

决策:更改控制

在整个系统生命周期中管理更改的标准化流程对于确保一致和负有责任的性能是必不可少的。应考虑以下更改控制领先做法。

  • 使用更改控制窗口,以便所有适用方知道何时可能出现停机。确保所有团队都派代表参加变更咨询委员会 (CAC)。
  • 每个更改都应有一个回滚计划。
  • 如果更改失败,请执行“热洗”以确定出现什么问题。
  • 请始终使用自动化的更改控制系统,以便支持人员能够快速、轻松地识别所做的更改。
  • 如果可用,请确保启用配置日志记录以跟踪对 Citrix 环境所做的任何更改。

更改控制流程应从更改请求开始。应填写更改请求表,详细说明请求的更改、更改原因和操作预期的时间范围。然后,根据更改管理员和咨询委员会的要求对其进行审查和编辑。当更改请求完成整个更改审批流程后,会将其提供给更改实施者,后者将暂存所做的更改以进行测试,并最终在生产中执行实施。下图提供了示例更改控制流程,包括详细步骤:

更改控制流程示意图

此流程如下:

  1. 更改请求 (CR) 表由任何请求更改的人填写。

  2. 在获得恰当的经理批准后,CR 将转发给相应的更改管理员。

  3. 更改管理员验证 CR 的完整性,并将 CR 信息记录到更改控制日志中以进行跟踪。不完整的更改请求返回到请求者进行更新和重新提交。

  4. 更改管理员与主题专家和/或与此更改关联/受此更改影响的团队经理一起评估更改的影响。

  5. 更改管理员与关联的/受影响的团队以及更改请求者合作,以确认更改的优先级、类别和类型以及建议的回滚计划。

  6. 如果更改由更改管理员审批,CR 将转发到 CAC 进行审批。如果更改被拒绝,则将使用当前状态以及拒绝的原因来更新更改控制日志,并且 CR 将发送回请求者。

  7. CAB 详细审查和验证更改,并讨论和评估目的、原因、影响、成本和效益。每位董事会成员都代表其所在的部门,并就变更请求提供指导。CAB 还审查多个请求,以协调实施并将请求“打包”到一个发布计划中。

  8. 批准后,更改将发送回更改管理员,以便将待实施的更改安排到暂存环境中。

  9. 更改将实施并进行测试。结果将发送回更改管理员。

  10. 如果暂存实施和测试成功,所做的更改将安排进行生产实施。如果暂存阶段不成功,则将进行另一个暂存迭代。

  11. 如果可能,所做的更改将分阶段推向生产环境。此过程称为分阶段推出,并在必要时允许回滚更改,而不会影响整个环境,从而降低风险。如果在生产环境中实施更改时出现问题,则应执行回滚计划。

  12. 更改管理员检查实施并最终更新更改控制日志。

  13. 更改管理员定期审查更改控制日志,以确定更改类型、频率和大小的趋势,并将结果转发给 CAB 进行审查。在紧急情况下,这些过程可能会加快。如果某个问题被宣布为紧急情况,仍会填写更改申请表,并提交给相应的更改管理代表。获得批准后,所请求的变更将立即付诸实施,并向咨询委员会发出通知。

决策:可用性测试

可用性测试的重点是确保资源在组件故障的情况下仍然可用。这些测试对于确保用户始终能够访问关键业务资源至关重要。测试应在非营业时间或计划的维护周末进行,届时已向最终用户发出适当的通知,让最终用户了解是否出现任何不可预见的问题。

下面是应定期测试的关键组件的列表。

  • StoreFront - StoreFront 应由 NetScaler 或其他负载平衡设备进行负载平衡和运行状况检查。要验证其配置,除一个 StoreFront 服务器外,所有服务器都应关闭。这将验证负载平衡设备是否检测故障并将用户引导到正在运行的服务器。
  • SQL - SQL Server 应处于高可用性配置中。要验证配置,应使主 SQL Server 脱机,然后应打开 Citrix Studio 控制台。由于没有正常运行的 SQL Server,Citrix Studio 将无法访问,因此它将验证 SQL Server 故障转移机制是否正常运行。
  • Delivery Controller - 应为部署的资源配置多个 Delivery Controller 的列表。如果其中一个不可用,桌面和应用程序主机将自动建立与列表中的另一台服务器的连接。要验证这一点,请关闭其中一个 Delivery Controller 主机,并确定最初连接到该主机的资源是否自动注册到另一台服务器。这可以通过查看 Citrix Studio 内资源的注册状态来确定。

示例测试工作流程:Citrix Provisioning Services

必备条件和配置要求:

  • Hypervisor、XenApp 和 XenDesktop 服务已启动并运行。
  • 至少安装并配置了两个 PVS 服务器,以提供通过流技术推送的磁盘映像。
  • 具有多个链接到每台服务器的弹性网络连接和存储基础结构。
  • 测试用户在 XenApp 或 XenDesktop 计算机上处于活动状态。
步骤 预期结果
PVS 服务器中断:关闭其中一个 Provisioning 服务器。验证 PVS 继续运行。重新启动 PVS 服务器。验证 PVS 服务器之间的连接重新平衡。逐个尝试其他(剩余的)PVS 服务器。 现有 XenApp /XenDesktop 计算机连接到另一个 PVS 服务器。对使用该服务器的用户不会产生任何影响。新 XenApp/XenDesktop 计算机可以正确引导和启动。SCOM 报告 PVS 服务器已关闭/不可用。一旦两个 PVS 服务器再次可用,这两个 PVS 服务器之间的实时连接将重新平衡。
PVS 绑定中断:禁用/拔出 PVS 服务器上的 PVS 流绑定中的 NIC。 Provisioning 服务器将继续通过流技术推送通过其余 PVS 通过流技术推送绑定的 NIC。
SQL Server PVS 数据库镜像故障转移:管理员登录到主体 SQL Server。启动 PVS 数据库的故障转移。验证 PVS 继续运行。启动 PVS 数据库的故障恢复。验证 PVS 继续运行。 PVS 继续运行。
SQL 服务中断:管理员同时重新启动主体 SQL Server 和镜像 SQL Server。验证 PVS 继续运行,但管理功能无法运行。等待 SQL Server 恢复联机。验证 PVS 管理功能再次可以运行。 PVS 继续运行。PVS 管理功能不再可用。恢复 SQL 服务后,PVS 管理功能将可用。

示例测试工作流程:Citrix XenDesktop 和 XenApp 服务

必备条件和配置要求:

  • Hypervisor、XenDesktop 和 StoreFront 服务已启动并运行。
  • 网络和存储提供可用。
  • Provisioning Services 提供通过流技术推送的磁盘映像。
  • 测试用户在虚拟机上处于活动状态。
  • SQL(镜像)和 XenDesktop 服务器已启动并运行。
  • 确保多个 StoreFront 服务器正在运行。
  • NetScaler 负载平衡服务。
步骤 预期结果
XenApp/XenDesktop 7.x Delivery Controller Citrix Broker Service 中断:停止其中一个 Delivery Controller 服务器上的 Citrix Broker Service。验证虚拟桌面或应用程序仍然可以枚举和启动。启动 Delivery Controller 服务器上的 Citrix Broker Service。关闭其中一个桌面控制器。验证虚拟桌面或应用程序仍然可以枚举和启动。启动一个桌面后,确定哪个 Controller 拥有主机连接。关闭该 Controller 并验证另一个 Controller 是否接管会话。注意:这应在维护时段内完成。完成后,应重新启动 VDI 资源,以便 VDA 在所有 Controller 之间均匀分布。 StoreFront 将服务正确标识为不可用,并将连接重定向到剩余的 Delivery Controller。桌面将继续枚举并成功启动。如果托管的 Controller 出现故障,则可以支持启动的桌面。
SQL Server 数据库镜像故障转移:管理员登录到主体 SQL Server。启动 XenApp/XenDesktop 数据库的故障转移。验证 XenApp/XenDesktop 继续运行。 数据库应进行故障转移,Citrix Studio 应选取故障转移数据库,且不会出现任何问题。现有会话不受影响。可以进行新会话。管理功能可以运行。
SQL 服务中断:管理员同时重新启动主体 SQL Server 和镜像 SQL Server。验证 XenApp/XenDesktop 继续运行,但管理功能无法运行。等待 SQL 服务恢复联机。验证管理功能再次可以运行。 现有 XenDesktop 会话不受影响。由于本地主机缓存,可以访问最近使用的应用程序、托管共享桌面和分配的 VDI。XenDesktop 管理功能无法运行。SQL 服务可用后,还可以运行 XenDesktop 管理功能。

示例测试工作流程:Citrix Licensing 服务

必备条件和配置要求:

  • Citrix Licensing 服务器启动并运行(使用安装的有效许可证)。
  • Hypervisor、XenApp/XenDesktop 和 StoreFront 服务已启动并运行。
  • 用户在服务器操作系统或桌面操作系统计算机上处于活动状态。
步骤 预期结果
服务器:关闭 Citrix Licensing 服务器。重新启动现有服务器操作系统计算机。登录到 Citrix StoreFront 并启动已发布的应用程序。重新启动现有的桌面操作系统计算机。登录到 Citrix StoreFront 并启动虚拟桌面。 在事件日志中发布许可证服务器连接错误。预配的服务器操作系统成功启动。用户能够启动已发布的应用程序。预配的桌面操作系统成功启动。用户能够启动虚拟桌面。管理员将有 30 天的宽限期来恢复 Citrix Licensing 服务器。

过程 3:监视

通过深入了解 Citrix 环境及其组件的当前和预期行为,管理员可以更好地在问题影响用户社区之前发现问题。此外,正常运行期间跟踪的数据有利于趋势规划和容量规划。本部分内容定义了 Citrix 环境的监视建议以及一些推荐的工具。

决策:自动监视

根据 XenApp 和 XenDesktop 解决方案的大小和范围,管理员可能需要相当长的时间来验证服务、事件、容量和性能。建议管理员调查其监视策略中的自动化建议。

Citrix 包括一个名为 Smart Check 的云托管监视解决方案,该解决方案适用于任何具有活动“Citrix Customer Success Services: 选择服务”的组织。Smart Check 在 XenApp 和 XenDesktop 环境中执行以下操作:

  • 站点运行状况检查 - 使用 XenApp 和 XenDesktop 站点评估所有服务
  • 应用程序和桌面检查 = 验证交付组的可用性
  • 更新检查 - 跟踪并建议 Delivery Controller 的修补程序
  • LTSR 检查 - 验证站点内的 Delivery Controller 和 VDA 是否与 LTSR 版本一致。
  • 自定义检查 - 允许管理员导入自己的自定义脚本以跨其 XenApp 和 XenDesktop 站点进行测试。

有关当前 Smart Check 功能的列表,请查看 Smart Check 文档

决策:性能监视指标

监视整体环境的性能对于确保所有组件的可用性和有效地执行以确保用户获得高质量体验至关重要。

整体解决方案中的不同组件需要监视适当设置了阈值的唯一指标。提供的指标和阈值基于真实的体验,但可能不适用于所有环境。在生产环境中实施之前,组织需要执行自己的基线、有效性测试和验证。

注意

某些虚拟机管理程序(例如 VMware vSphere 和 Hyper-V)提供特定的性能计数器,用于跟踪虚拟机中的 CPU 和内存利用率(即“VM 处理器\处理器时间百分比”)。除了下面列出的常规计数器之外,还应使用这些性能计数器。

常规

这些性能计数器应用于监视 Citrix 基础结构、应用程序服务器和虚拟桌面的关键性能指标。

指标 说明 警告(黄色) 严重(红色) 故障排除/补救措施
处理器 - 处理器时间百分比 处理器时间百分比是处理器执行非空闲线程所花费的时间的百分比。计算方法是测量空闲线程在采样间隔内处于活动状态的持续时间,并从间隔持续时间中减去该时间。(每个处理器都有一个空闲线程,当没有其他线程准备好运行时,该线程会占用周期)。此计数器是处理器活动的主要指标,并显示采样间隔内观察到的繁忙时间的平均百分比。它通过监视服务处于不活动状态的时间并从 100% 中减去该值来计算。 15 分钟的 80% 15 分钟的 95% 使用任务管理器或资源监视器确定占用处理器时间的处理器/服务。如果所有进程/服务都在正常参数范围内运行,并且 CPU 占用量处于预期水平,应考虑在将来向此系统中添加更多 CPU 资源。如果可以识别一个在正常参数之外运行的进程/服务,则应终止该进程。请注意,终止进程可能会导致未保存的数据丢失。
系统 - 处理器队列长度 处理器队列长度是处理器队列中的线程数。与磁盘计数器不同,此计数器仅显示就绪线程,而不显示正在运行的线程。即使在配备了多个处理器的计算机上,处理器时间也只有一个队列。因此,如果计算机配备了多个处理器,则需要将此值除以向工作负载提供服务的处理器数。每个处理器少于十个线程的持续处理器队列通常是可以接受的,这取决于工作负载。 5 分钟内(每个核心)为 5,或 15 分钟内(每个核心)为 6 10 分钟内(每个核心)为 10,或 30 分钟内(每个核心)为 12 较长的 CPU 队列是 CPU 瓶颈的明显症状。请按照计数器“处理器 - 处理器时间百分比”概述的步骤进行操作。
内存 - 可用字节数 可用内存指示非分页缓冲池分配、分页缓冲池分配、进程的工作集和文件系统缓存后剩余的内存量。 6 分钟以上小于总 RAM 的 30% 或物理内存的 20% 6 分钟以上小于总 RAM 的 15% 或物理内存的 5% 使用任务管理器或资源监视器识别占用内存的进程/服务。如果所有进程/服务都在正常参数范围内运行,并且内存占用量处于预期水平,应考虑在将来向此系统中添加更多内存。如果可以识别一个在正常参数之外运行的进程/服务,则应终止该进程。请注意,终止进程可能会导致未保存的数据丢失。
内存 - 页面数/秒 每秒内存是指为解决硬页错误而从磁盘中读取内存页或者将内存页写入到磁盘的速率。 大于 10 大于 20 此计数器报告的高值通常表示内存瓶颈,“内存 - 可用字节数”同时报告高值时除外。在这种情况下,应用程序很可能按顺序从内存中读取文件。有关更多信息,请参阅 Microsoft 知识库文章 KB139609 — 高页数/秒数不一定表示内存不足。
页面文件 - 使用率百分比 这是正在使用的页面文件实例的百分比量。 60 分钟以上超过 40% 或 80% 60 分钟以上超过 70% 或 95% 结合使用“内存 - 可用字节数”和“内存 - 页/秒”查看此值,以了解受影响的系统上的分页活动。
LogicalDisk/PhysicalDisk - 可用空间百分比 可用空间百分比是所选逻辑磁盘驱动器上可用空间总量的百分比。 2 分钟后小于物理磁盘的 20% 或报告的 20% 1 分钟后小于物理磁盘的 10% 或报告的 15% 确定哪些文件或文件夹占用磁盘空间,并在可能的情况下删除过时的文件。如果无法删除任何文件,请考虑增加受影响分区的大小或添加其他磁盘。
LogicalDisk/PhysicalDisk - 磁盘时间百分比 磁盘时间百分比标记磁盘的繁忙程度。 15 分钟以上持续超过 70% 或 90% (_Total) 15 分钟以上持续超过 90% 或 95% (_Total) 使用任务管理器或资源监视器识别占用磁盘时间的进程/服务。如果所有进程/服务都在正常参数范围内运行,并且磁盘占用量处于预期水平,应考虑在将来将受影响的分区移动到功能更强大的子系统。如果可以识别一个在正常参数之外运行的进程/服务,则应终止该进程。请注意,终止进程可能会导致未保存的数据丢失。
LogicalDisk/PhysicalDisk – 当前磁盘队列长度 当前磁盘队列长度提供磁盘拥塞的主要衡量标准。它表示等待处理的事务的数量。 15 分钟以上持续大于等于 1(每个主轴)或 3 (_Total) 30 分钟以上持续大于等于 2(每个主轴)或 10 (_Total) 较长的磁盘队列长度通常表示磁盘性能瓶颈。这可能是由导致大量 I/O 的进程/服务或物理内存不足造成的。请按照计数器“LogicalDisk/PhysicalDisk - 磁盘时间百分比”和计数器“内存 - 可用字节数”概述的步骤进行操作
LogicalDisk/PhysicalDisk – 平均值每秒磁盘/读取;– 平均值每秒磁盘/写入;– 平均值每秒磁盘/传输 “每秒平均磁盘”计数器显示在磁盘中读取/写入/传输的平均时间,单位为秒。 始终大于等于15 毫秒,始终大于等于 20 毫秒 高磁盘读取或写入延迟指示磁盘性能瓶颈。受影响的系统将变得缓慢、无响应,应用程序或服务可能会失败。请按照针对计数器“LogicalDisk/PhysicalDisk - 磁盘时间百分比”概述的步骤进行操作  
网络接口 – 总字节数/秒 “总字节数/秒”显示网络适配器处理数据字节数的速率。此计数器包括所有应用程序和文件数据(协议信息除外),例如,数据包标头。 小于 8 MB/秒,适用于速率为 100 MB/秒的适配器;小于 80 MB/秒,适用于速率为 1000 MB/秒的适配器,或者 1 分钟内 NIC 速度入站和出站流量的 60%。 1 分钟内 NIC 速度入站和出站流量的 70%。 使用任务管理器或资源监视器识别占用网络的进程/服务。如果所有进程/服务都在正常参数范围内运行,并且带宽占用量处于预期水平,应考虑将各自的进程/服务移动到专用 NIC(或一组 NIC)。如果可以识别一个在正常参数之外运行的进程/服务,则应终止该进程。请注意,终止进程可能会导致未保存的数据丢失。

XenApp/XenDesktop

这些性能计数器特定于 Delivery Controller。

指标 说明 警告(黄色) 严重(红色) 故障排除/补救措施
数据库平均值事务时间 执行数据库事务的平均时间(以秒为单位)。需要在环境中建立基线,以便准确地确定阈值。 基于基准值 基于基准值 如果报告的值持续超过基准响应时间,则需要在 SQL Server 级别调查潜在的性能问题。
连接的数据库 指示此服务是否与其数据库通信(1 表示已连接;0 表示未连接)。 0 0(超过 30 分钟) 这两个值都会报告 XenDesktop Broker Service 与数据库的连接问题。如果报告问题,需要验证 SQL Server 和网络可用性。
数据库事务错误数/秒 数据库事务失败的速率。 大于 0 这两个值都会报告 XenDesktop Broker Service 与数据库的连接问题。如果报告问题,需要验证 SQL Server 和网络可用性。

StoreFront

这些性能计数器特定于 StoreFront 服务器。

指标 说明 警告(黄色) 严重(红色)
ASP.NET – 排队的请求 等待由 ASP 处理的请求数。需要在环境中建立基线,以便准确地确定阈值。 基于基准值 基于基准值
ASP.NET - 被拒绝的请求 由于请求队列已满而被拒绝的请求数。 大于等于 1
APP_POOL_WAS\Current Application Pool State\Citrix Receiver for Web 3    
APP_POOL_WAS\Current Application Pool State\Citrix Delivery Services Authentication 3    
APP_POOL_WAS\Current Application Pool State\Citrix Delivery Services Resource 3    
请求响应 无论是身份验证、枚举还是订阅,都应为 3 到 5 秒 (http://www.perftestplus.com/resources/how_fast.pdf)    

Citrix 许可证服务器

这些性能计数器特定于 Citrix 许可证服务器。

指标 说明 警告(黄色) 严重(红色) 故障排除/补救措施
Citrix Licensing – 上次记录的许可证签出响应时间 显示上次记录的许可证签出响应时间(以毫秒为单位)。 大于 2000 毫秒 大于 5000 毫秒 如果报告的值超过 5000 毫秒的响应时间,则需要在 Citrix 许可证服务器中调查潜在的性能问题。
Citrix Licensing – 许可证服务器连接失败 显示 XenDesktop 与许可证服务器之间断开连接的分钟数。 大于 1 分钟 大于 1440 分钟 这两个值都报告与许可证服务器的连接问题。如果报告问题,需要验证许可证服务器和网络可用性。

决策:服务监视

对于基本服务器功能至关重要的 Windows 服务应自动监视,以确保其正常运行。下表提供了应监视的常用 Windows 服务列表。当其中的任何服务重新启动或停止时,应分别分配警告(黄色)或严重(红色)警报。下面列出的建议的服务恢复操作如下:

  • 第一次失败:重新启动服务
  • 第二次失败:重新启动服务
  • 后续失败:将服务器置于维护模式并调查根本原因

XenApp/XenDesktop

服务 功能 管理风险
Citrix AD Identity Service 管理 Active Directory 计算机帐户。依赖关系:WMI 服务 Machine Creation Service 依赖于此服务来创建虚拟机。管理员将无法创建新计算机目录或修改现有计算机目录。管理员将无法建立与 Citrix Studio 的新连接。
Citrix Broker Service 管理与虚拟机和应用程序的连接。 如果此服务已停止,管理员将无法更改环境或建立与 Citrix Studio 的新连接。还可以终止与 Citrix Studio 的任何现有管理员连接。如果此服务已停止,则现有用户连接不受影响。无法建立新连接。登录 StoreFront 的用户将无法看到可供选择的任何资源。重新启动服务后,用户需要重新登录到 StoreFront 以建立连接。
Citrix Configuration Logging Service 记录 XenDesktop 部署中管理员的活动以及对配置所做的更改。 如果此服务已停止,XenApp/XenDesktop 将无法与配置日志记录数据库通信。管理员将无法更改环境或建立与 Citrix Studio 的新连接。
Citrix Configuration Service 存储服务配置信息。依赖关系:WMI 服务 如果此服务已停止,管理员将无法更改环境或建立与 Citrix Studio 的新连接。
Citrix Delegated Administration Service 管理委派的管理权限的配置。 如果此服务已停止,XenApp/XenDesktop 将无法分配管理权限。管理员将无法更改环境或建立与 Citrix Studio 的新连接。管理员将无法建立与 Citrix Director 的新连接,并且 Citrix Director 中的现有会话将中断。
Citrix Diagnostic Facility COM Server Service 管理和控制系统中的 Citrix 诊断跟踪会话。依赖关系:RPC 服务 此服务对生产环境没有影响。此服务用于生成 CDF 跟踪文件,以帮助解决问题。
Citrix Environment Test Service 管理用于评估 XenDesktop 站点状态的测试。 如果此服务已停止,管理员将无法建立与 Citrix Studio 的新连接。管理员也无法通过在 Citrix Studio 管理控制台中的“常规任务”下运行测试来检查 Citrix 站点配置、计算机目录和交付组的状态。
Citrix Host Services 管理主机和虚拟机管理程序连接。依赖关系:WMI 服务 管理员将无法通过 Citrix Studio 创建新的计算机目录或控制虚拟机电源设置。管理员将无法建立与 Citrix Studio 的新连接。当此服务不可用时,用户可能会在连接到虚拟桌面时遇到问题。如果此服务已停止,则现有连接不受影响。
Citrix Machine Creation Service 创建新虚拟机依赖关系:WMI 服务 管理员将无法创建新计算机目录或修改现有计算机目录或建立与 Citrix Studio 的新连接。管理员将无法建立与 Citrix Studio 的新连接。
Citrix Monitor Service 监视 FlexCast 系统。 如果此服务已停止,XenApp/XenDesktop 将无法与监视数据库通信。Citrix Director 将无法检索环境中的任何数据。管理员将无法建立与 Citrix Studio 的新连接。
Citrix StoreFront Service 管理 StoreFront 的部署。 管理员将无法建立与 Citrix Studio 的新连接。

Citrix Director 中的 Delivery Controller 服务监视

Citrix Director 控制板中的“基础结构”窗格提供在 Delivery Controller 上运行的服务的状态,并在服务或 Controller 不可用时提供警告指示。可以通过单击“基础结构”窗格中的“警报”超链接访问这些警报。

Director 基础结构示意图

Provisioning Services

服务 功能 风险
Citrix PVS PXE Service 提供 PVS PXE 引导服务器功能。注意:仅当使用 PXE 引导时适用。 此服务失败时,如果利用 PXE 引导,目标设备可能无法成功引导。
Citrix PVS Stream Service 根据需要,通过流技术将虚拟磁盘的内容推送到目标设备。 如果此服务已停止,则无法通过流技术推送虚拟磁盘映像。
Citrix PVS SOAP Service 为与 Provisioning Services 交互的外部或现有解决方案提供框架。注意:仅影响控制台操作。用户不受影响 如果此服务失败,无法进行从 PVS 服务器到 PVS 服务器的通信以及从 PVS 控制台到 PVS 服务器的通信。
Citrix PVS TFTP Service 提供 TFTP 服务器功能。注意:仅当使用 TFTP 时适用。 此服务失败时,如果此服务器用作引导程序的 TFTP 服务器,目标设备可能无法引导。
Citrix PVS Two- Stage Boot Service 为通过 BDM ISO 文件引导的设备提供引导功能。注意:仅当使用 BDM 引导分区时适用。 此服务失败时,如果使用 BDM ISO 文件,目标设备可能无法成功引导。

StoreFront

服务 功能 风险
Citrix Cluster Join Service 提供服务器组加入服务。 向服务器组添加其他 StoreFront 服务器时,将启动此服务。如果启动此进程时此服务未启动或中断,则其他服务器将无法加入指定的服务器组,并且该进程将导致出现错误。
Citrix Configuration Replication 提供交付服务配置信息的访问权限。 此服务仅存在于服务器组的主 StoreFront 服务器上。如果此服务已停止,其他 StoreFront 服务器将无法加入服务器组,并且对主 StoreFront 服务器所做的任何更改都不会复制到其他服务器。这可能会导致服务器组中的服务器不同步。
Citrix Credential Wallet 提供安全的凭据存储。依赖关系:Citrix Peer Resolution Service 如果此服务已停止,用户将无法登录以访问其桌面或应用程序。登录 StoreFront 的用户将无法启动新应用程序或桌面会话。现有应用程序或桌面会话不受影响。
Citrix Default Domain Services 提供身份验证、更改密码和其他域服务。 如果此服务已停止,用户将无法登录以访问其桌面或应用程序。当前登录的用户不会受到影响。
Citrix Peer Resolution Service 解析对等网格中的对等名称。 此服务失败时,Citrix Credential Wallet 和Citrix Subscriptions 存储将停止生成与这些服务相关的风险。
Citrix Storefront Privileged Administration Service 管理 StoreFront 上的特权操作  
Citrix Subscriptions Store 提供应用商店和用户订阅的复制条目。依赖关系:Citrix Peer Resolution Service 如果此服务已停止,Citrix Receiver 将无法在 StoreFront 中添加、删除和重新定位应用程序。用户需要重新添加应用程序,并且不会将对 StoreFront 应用商店中的应用程序选择所做的所有更改保存或复制到其他会话。服务重新启动后,将还原原始用户配置。
万维网发布服务 通过 Internet Information Services 管理器提供 Web 连接和管理。依赖关系:HTTP;RPC Service 无法通过 StoreFront 访问已发布的应用程序或已发布的桌面。用户将无法解析 Receiver for Web 登录页面。登录 StoreFront 的用户将无法启动新应用程序或桌面会话,并且需要在重新启动服务时重新输入凭据。现有应用程序或桌面会话不受影响。

Web Interface

服务 功能 风险
万维网发布服务 通过 Internet Information Services 管理器提供 Web 连接和管理。依赖关系:HTTP;RPC Service 如果 WWW 服务不可用,则无法通过 Web Interface 访问已发布的应用程序或已发布的桌面。

Citrix 许可证服务器

服务 功能 风险
Citrix Licensing Service 为 Citrix 产品提供许可服务。 当服务停止或无法联系许可证服务器时,许可模式将更改为宽限期。如果未受监视,Citrix 产品的功能将在宽限期到期后终止。
Citrix Licensing Support Service 此帐户控制读取许可证文件以及使用许可证尾端(数据字典功能)更新字符串。
Citrix Licensing WMI Citrix 许可证管理控制台使用 WMI 服务收集许可证数据信息。

决策:事件监视

监视 Windows 事件日志中的未知事件或严重事件可以帮助主动发现问题,并允许管理员了解事件模式:

  • 许可 - 应调查处理远程桌面许可的事件日志中的错误。这可能是由于已安装的 Citrix 产品无法与远程桌面授权服务器或 Citrix Licensing 服务器联系。如果未查看事件日志中的错误,用户最终可能会被拒绝访问,因为他们无法获得有效的许可证。
  • 硬件故障 - 应立即查看与硬件故障相关的任何事件通知。任何发生故障的设备都会对系统的性能产生影响。硬件故障至少会消除组件的冗余。
  • 安全警告 - 客户应调查安全日志中有关登录失败的安全警告或审核失败事件。这可能表明有人试图破坏服务器。
  • 磁盘容量 - 随着 Windows 系统的驱动器达到 90% 的容量,将生成事件错误消息。为确保持续提供服务,客户应轮询这些事件错误。由于系统硬盘空间耗尽,系统面临严重风险。服务器可能没有足够的空间来服务用户的临时文件存储请求。
  • 应用程序/服务错误 - 应调查与应用程序或服务错误相关的任何事件通知。
  • Citrix 错误 - 所有 Citrix 软件组件都将利用 Windows 事件日志进行错误日志记录。可以通过以下链接找到由 Citrix 组件发出的已知事件日志警告和错误的列表:

请定期检查“事件查看器”中是否存在与 Citrix 相关的警告或错误,这一点非常重要。应立即调查日志中反复出现的警告或错误,因为它可能表明如果未正确解决,可能会严重影响 Citrix 环境的问题。

在多服务器环境中,可以从中心位置收集和查看日志时,管理服务器变得更加容易。大多数企业级监视解决方案都提供此功能。更复杂的监视解决方案使管理员能够将事件信息与其他数据点(例如性能指标或可用性统计数据)相关联。如果所选监视解决方案不提供此功能,可以使用 Windows Server 2008 R2 或 Windows Server 2012/2012 R2 事件日志订阅功能。此功能允许管理员从多个服务器接收事件并从指定的收集器计算机查看事件。有关详细信息,请参阅 Microsoft TechNet 文章 管理订阅

XenServer 还可以将其日志发送到中央 syslog 服务器。管理员在池中每个 XenServer 的属性中设置 syslog 守护进程服务器的 IP 地址。此配置允许管理员在多个 XenServer 主机之间捕获实时活动。更多信息可以在 XenServer 管理员指南中找到。

决策:容量管理

除了对系统级指标进行日常监视外,还应从历史角度跟踪性能指标,以便在更多用户访问环境时帮助规划未来的增长。

应采用环境性能的基线,以便将其与随时间推移的性能进行比较。例如,如果用户抱怨性能不佳,则此基准可用于比较目的,以确定问题是否与用户负载超过环境容量有关。

容量管理的基准性能指标示例将包括 Delivery Controller 和应用程序服务器或桌面上的 CPU、内存和网络利用率的历史数据。

Citrix Director

管理员可以利用 Citrix Director 中的“趋势”视图来跟踪随时间推移的 Citrix XenApp/XenDesktop 部署的不同参数。这些参数可以用于 Citrix 环境的容量规划。

在“趋势”视图中,管理员可以看到划分为几个类别的历史数据,包括:

  • 会话 - 提供随时间推移的并发会话使用情况,从而能够适当调整环境的大小。
  • 连接故障 - 概述不同交付组之间发生的不同类型的连接故障。
  • 出现故障的桌面操作系统计算机 - 概述与桌面计算机故障相关的不同问题。
  • 出现故障的服务器操作系统计算机 - 概述与服务器计算机故障相关的不同问题。
  • 登录性能 - 显示用户登录其应用程序和桌面所需的时间。
  • 负载评估器索引 - 提供各种基于性能计数器的指标,包括服务器操作系统计算机的 CPU、内存和磁盘使用情况。
  • 容量管理 - 显示已发布应用程序和桌面的利用率。
  • 资源利用率 - 提供有关 CPU、内存和存储资源利用率的信息。
  • 自定义报告 - 允许管理员针对系统捕获的众多指标创建自定义历史报告。
  • 托管应用程序使用情况 - 详细介绍在站点中发布的所有应用程序,并可以详细提供有关每个单个应用程序的使用情况信息(并发实例、启动、使用持续时间等)。注意:需要 XenApp 或 XenDesktop Platinum 许可
  • 网络 - 通过 NetScaler HDX Insight 提供的网络分析。

Director 趋势示意图

有关在 Citrix Director 趋势的详细信息,请参阅以下内容。

本手册的创建过程非常耗时,需要在许多场景中提供真正的部署体验。Citrix 对《Citrix VDI 手册》做出贡献的作者和主题专家深表谢意。