警报和通知

警报在 Monitor 中的控制板上以及其他高级别视图中显示,带有警告和严重警报符号。警报每分钟自动更新一次;也可以根据需要更新警报。

Alerts

警告警报(琥珀色三角形)指示已达到或超过条件的警告阈值。

严重警报(红色圆形)显示已达到或超过条件的严重阈值。

可以查看警报的更多详细信息,方法是从边栏中选择警报,单击边栏底部的转至“警报”链接,或者在 Monitor 页面顶部选择警报

在“警报”视图中,可以过滤和导出警报。例如,上个月中针对特定交付组的出现故障的多会话操作系统计算机,或针对特定用户的所有警报。有关详细信息,请参阅导出报告

过滤警报

Citrix 警报

Citrix 警报是指源自 Citrix 组件的警报。可以在 Monitor 内部的警报 > Citrix 警报策略中配置 Citrix 警报。作为配置的一部分,可以设置要在警报超出所设置的阈值时通过电子邮件向个人和组发送的通知。有关设置 Citrix 警报的详细信息,请参阅创建警报策略

智能警报策略

一组具有预定义阈值的内置警报策略适用于交付组和多会话操作系统 VDA 作用域。可以在警报 > Citrix 警报策略中修改内置警报策略的阈值参数。 当在站点中至少定义了一个警报目标(一个交付组或一个多会话操作系统 VDA)时,将创建这些策略。此外,这些内置警报会被自动添加到新的交付组或多会话操作系统 VDA。

仅当 Monitor 数据库中不存在任何相应的警报规则时,才创建内置警报策略。

有关内置警报策略的阈值,请参阅警报策略条件部分。

内置警报

创建警报策略

Monitor 警报策略

创建新警报策略,例如,在满足一组特定会话计数条件时生成警报:

  1. 转至警报 > Citrix 警报策略,然后选择策略,例如“多会话操作系统策略”。
  2. 单击创建
  3. 命名并描述该策略,然后设置触发警报时必须满足的条件。例如,指定“最大已连接会话数”、“最大已断开会话数”和“最大并发会话总数”对应的警告和严重警报数。警告值不得大于严重警报值。有关详细信息,请参阅警报策略条件
  4. 设置重新发出警报的时间间隔。如果仍满足警报的条件,则在达到此时间间隔时会再次出发警报,如果在警报策略中设置了此时间间隔,则会生成电子邮件通知。已消除的警报在达到重新发出警报的时间间隔时不生成电子邮件通知。
  5. 设置作用域。例如,为特定交付组进行设置。
  6. 在“通知”首选项中,指定触发警报时应通过电子邮件向哪些用户发送通知。电子邮件通知通过 SendGrid 发送。确保电子邮件地址 donotreplynotifications@citrix.com 在您的电子邮件设置中列入白名单。
  7. 单击“保存”。

创建一条包含在作用域中定义的 20 个或更多交付组的策略大约需要 30 秒才能完成配置。此时将显示一个微调器。

如果为最多 20 个不同的交付组创建 50 多个策略(共 1000 个交付组目标),可能会导致响应时间增加(超过 5 秒)。

将包含活动会话的计算机从一个交付组移至另一个交付组可能会触发使用计算机参数定义的错误交付组警报。

注意: 删除警报策略后,该策略生成的警报通知最多可能需要 30 分钟才能停止。

警报策略条件

下文介绍了警报类别、用于缓解警报的建议操作以及内置策略条件(如果已定义)。内置警报策略是针对 60 分钟警报和重新警报时间间隔定义的。

最大已连接会话数

  • 查看 Monitor 的“会话趋势”视图,获取最大已连接会话数。
  • 检查以确保容量足以容纳会话负载。
  • 根据需要添加新计算机

最大已断开会话数

  • 查看 Monitor 的“会话趋势”视图,获取最大已断开会话数。
  • 检查以确保容量足以容纳会话负载。
  • 根据需要添加新计算机。
  • 根据需要注销已断开连接的会话

最大并发会话总数

  • 查看 Monitor 中的 Monitor“会话趋势”视图,获取最大并发会话总数。
  • 检查以确保容量足以容纳会话负载。
  • 根据需要添加新计算机。
  • 根据需要注销已断开连接的会话

CPU

CPU 使用率百分比指示 VDA 上的整体 CPU 占用量,包括进程的整体 CPU 占用量。可以从相应 VDA 的计算机详细信息页面更加深入地了解各个进程的 CPU 利用率。

  • 转至计算机详细信息 > 查看历史利用率 > 排名前 10 的进程,确定占用 CPU 的进程。确保启用进程监视策略以启动进程级别的资源使用情况统计信息的收集。
  • 必要时结束进程。
  • 结束进程会导致未保存的数据丢失。
  • 如果一切均正常工作,请以后再添加其他 CPU 资源。

    注意:

    在具有 VDA 的计算机上,默认允许使用启用资源监视策略设置,以监视 CPU 和内存性能计数器。如果禁用此策略设置,则不会触发 CPU 和内存状况警报。有关详细信息,请参阅监视策略设置

    智能策略条件:

    • 作用域: 交付组、多会话操作系统作用域
    • 阈值: 警告 - 80%、严重 - 90%

内存

内存使用率百分比指示 VDA 上的整体内存消耗量,包括进程的整体内存消耗量。可以从相应 VDA 的计算机详细信息页面更加深入地了解各个进程的内存利用率。

  • 转至计算机详细信息 > 查看历史利用率 > 排名前 10 的进程,确定占用内存的进程。确保启用进程监视策略以启动进程级别的资源使用情况统计信息的收集。
  • 必要时结束进程。
  • 结束进程会导致未保存的数据丢失。
  • 如果一切均正常工作,请以后再添加其他内存。

    注意:

    在具有 VDA 的计算机上,默认允许使用启用资源监视策略设置,以监视 CPU 和内存性能计数器。如果禁用此策略设置,则不会触发 CPU 和内存状况警报。有关详细信息,请参阅监视策略设置

    智能策略条件:

    • 作用域: 交付组、多会话操作系统作用域
    • 阈值: 警告 - 80%、严重 - 90%

连接失败率

过去一小时内连接失败的百分比。

  • 根据失败总次数除以尝试连接的总次数计算得来。
  • 检查 Monitor 的“连接失败趋势”视图,了解配置日志中记录的事件。
  • 确定桌面或应用程序是否可访问。

连接失败次数

过去一小时内连接失败的次数。

  • 检查 Monitor 的“连接失败趋势”视图,了解配置日志中记录的事件。
  • 确定桌面或应用程序是否可访问。

ICA RTT(平均值)

平均 ICA 往返时间。

  • 检查 Citrix ADM 获取 ICA RTT 中的故障信息以确定根本原因。有关更多信息,请参阅 Citrix ADM 文档
  • 如果 Citrix ADM 不可用,请检查“Monitor 用户详细信息”视图以获取 ICA RTT 和延迟信息,并确定是网络问题还是应用程序或桌面问题。

ICA RTT(会话数)

超过 ICA 往返时间阈值的会话数。

  • 检查 Citrix ADM 以获取具有高 ICA RTT 的会话数。有关更多信息,请参阅 Citrix ADM 文档
  • 如果 Citrix ADM 不可用,请与网络团队联系共同确定根本原因。

    智能策略条件:

    • 作用域: 交付组、多会话操作系统作用域
    • 阈值: 警告 - 300 毫秒(5 个或更多会话)、严重 - 400 毫秒(10 个或更多会话)

ICA RTT(会话百分比)

超过平均 ICA 往返时间的会话百分比。

  • 检查 Citrix ADM 以获取具有高 ICA RTT 的会话数。有关更多信息,请参阅 Citrix ADM 文档
  • 如果 Citrix ADM 不可用,请与网络团队联系共同确定根本原因。

ICA RTT(用户)

应用于由指定用户启动的会话的 ICA 往返时间。如果 ICA RTT 高于至少一个会话中的阈值,则会触发该警报。

出现故障的计算机数(单会话操作系统)

出现故障的单会话操作系统计算机数。可能会因多种原因而出现故障,如在 Monitor 的“控制板”和“过滤器”视图中所示。

  • 请运行 Citrix Scout 诊断以确定根本原因。有关详细信息,请参阅对用户问题进行故障排除

    智能策略条件:

    • 作用域: 交付组作用域
    • 阈值: 警告 - 1、严重 - 2

出现故障的计算机数(多会话操作系统)

出现故障的多会话操作系统计算机数。可能会因多种原因而出现故障,如在 Monitor 的“控制板”和“过滤器”视图中所示。

  • 请运行 Citrix Scout 诊断以确定根本原因。

    智能策略条件:

    • 作用域: 交付组、多会话操作系统作用域
    • 阈值: 警告 - 1、严重 - 2

故障计算机(以 % 为单位)

交付组中出现故障的单会话和多会话操作系统计算机的百分比是根据故障计算机的数量计算的。此警报条件允许您将警报阈值配置为交付组中的故障计算机的百分比,每 30 秒计算一次。 可能会因多种原因而出现故障,如在 Director 的“控制板”和“过滤器”视图中所示。请运行 Citrix Scout 诊断以确定根本原因。有关详细信息,请参阅对用户问题进行故障排除

平均登录持续时间

过去一小时内的平均登录持续时间。

  • 查看“Monitor”控制板,获取与登录持续时间有关的最新指标。大量用户在短时间内登录会延长登录持续时间。
  • 请查看登录的基准时间和中断时间,以缩小原因范围。有关详细信息,请参阅诊断用户登录问题

    智能策略条件:

    • 作用域: 交付组、多会话操作系统作用域
    • 阈值: 警告 - 45 秒、严重 - 60 秒

登录持续时间(用户)

过去一小时内发生的指定用户的登录的登录持续时间。

负载评估器指数

过去 5 分钟内负载评估器指数的值。

  • 查看 Monitor 中可能具有峰值负载(最大负载)的多会话操作系统计算机。查看“控制板”(失败)和“趋势负载评估器指数”报告。

    智能策略条件:

    • 作用域: 交付组、多会话操作系统作用域
    • 阈值: 警告 - 80%、严重 - 90%

虚拟机管理程序警报监视

Monitor 会显示警报以监视虚拟机管理程序的运行状况。来自 Citrix Hypervisor 和 VMware vSphere 的警报可以帮助监视虚拟机管理程序参数和状态。还可以监视与虚拟机管理程序的连接状态以在群集或主机池重新启动或不可用时提供警报。

要接收虚拟机管理程序警报,请确保在“管理”选项卡中创建宿主连接。有关详细信息,请参阅连接和资源。仅监视这些连接以获取虚拟机管理程序警报。下表介绍虚拟机管理程序警报的各种参数和状态。

警报 支持的虚拟机管理程序 触发者 条件 配置
CPU 使用率 Citrix Hypervisor、VMware vSphere 虚拟机管理程序 已达到或超过 CPU 使用率警报阈值 必须在虚拟机管理程序中配置警报阈值。
内存使用率 Citrix Hypervisor、VMware vSphere 虚拟机管理程序 已达到或超过内存使用率警报阈值 必须在虚拟机管理程序中配置警报阈值。
网络使用情况 Citrix Hypervisor、VMware vSphere 虚拟机管理程序 已达到或超过网络使用情况警报阈值 必须在虚拟机管理程序中配置警报阈值。
磁盘使用情况 VMware vSphere 虚拟机管理程序 已达到或超过磁盘使用情况警报阈值 必须在虚拟机管理程序中配置警报阈值。
主机连接或电源状态 VMware vSphere 虚拟机管理程序 虚拟机管理程序主机已重新启动或不可用 在 VMware vSphere 中预先生成警报。不需要任何其他配置。
虚拟机管理程序连接不可用 Citrix Hypervisor、VMware vSphere Delivery Controller 与虚拟机管理程序(池或群集)的连接已断开或已关闭或重新启动。只要连接不可用,就会每小时生成一次该警报。 警报是在 Delivery Controller 中预先生成的。不需要任何其他配置。

注意:

有关配置警报的详细信息,请参阅 Citrix XenCenter 警报或者查看“VMware vCenter 警报”文档。

可以在 Citrix 警报策略 > 站点策略 > 虚拟机管理程序运行状况下配置电子邮件通知首选项。只能从虚拟机管理程序而非从 Monitor 配置、编辑、禁用或删除虚拟机管理程序警报策略的阈值条件。但是,修改电子邮件首选项和消除警报可以通过在 Monitor 中完成。

重要提示:

  • 所有时间在一天以上的虚拟机管理程序警报都将自动消除。
  • 由虚拟机管理程序触发的警报将在 Monitor 中进行提取和显示。但是,对虚拟机管理程序警报的生命周期/状态所做的更改不会反映在 Monitor 中。
  • 在虚拟机管理程序控制台中处于正常状态或被消除或禁用的警报将继续显示在 Monitor 中且必须显式消除。
  • 在 Monitor 中被消除的警报不会在虚拟机管理程序控制台中自动消除。

虚拟机管理程序警报过滤器

添加了称为虚拟机管理程序运行状况的新警报类别,以仅过滤虚拟机管理程序警报。达到或超过阈值后,将显示这些警报。虚拟机管理程序警报可以为:

  • 临界 - 达到或超过虚拟机管理程序警报策略的临界阈值
  • 警告 - 达到或超过虚拟机管理程序警报策略的警告阈值
  • 消除 - 不再显示为活动警报的警报

虚拟机管理程序警报显示

警报和通知