警报和通知

警报在 Director 的控制板和其他高级视图中显示,并带有警告和严重警报符号。警报适用于 Premium 许可站点。警报每分钟自动更新一次;您也可以按需更新警报。

Director 警报

警告警报(琥珀色三角形)表示已达到或超出条件的警告阈值。

严重警报(红色圆形)表示已达到或超出条件的严重阈值。

您可以通过从侧栏中选择警报、单击侧栏底部的“转到警报”链接或从 Director 页面顶部选择“警报”来查看有关警报的更多详细信息。

在“警报”视图中,您可以筛选和导出警报。例如,过去一个月内特定交付组的失败多会话操作系统计算机,或特定用户的所有警报。有关详细信息,请参阅导出报告

筛选警报

Citrix® 警报

Citrix 警报是在 Director 中监视的源自 Citrix 组件的警报。您可以在 Director 的“警报”>“Citrix 警报策略”中配置 Citrix 警报。作为配置的一部分,您可以设置当警报超出您设置的阈值时通过电子邮件将通知发送给个人和组。有关设置 Citrix 警报的详细信息,请参阅创建警报策略

注意:

确保您的防火墙、代理或 Microsoft Exchange Server 不会阻止电子邮件警报。

智能警报策略

一组具有预定义阈值的内置警报策略可用于交付组和多会话操作系统 VDA 范围。此功能需要 Delivery Controller 7.18 或更高版本。您可以在“警报”>“Citrix 警报策略”中修改内置警报策略的阈值参数。 当您的站点中至少定义了一个警报目标(交付组或多会话操作系统 VDA)时,将创建这些策略。此外,这些内置警报会自动添加到新的交付组或多会话操作系统 VDA 中。

如果您升级 Director 和您的站点,则会沿用您以前的 Director 实例中的警报策略。仅当 Monitor 数据库中不存在相应的警报规则时,才会创建内置警报策略。

有关内置警报策略的阈值,请参阅警报策略条件部分。

内置警报

高级警报策略

Director 的主动通知和警报功能已增强,包含一个名为“高级警报策略”的新警报框架。借助此功能,您可以通过为每个元素或条件添加精细详细信息来创建警报,从而增强对警报范围的控制。目前,这些策略包括成本节约和基础架构的警报。

通过引入高级警报策略(一种数据源驱动的警报),您可以使用多条件范围筛选。

此功能可帮助您减少过多的警报,这可能会导致响应能力下降或解决重要问题的效率降低。此策略有助于衡量警报策略的有效性和管理员的参与度。

您可以从“警报”>“高级警报策略”>“创建策略”部分创建高级警报策略。

您可以选择以下数据源之一:

  • 计算机
  • Provisioning Service
  • StoreFront™
  • Delivery Controller™

成本节约警报

您可以创建成本节约警报,以帮助您优化成本。目前,您可以为计算机创建警报。

要在计算机上创建警报,请执行以下操作:

  1. 单击“警报”选项卡 > “高级警报策略”。将显示“高级警报策略”页面。
  2. 单击“创建策略”。将显示“创建高级警报策略”部分。
  3. 从“数据源”下拉列表中选择“计算机”。将显示“成本节约”条件和相应的条件类型。

    Director 高级警报策略

  4. 根据需要选择以下条件类型:

    • 无法开机的电源管理计算机
    • 无法关机的电源管理计算机
    • 正常运行时间长的电源管理计算机
  5. 为每个选定的条件选择特定参数和相应的选项。
  6. 为选定的条件类型设置警告和严重指标:

    • 对于正常运行时间长的电源管理计算机:

      • 超过正常运行时间阈值的计算机数量
      • 重新警报间隔(分钟),间隔最短为 60 分钟
    • 对于无法开机和无法关机的电源管理计算机:

      • 超过正常运行时间阈值的计算机数量
      • 采样间隔(分钟),间隔可以是 30 分钟的倍数
      • 重新警报间隔(分钟),重新警报可以是 60 分钟的倍数
  7. 根据需要为选定的警报安排重新警报间隔。
  8. 定义警报的范围。
  9. 设置通知渠道。这可以是电子邮件或 Webhook。

    1. 您可以选择以下复选框:

      • 在 Webhook 中包含 JSON 有效负载作为附件
      • 在电子邮件中包含 CSV 文件作为附件

    有关详细信息,请参阅警报内容增强功能

  10. 输入“警报详细信息”,例如“警报名称”和“描述”(可选)。
  11. 单击“保存”。警报已创建。

基础架构监视警报

您可以创建警报来监视以下受支持的 Citrix Virtual Apps and Desktops™ 组件的运行状况:

  • Provisioning Service

    PVS 高级警报策略

  • StoreFront

    SF 高级警报策略

  • Delivery Controller

    DDC 高级警报策略

完成基础架构监视设置后,您可以使用 Director 中提供的运行状况数据为任何所需组件配置警报。管理员可以设置条件、范围和通知媒介,以通过电子邮件或通过 Webhook 的 JSON 有效负载接收重要警报。对于 Provisioning Service 和 Delivery Controller,您可以将警报范围选择为站点级别或单个服务器级别。例如,对于 Provisioning Service,如果您选择“所有 Provisioning Service”,则即使站点有两台服务器,您也只会收到整个站点的单个警报。这被视为站点级别警报。生成的警报也可在“Citrix 警报”部分中进行分析和管理。

作为新引入的基础架构策略的一部分,警报条件分为以下四个部分:

  • 可达性
  • 相关服务
  • 影响
  • 资源利用率

每个类别中的条件都可以根据您的组织优先级设置为“严重”和“警告”级别。您还可以为这些警报安排重新警报间隔。

您可以从“警报”>“Citrix 警报策略”部分创建基础架构策略。您可以选择所需的类别,然后为策略选择所需的条件。有关如何创建策略的详细信息,请参阅创建警报策略。创建策略后,您可以在Citrix 警报页面上编辑、删除或禁用该策略。

有关每个类别和组件中支持的条件的更多详细信息,请参阅以下内容:

以下数据通过电子邮件或在 Citrix 警报页面上作为警报接收:

字段 描述
客户 ID 站点的客户 ID。
警报级别 可能的值为“严重”和“警告”。
目标 触发警报的计算机名称。
时间 触发警报的时间。
范围 策略的范围。
策略 策略的名称。
描述 触发警报的问题描述。

定义策略的范围

您可以定义警报的范围并添加例外。警报仅针对选定的范围生成,使用添加例外排除的子范围不包含在警报生成中。此功能可帮助您在精细级别创建警报。

您可以通过电子邮件或 Webhook URL 创建通知。您还可以选择接收警报的首选语言。您还可以选择一个选项,以通过电子邮件接收 .CSV 文件附件中的警报参数,或通过 Webhook URL 接收 JSON 有效负载中的警报参数。附件包含所需参数的详细信息。有关详细信息,请参阅警报内容增强功能

以下数据通过电子邮件或在“Citrix 警报”页面上作为警报接收:

字段 描述
客户 ID 站点的客户 ID。
警报级别 此值是为每个警报条件设置的预定义值。可能的值为“严重”和“警告”。
条件 此值是创建策略时设置的条件。例如,未注册计算机的数量等于或大于 20。
目标 触发警报的交付组或站点名称。
站点 站点的名称。
范围 策略的范围。此值也包括子范围。
策略 策略的名称。
描述 触发警报的问题描述。

如何使用 PowerShell 脚本创建高级警报策略

用于创建警报策略的 PowerShell 脚本:

asnp Citrix.Monitor.*
# Add Parameters
$timeSpan = New-TimeSpan -Seconds 30
$alertThreshold = 1
$alarmThreshold = 2
# Add Target UID's
$targetIds = @()
$targetIds += "e9a211b4-a1f3-4f74-b6c7-85225902e997"
# Add email addresses
$emailaddress = @()
$emailaddress += "loki@abc.com"
# Create new policy
$policy = New-MonitorNotificationPolicy -Name "FailedMachinePercentageAlertCreationViaPowershell" -Description "Policy created to test urm" -Enabled $true
<!--NeedCopy-->

将以下行替换为 FailedMachinePercentage 的正确条件

Add-MonitorNotificationPolicyCondition -Uid $policy.Uid -ConditionType FailedMachinePercentage -AlertThreshold $alertThreshold -AlarmThreshold $alarmThreshold -AlertRenotification $timeSpan -AlarmRenotification $timeSpan

Add-MonitorNotificationPolicyTargets -Uid $policy.Uid -Scope "DG-Multisession" -TargetKind DesktopGroup -TargetIds $targetIds

$policy = Get-MonitorNotificationPolicy -Uid $policy.Uid
$policy
<!--NeedCopy-->

FailedMachinePercentage

从上图中可以看出,策略已创建,且 Uid 为 10。

将电子邮件添加到配置

Set-MonitorNotificationEmailServerConfiguration -ProtocolType SMTP -ServerName NameOfTheSMTPServerOrIPAddress -PortNumber 80 -SenderEmailAddress loki@abc.com -RequiresAuthentication 0
<!--NeedCopy-->

将电子邮件添加到策略

Add-MonitorNotificationPolicyEmailAddresses -Uid $policy.Uid -EmailAddresses $emailaddress -EmailCultureName "en-US"
<!--NeedCopy-->

添加电子邮件的示例脚本:

Add-MonitorNotificationPolicyEmailAddresses -Uid 10 -EmailAddresses $emailaddress -EmailCultureName "en-US"
<!--NeedCopy-->

PS add email

将 Webhook URL 添加到策略

Set-MonitorNotificationPolicy –Uid $polcy.Uid –Webhook 'URL'
<!--NeedCopy-->

PS add webhook

添加 Webhook URL 的示例脚本:

Set-MonitorNotificationPolicy –Uid 10  –Webhook  'https://hooks.slack.com/triggers/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'
<!--NeedCopy-->

获取创建的策略详细信息

Get-MonitorNotificationPolicy -Uid 10
<!--NeedCopy-->

PS Create Policy

创建警报策略

Director Alerts Policies

例如,要创建警报策略以在满足特定会话计数条件集时生成警报,请执行以下操作:

  1. 转至警报 > Citrix 警报策略,然后选择例如多会话操作系统策略。
  2. 单击创建
  3. 命名并描述策略,然后设置触发警报必须满足的条件。例如,为“峰值连接会话数”、“峰值断开连接会话数”和“峰值并发会话总数”指定警告和严重计数。警告值不得大于严重值。有关详细信息,请参阅警报策略条件
  4. 设置重新警报间隔。如果警报条件仍然满足,则警报将在此时间间隔后再次触发,并且(如果已在警报策略中设置)将生成电子邮件通知。已解除的警报不会在重新警报间隔时生成电子邮件通知。
  5. 设置范围。例如,为特定的交付组设置。
  6. 在“通知首选项”中,指定警报触发时必须通过电子邮件通知的人员。您必须在电子邮件服务器配置选项卡上指定电子邮件服务器,才能在警报策略中设置电子邮件通知首选项。

    1. 您还可以通过 .CSV 附件或 JSON 有效负载接收警报内容。为此,请选择以下复选框:

      • 在 Webhook 中包含 JSON 有效负载作为附件
      • 在电子邮件中包含 CSV 文件作为附件

    注意:

    目前,通过 .CSV 附件和 JSON 有效负载接收警报内容选项仅适用于少数警报。有关详细信息,请参阅警报内容增强功能

  7. 单击保存

在范围中定义 20 个或更多交付组的策略可能需要大约 30 秒才能完成配置。在此期间会显示一个微调器。

为多达 20 个唯一交付组(总共 1000 个交付组目标)创建 50 个以上的策略可能会导致响应时间增加(超过 5 秒)。

将包含活动会话的计算机从一个交付组移动到另一个交付组可能会触发使用计算机参数定义的错误交付组警报。

注意:

删除警报策略后,策略生成的警报通知可能需要长达 30 分钟才能停止。

警报内容增强功能

Director 的警报功能已增强,可包含 CSV 附件和 JSON 有效负载。通过此增强功能,您可以通过电子邮件以 CSV 附件形式或在存在 Webhook 时以 JSON 有效负载形式获取警报详细信息。使用此 CSV 附件或 JSON 有效负载,您可以接收详细级别的丰富内容,有助于快速识别和解决问题。

目前,此增强功能仅适用于以下警报:

  • 计算机正常运行时间
  • 电源开启操作失败
  • 电源关闭操作失败
  • 未注册的计算机 (%)

要使用此功能,请导航到警报并选择以下复选框:

  • 在 Webhook 中包含 JSON 有效负载作为附件
  • 在电子邮件中包含 CSV 文件作为附件

以下是Citrix 警报策略部分的屏幕截图:

Enhanced alert

以下是高级警报策略部分的屏幕截图:

Enhanced alert advanced

CSV 附件

下表提供了所有受支持警报的 .CSV 附件的列:

适用警报
计算机名称、IP 地址和交付组名称 计算机正常运行时间、电源关闭操作失败和电源开启操作失败以及未注册的计算机 (%)
当前注册状态、故障日期、故障状态和生命周期状态 未注册的计算机 (%)
上次电源操作失败原因、上次电源操作触发者、上次电源操作类型和上次电源操作完成日期 电源关闭操作失败和电源开启操作失败
电源状态、开机日期和总正常运行时间(分钟) 计算机正常运行时间

Webhook 有效负载

未注册的计算机百分比警报
{
  "text": "{\"Address\":\"<Webhook URL>\",\"NotificationId\":\"<NotificationGUID>\",\"NotificationState\":\"NotificationActive\",\"Priority\":\"<Critical/Warning>\",\"Target\":\"<DeliveryGroupName>\",\"Condition\":\"Unregistered machines (in %)\",\"Value\":\"<Value Set as Threshold>\",\"Timestamp\":\"<Timestamp string Eg: April 25, 2024 9:33 PM (UTC +5)>\",\"PolicyName\":\"<Alert Policy Name>\",\"Description\":\"<Alert Policy Description>\",\"Scope\":\"DeliveryGroup\",\"Site\":\"<Name of the Site>\",\"AttachmentData\":[{\"MachineName\":\"<Name of the Machine>\",\"IPAddress\":\"<IP Address>\",\"DeliveryGroupName\":\"<Name of the DeliveryGroup>\",\"CurrentRegistrationState\":\"Unregistered\",\"FailureDate\":\"<Date of Failure>\",\"FaultState\":\"<Fault State of the Machine>\",\"LifecycleState\":\"<Lifecycle state of the Machine>\"},{\"MachineName\":\"<Name of the Machine>\",\"IPAddress\":\"<IP Address>\",\"DeliveryGroupName\":\"<Name of the DeliveryGroup>\",\"CurrentRegistrationState\":\"Unregistered\",\"FailureDate\":\"<Date of Failure>\",\"FaultState\":\"<Fault State of the Machine>\",\"LifecycleState\":\"<Lifecycle state of the Machine>\"}]}"
}
<!--NeedCopy-->
电源开启操作失败警报
{
  "text": "{\"Address\":\"<Webhook URL>\",\"NotificationId\":\"<NotificationGUID>\",\"NotificationState\":\"NotificationActive\",\"Priority\":\"<Critical/Warning>\",\"Target\":\"<DeliveryGroupName>\",\"Condition\":\"Failure To PowerOn Action\",\"Value\":\"<Value Set as Threshold>\",\"Timestamp\":\"<Timestamp string Eg: April 25, 2024 9:33 PM (UTC +5)>\",\"PolicyName\":\"<Alert Policy Name>\",\"Description\":\"<Alert Policy Description>\",\"Scope\":\"DeliveryGroup\",\"Site\":\"<Name of the Site>\",\"AttachmentData\":[{\"MachineName\":\"<Name of the Machine>\",\"IPAddress\":\"<IP Address>\",\"DeliveryGroupName\":\"<Name of the DeliveryGroup>\",\"LastPowerActionFailureReason\":\"<HypervisorReportedFailure, HypervisorRateLimitExceeded, UnknownError, Power Action Type>\",\"LastPowerActionTriggeredBy\":\"<End-User, Administrator, Auto-Scale, Schedule>\",\"LastPowerActionType\":\"<PowerOn/PowerOff>\",\"LastPowerActionCompletedDate\":\"<Time string Eg: 2024-05-15T15:04:27.723>\"},{\"MachineName\":\"<Name of the Machine>\",\"IPAddress\":\"<IP Address>\",\"DeliveryGroupName\":\"<Name of the DeliveryGroup>\",\"LastPowerActionFailureReason\":\"<HypervisorReportedFailure, HypervisorRateLimitExceeded, UnknownError, Power Action Type>\",\"LastPowerActionTriggeredBy\":\"<End-User, Administrator, Auto-Scale, Schedule>\",\"LastPowerActionType\":\"<PowerOn/PowerOff>\",\"LastPowerActionCompletedDate\":\"<Time string Eg: 2024-05-15T15:04:27.723>\"}]}"
}
<!--NeedCopy-->
电源关闭操作失败警报
{
  "text": "{\"Address\":\"<Webhook URL>\",\"NotificationId\":\"<NotificationGUID>\",\"NotificationState\":\"NotificationActive\",\"Priority\":\"<Critical/Warning>\",\"Target\":\"<DeliveryGroupName>\",\"Condition\":\"Failure To PowerOff Action\",\"Value\":\"<Value Set as Threshold>\",\"Timestamp\":\"<Timestamp string Eg: April 25, 2024 9:33 PM (UTC +5)>\",\"PolicyName\":\"<Alert Policy Name>\",\"Description\":\"<Alert Policy Description>\",\"Scope\":\"DeliveryGroup\",\"Site\":\"<Name of the Site>\",\"AttachmentData\":[{\"MachineName\":\"<Name of the Machine>\",\"IPAddress\":\"<IPV4 Address of the Machine>\",\"DeliveryGroupName\":\"<Name of the DeliveryGroup>\",\"LastPowerActionFailureReason\":\"<HypervisorReportedFailure,HypervisorRateLimitExceeded,UnknownError,Power Action Type>\",\"LastPowerActionTriggeredBy\":\"<End-User,Administrator,Auto-Scale,Schedule>\",\"LastPowerActionType\":\"<PowerOn/PowerOff>\",\"LastPowerActionCompletedDate\":\"<Time string Eg: 2024-05-15T15:04:27.723>\"},{\"MachineName\":\"<Name of the Machine>\",\"IPAddress\":\"<IPV4 Address of the Machine>\",\"DeliveryGroupName\":\"<Name of the DeliveryGroup>\",\"LastPowerActionFailureReason\":\"<HypervisorReportedFailure,HypervisorRateLimitExceeded,UnknownError,Power Action Type>\",\"LastPowerActionTriggeredBy\":\"<End-User,Administrator,Auto-Scale,Schedule>\",\"LastPowerActionType\":\"<PowerOn/PowerOff>\",\"LastPowerActionCompletedDate\":\"<Time string Eg: 2024-05-15T15:04:27.723>\"}]}"
}

<!--NeedCopy-->
计算机正常运行时间警报
{
  "text": "{\"Address\":\"<Webhook URL>\",\"NotificationId\":\"<NotificationGUID>\",\"NotificationState\":\"NotificationActive\",\"Priority\":\"<Critical/Warning>\",\"Target\":\"<DeliveryGroupName>\",\"Condition\":\"Machine Uptime Alert\",\"Value\":\"<Value Set as Threshold>\",\"Timestamp\":\"<Timestamp string Eg: April 25, 2024 9:33 PM (UTC +5)>\",\"PolicyName\":\"<Alert Policy Name>\",\"Description\":\"<Alert Policy Description>\",\"Scope\":\"DeliveryGroup\",\"Site\":\"<Name of the Site>\",\"AttachmentData\":[{\"MachineName\":\"<Name of the Machine>\",\"IPAddress\":\"<IP Address>\",\"DeliveryGroupName\":\"<Name of the DeliveryGroup>\",\"PowerState\":\"<On/Off>\",\"PoweredOnDate\":\"2024-05-15T15:04:27.723\",\"TotalUptimeInMinutes\":180},{\"MachineName\":\"<Name of the Machine>\",\"IPAddress\":\"<IP Address>\",\"DeliveryGroupName\":\"<Name of the DeliveryGroup>\",\"PowerState\":\"<ON/OFF>\",\"PoweredOnDate\":\"2024-05-15T15:04:27.723\",\"TotalUptimeInMinutes\":\"<Uptime Duration>\"}]}"
}

<!--NeedCopy-->

警报策略条件

下面列出了警报类别、建议的警报缓解措施以及(如果已定义)内置策略条件。内置警报策略的警报和重新警报间隔为 60 分钟。

峰值连接会话数

  • 检查 Director 会话趋势视图以查看峰值连接会话数。
  • 检查以确保有足够的容量来适应会话负载。
  • 如果需要,添加新计算机

峰值断开连接会话数

  • 检查 Director 会话趋势视图以查看峰值断开连接会话数。
  • 检查以确保有足够的容量来适应会话负载。
  • 如果需要,添加新计算机。
  • 如果需要,注销断开连接的会话

峰值并发会话总数

  • 检查 Director 中的 Director 会话趋势视图以查看峰值并发会话数。
  • 检查以确保有足够的容量来适应会话负载。
  • 如果需要,添加新计算机。
  • 如果需要,注销断开连接的会话

CPU

CPU 使用率百分比表示 VDA 上的整体 CPU 消耗,包括进程的 CPU 消耗。您可以从相应 VDA 的计算机详细信息页面获取有关单个进程 CPU 利用率的更多信息。

  • 转至计算机详细信息 > 查看历史利用率 > 前 10 个进程,识别消耗 CPU 的进程。确保已启用进程监视策略以启动进程级别资源使用情况统计信息的收集。
  • 如有必要,终止进程。
  • 终止进程会导致未保存的数据丢失。
  • 如果一切正常,将来添加额外的 CPU 资源。

    注意:

    默认情况下,启用资源监视策略设置允许监视具有 VDA 的计算机上的 CPU 和内存性能计数器。如果禁用此策略设置,则不会触发具有 CPU 和内存条件的警报。有关详细信息,请参阅监视策略设置

    智能策略条件:

    • 范围: 交付组、多会话操作系统范围
    • 阈值: 警告 - 80%,严重 - 90%

内存

内存使用率百分比表示 VDA 上的整体内存消耗,包括进程的内存消耗。您可以从相应 VDA 的计算机详细信息页面获取有关单个进程内存使用情况的更多信息。

  • 转至计算机详细信息 > 查看历史利用率 > 前 10 个进程,识别消耗内存的进程。确保已启用进程监视策略以启动进程级别资源使用情况统计信息的收集。
  • 如有必要,终止进程。
  • 终止进程会导致未保存的数据丢失。
  • 如果一切正常,将来添加额外的内存。

    注意:

    默认情况下,启用资源监视策略设置允许监视具有 VDA 的计算机上的 CPU 和内存性能计数器。如果禁用此策略设置,则不会触发具有 CPU 和内存条件的警报。有关详细信息,请参阅监视策略设置

    智能策略条件:

    • 范围: 交付组、多会话操作系统范围
    • 阈值: 警告 - 80%,严重 - 90%

连接失败率

过去一小时内连接失败的百分比。

  • 根据总失败数与尝试连接总数的比率计算。
  • 检查 Director 连接失败趋势视图以查看从配置日志记录的事件。
  • 确定应用程序或桌面是否可访问。

连接失败计数

过去一小时内连接失败的次数。

  • 检查 Director 连接失败趋势视图以查看从配置日志记录的事件。
  • 确定应用程序或桌面是否可访问。

ICA® RTT(平均值)

平均 ICA 往返时间。

  • 检查 Citrix ADM 以获取 ICA RTT 的详细信息,从而确定根本原因。有关详细信息,请参阅 Citrix ADM 文档。
  • 如果 Citrix ADM 不可用,请在 Director 用户详细信息视图中检查 ICA RTT 和延迟,并确定是网络问题还是应用程序或桌面问题。

ICA RTT(会话数)

超出阈值 ICA 往返时间的会话数。

  • 检查 Citrix ADM 以获取 ICA RTT 较高的会话数。有关详细信息,请参阅 Citrix ADM 文档。
  • 如果 Citrix ADM 不可用,请与网络团队协作以确定根本原因。

    智能策略条件:

    • 范围: 交付组、多会话操作系统范围
    • 阈值: 警告 - 5 个或更多会话的 300 ms,严重 - 10 个或更多会话的 400 ms

ICA RTT(会话百分比)

超出平均 ICA 往返时间的会话百分比。

  • 检查 Citrix ADM 以获取 ICA RTT 较高的会话数。有关详细信息,请参阅 Citrix ADM 文档。
  • 如果 Citrix ADM 不可用,请与网络团队协作以确定根本原因。

ICA RTT(用户)

应用于指定用户启动的会话的 ICA 往返时间。如果至少一个会话中的 ICA RTT 大于阈值,则会触发警报。

失败的计算机(单会话操作系统)

失败的单会话操作系统计算机数量。故障可能由于各种原因而发生,如 Director 控制板和筛选器视图中所示。

  • 运行 Citrix Scout 诊断程序以确定根本原因。

    智能策略条件:

    • 范围: 交付组、多会话操作系统范围
    • 阈值: 警告 - 1,严重 - 2

失败的计算机(多会话操作系统)

失败的多会话操作系统计算机数量。故障可能由于各种原因而发生,如 Director 控制板和筛选器视图中所示。

  • 运行 Citrix Scout 诊断程序以确定根本原因。

    智能策略条件:

    • 范围: 交付组、多会话操作系统范围
    • 阈值: 警告 - 1,严重 - 2

失败的计算机(百分比)

交付组中失败的单会话和多会话操作系统计算机的百分比,根据失败计算机的数量计算。此警报条件允许您将警报阈值配置为交付组中失败计算机的百分比,并每 30 秒计算一次。 故障可能由于各种原因而发生,如 Director 控制板和筛选器视图中所示。运行 Citrix Scout 诊断程序以确定根本原因。有关详细信息,请参阅解决用户问题

失败的开机操作和失败的关机操作

交付组中失败的开机操作数和失败的关机操作数,根据未能开机或关机的电源管理计算机数量计算。此警报条件允许您将警报阈值配置为交付组中未能开机或关机的电源管理计算机数量,并每 30 分钟计算一次。

管理员可以在高级警报策略中为这些警报配置以下参数:

  • 触发者:触发电源操作的原因
  • 失败原因:操作失败的原因
  • 阈值:触发策略的失败电源操作的计算机数量阈值
  • 采样间隔:检查失败电源操作的间隔
  • 重新警报间隔:重新发送警报所需的时间

故障可能由于各种原因而发生,如 Director 控制板和筛选器视图中所示。运行 Citrix Scout 诊断程序以确定根本原因。有关详细信息,请参阅解决用户问题

未注册的计算机(百分比)

当计算机因重新启动而变得不稳定或交付控制器与虚拟机之间存在通信问题时,该计算机被视为未注册。未注册的计算机(百分比)是交付组中未注册的单会话和多会话操作系统计算机的百分比,根据未注册计算机的数量计算。此警报条件允许您将警告和严重阈值配置为交付组中未注册计算机的百分比。您可以设置重新警报的间隔。您还可以添加电子邮件以在满足未注册的计算机(百分比)条件时收到通知。当超出严重或警告阈值时,将生成警报和电子邮件。您可以在Citrix Alerts下查看警报。您可以按未注册的计算机(百分比)类别以及所需的州和时间进行筛选。

如果存在电子邮件,您还可以通过 CSV 附件接收警报详细信息;如果存在 Webhook,则可以通过 JSON 有效负载接收警报详细信息。

注意:

严重值必须大于警告值。

策略条件:

  • 范围:单会话操作系统和多会话操作系统交付组
  • 阈值:警告和严重

计算机正常运行时间警报

交付组中的计算机正常运行时间是根据交付组中计算机每天、每周或每月开机的小时数计算的。此警报条件允许您将警报阈值配置为交付组中计算机开机的小时数。计算机正常运行时间警报的工作方式如下:

  • 每天小时数 - 您可以指定计算机每天开机的小时数,并每 30 分钟计算一次。您可以设置的最大每天小时数为 24 小时。
  • 每周小时数 - 您可以指定计算机每周开机的小时数,并每六小时计算一次。您可以设置的最大每周小时数为 168 小时。
  • 每月小时数 - 您可以指定计算机每月开机的小时数,并每天计算一次。最大每月小时数为 720 小时。 您可以设置的最小重新警报间隔值为 60 分钟。您可以在“警告”和“严重”警报部分下输入超出计算机正常运行时间阈值的计算机数量。您还可以为任何计算机添加例外。

例如,如果为此警报添加了五个交付组,并且在第一个交付组和第四个交付组中,计算机数量超出了警告或严重阈值,则会分别为第一个交付组和第四个交付组触发警报。

此警报可帮助管理员分析计算机的正常运行时间,并根据此分析帮助管理员优化成本。如果存在电子邮件,您还可以通过 CSV 附件接收警报详细信息;如果存在 Webhook,则可以通过 JSON 有效负载接收警报详细信息。

平均登录持续时间

过去一小时内发生的登录的平均登录持续时间。

  • 检查 Director 控制板以获取有关登录持续时间的最新指标。许多用户在短时间内登录可能会增加登录持续时间。
  • 检查登录的基线和细分以缩小原因。有关详细信息,请参阅诊断用户登录问题

    智能策略条件:

    • 范围: 交付组、多会话操作系统范围
    • 阈值: 警告 - 45 秒,严重 - 60 秒

登录持续时间(用户)

过去一小时内发生的指定用户的登录持续时间。

负载评估器指数

过去 5 分钟内负载评估器指数的值。

  • 检查 Director 中可能具有峰值负载(最大负载)的多会话操作系统计算机。查看控制板(故障)和趋势负载评估器指数报告。

    智能策略条件:

    • 范围: 交付组、多会话操作系统范围
    • 阈值: 警告 - 80%,严重 - 90%

使用 Webhook 配置警报策略

除了电子邮件通知,您还可以使用 Webhook 配置警报策略。

注意: 此功能需要 Delivery Controller 7.11 或更高版本。

您可以使用 PowerShell cmdlet 配置带有 HTTP 回调或 HTTP POST 的警报策略。它们已扩展为支持 Webhook。

有关创建新的 Octoblu 工作流和获取相应 Webhook URL 的信息,请参阅 Octoblu Developer Hub

要为新的警报策略或现有策略配置 Webhook URL,请使用以下 PowerShell cmdlet。

使用 Webhook URL 创建新的警报策略:

$policy = New-MonitorNotificationPolicy -Name <Policy name> -Description <Policy description> -Enabled $true -Webhook <Webhook URL>
<!--NeedCopy-->

将 Webhook URL 添加到现有警报策略:

Set-MonitorNotificationPolicy - Uid <Policy id> -Webhook <Webhook URL>
<!--NeedCopy-->

有关 PowerShell 命令的帮助,请使用 PowerShell 帮助,例如:

Get-Help  <Set-MonitorNotificationPolicy>
<!--NeedCopy-->

警报策略生成的通知会通过 POST 调用触发 Webhook 到 Webhook URL。POST 消息包含 JSON 格式的通知信息:

{"NotificationId" : \<Notification Id\>,

"Target" : \<Notification Target Id\>,

"Condition" : \<Condition that was violated\>,

"Value" : \<Threshold value for the Condition\>,

"Timestamp": \<Time in UTC when notification was generated\>,

"PolicyName": \<Name of the Alert policy\>,

"Description": \<Description of the Alert policy\>,

"Scope" : \<Scope of the Alert policy\>,

"NotificationState": \<Notification state critical, warning, healthy or dismissed\>,

"Site" : \<Site name\>}
<!--NeedCopy-->

批量解除警报

此功能优化了管理员的警报管理流程,提供了灵活性并减少了警报疲劳。管理员可以根据时间、类型或类别批量解除警报,从而简化了维护期间或处理虚拟机管理程序和其他环境时的警报管理。

批量解除警报有助于管理员高效管理其工作负载,并防止他们被大量警报淹没。

批量消除警报的步骤

  1. 导航到警报 > Citrix Alerts 选项卡。将显示警报。

    批量警报

  2. 类别状态时间段中选择一个选项,以筛选要消除的警报。将显示特定警报。
  3. 选中特定警报旁边的复选框,或选中顶部的复选框以选择所有警报。
  4. 单击消除。将出现一条通知,确认警报已消除。
  5. 单击。选定的警报被标记为已消除,并且警报的状态会相应更新。

使用 PowerShell SDK 配置 Webhook

使用 PowerShell SDK 的 Webhook 配置功能允许管理员创建、修改、删除和列出 Webhook 配置文件。此功能通过允许指定标头、身份验证类型、内容类型、有效负载和 Webhook URL,提供了配置 Webhook 的灵活性。

注意:

支持的有效负载格式为文本,最终用户必须在其 Webhook 中启用文本。

最新的有效负载格式为:

{"text": "This is a message from a Webex incoming webhook."}
<!--NeedCopy-->

创建 Webhook

您可以使用以下示例 PowerShell 命令创建 Webhook 配置文件:

创建不带授权标头的 Webhook:

$headers = [System.Collections.Generic.Dictionary[string,string]]::new()

$headers.Add("Content-Type", "application/json")

$payloads = '{ "text": "$PAYLOAD" }'

$url = "<Fill this field with the required URL>"

Add-MonitorWebhookProfile -Name "profile_slack" -Description "webhook profile for slack" -Url $url -Headers $headers -PayloadFormat $payloads
<!--NeedCopy-->

创建带授权标头的 Webhook:

$headers = [System.Collections.Generic.Dictionary[string,string]]::new()

$headers.Add("Content-Type", "application/json")

$headers.Add("Authorization", "Basic <Fill this field with the authorization token>")

$payloads = '{ "text": "$PAYLOAD" }'

$url = "<Fill this field with the required URL>"

Add-MonitorWebhookProfile -Name "profile_azure" -Description "webhook profile for azure function with Authentication" -Url $url -Headers $headers -PayloadFormat $payloads 
<!--NeedCopy-->

创建配置文件后,您可以在数据库中对其进行检查。此外,您可以在 Citrix Alerts 页面中找到新创建的 Webhook 配置文件。

Webhook 配置文件

更新 Webhook 配置文件

您可以使用以下示例 PowerShell 命令更新 Webhook 配置文件:

$headers = [System.Collections.Generic.Dictionary[string,string]]::new()

$headers.Add("Content-Type", "application/json")

$payloads = '{ "text": "$PAYLOAD" }'

$url =  "<Fill this field with the required URL>"

Set-MonitorWebhookProfile -Uid 1  -Name "profile_slack_citrix" -Description "webhook profile for citrix slack" -Url $url -Headers $headers -PayloadFormat $payloads
<!--NeedCopy-->

获取所有 Webhook 配置文件列表

您可以使用以下示例 PowerShell 命令获取所有可用 Webhook 配置文件列表:

Get-MonitorWebhookProfile

Get-MonitorWebhookProfile -Name 'profile_msteams'

Get-MonitorWebhookProfile -Uid 1
<!--NeedCopy-->

删除 Webhook 配置文件

您可以使用以下示例 PowerShell 命令删除 Webhook 配置文件:

Remove-MonitorWebhookProfile -Uid 1
<!--NeedCopy-->

注意:

如果 Webhook 配置文件已映射到任何策略,则无法将其删除。作为一种解决方法,您必须首先从策略中删除 Webhook 映射。

创建带 Webhook 配置文件的策略

您可以使用以下示例 PowerShell 命令创建带 Webhook 配置文件的策略:

New-MonitorNotificationPolicy -Name "Policy1" -Description "Policy Description" -Enabled $true -WebhookProfileId 1
<!--NeedCopy-->

更新带 Webhook 配置文件的策略

您可以使用以下示例 PowerShell 命令更新带 Webhook 配置文件的策略:

$Policy = Set-MonitorNotificationPolicy -Uid 1 -WebhookProfileId 1
<!--NeedCopy-->

从策略中删除 Webhook 映射

您可以使用以下示例 PowerShell 命令从策略中删除 Webhook 配置文件:

$Policy = Set-MonitorNotificationPolicy -Uid 1 -WebhookProfileId 0 
<!--NeedCopy-->

测试 Webhook 配置文件

您可以使用以下示例 PowerShell 命令测试 Webhook 配置文件:

$headers = [System.Collections.Generic.Dictionary[string,string]]::new()

$headers.Add("Content-Type", "application/json")

$headers.Add("Authorization", "Basic <Fill this with authorization token>")

$payloads = '{ "text": "$PAYLOAD" }'

$url ="<Fill this field with the required URL>"

Test-MonitorWebhookProfile -Url $url -Headers $headers -PayloadFormat $payloads
<!--NeedCopy-->

管理程序警报监控

Director 显示警报以监控管理程序运行状况。来自 XenServer® 和 VMware vSphere 的警报有助于监控管理程序参数和状态。还会监控与管理程序的连接状态,以便在主机群集或池重新启动或不可用时提供警报。

管理程序警报筛选器

要接收管理程序警报,请确保在 Web Studio 中创建了托管连接。有关详细信息,请参阅连接和资源。只有这些连接会受到管理程序警报的监控。

达到或超出阈值后,将显示这些警报。管理程序警报可以是:

  • 严重 — 达到或超出管理程序警报策略的严重阈值
  • 警告 — 达到或超出管理程序警报策略的警告阈值
  • 已消除 — 警报不再显示为活动警报

管理程序警报显示

此功能需要 Delivery Controller 7 1811 或更高版本。如果您使用的是 Director 的旧版本,但站点版本为 7 1811 或更高版本,则仅显示管理程序警报计数。要查看警报,您必须升级 Director。

下表描述了管理程序警报的各种参数和状态。

警报 支持的管理程序 触发者 条件 配置
CPU 使用率 XenServer、VMware vSphere 管理程序 达到或超出 CPU 使用率警报阈值 必须在管理程序中配置警报阈值。
内存使用率 XenServer、VMware vSphere 管理程序 达到或超出内存使用率警报阈值 必须在管理程序中配置警报阈值。
网络使用率 XenServer、VMware vSphere 管理程序 达到或超出网络使用率警报阈值 必须在管理程序中配置警报阈值。
磁盘使用率 VMware vSphere 管理程序 达到或超出磁盘使用率警报阈值 必须在管理程序中配置警报阈值。
主机连接或电源状态 VMware vSphere 管理程序 管理程序主机已重新启动或不可用 警报在 VMware vSphere 中预构建。无需额外配置。
管理程序连接不可用 XenServer、VMware vSphere Delivery Controller 与管理程序(池或群集)的连接丢失、断电或重新启动。只要连接不可用,此警报就会每小时生成一次。 警报在 Delivery Controller 中预构建。无需额外配置。

注意:

有关配置警报的详细信息,请参阅 Citrix XenCenter Alerts 或查看 VMware vCenter Alerts 文档。

可以在 Citrix Alerts Policy > Site Policy > Hypervisor Health 下配置电子邮件通知首选项。管理程序警报策略的阈值条件只能在管理程序中配置、编辑、禁用或删除,而不能在 Director 中进行。但是,可以在 Director 中修改电子邮件首选项和消除警报。如果您的角色不涉及基础结构监控,则可以禁用警报。

重要提示:

  • 管理程序触发的警报会在 Director 中获取并显示。但是,管理程序警报生命周期/状态的更改不会反映在 Director 中。
  • 在管理程序控制台中处于正常、已消除或已禁用状态的警报会继续在 Director 中显示,并且必须明确消除。
  • 在 Director 中消除的警报不会在管理程序控制台中自动消除。

改进了对垂直和水平负载平衡警报的处理

以前,当您将 UseVerticalScalingForRdsLaunches 设置为 true 并在 Studio 中配置“最大会话数”策略时,计算机将进入“最大容量”状态。无论限制是由于垂直负载平衡还是水平负载平衡而达到,Director 都会触发“最大容量”警报。在遇到特定错误(例如“达到最大负载”)时,无法区分垂直负载平衡和水平负载平衡。这导致在垂直扩展场景中出现不必要的警报,浪费您的时间并造成混淆。

现在,当垂直负载平衡处于活动状态且计算机达到其会话限制时,它将进入新状态:“垂直扩展的最大容量”。Director 不再为此新状态生成警报。警报仅在水平扩展场景中针对“最大容量”触发。您可以在“筛选器”和“自定义报告”页面中查看新状态,从而更容易区分预期条件和异常条件。此增强功能可帮助您避免不必要的警报并专注于实际问题,从而简化监控和故障排除。它适用于您使用 Set-BrokerSite 配置 UseVerticalScalingForRdsLaunches 并在 Studio 中设置“最大会话数”策略的情况。

警报和通知