警报和通知功能

警报在 Director 的控制板和其他高级视图中显示,带有警告和严重警报符号。警报适用于 Premium 许可站点。警报每分钟自动更新;您也可以按需更新警报。

监控控制台警报

警告警报(琥珀色三角形)表示已达到或超出某个条件的警告阈值。

严重警报(红色圆圈)表示已达到或超出某个条件的严重阈值。

您可以通过从侧边栏中选择警报、单击侧边栏底部的转到警报链接或从 Director 页面顶部选择警报来查看有关警报的更多详细信息。

在“警报”视图中,您可以筛选和导出警报。例如,过去一个月内特定交付组的失败多会话操作系统计算机,或特定用户的所有警报。有关详细信息,请参阅导出报告

筛选警报

思杰® 警报

Citrix 警报是在 Director 中监控的、源自 Citrix 组件的警报。您可以在 Director 的警报 > Citrix 警报策略中配置 Citrix 警报。作为配置的一部分,您可以设置当警报超出您设置的阈值时,通过电子邮件向个人和组发送通知。有关设置 Citrix 警报的详细信息,请参阅创建警报策略

注意:

确保您的防火墙、代理或 Microsoft Exchange Server 不会阻止电子邮件警报。

智能警报策略

交付组和多会话操作系统 VDA 范围提供了一组具有预定义阈值值的内置警报策略。此功能需要 Delivery Controller 7.18 或更高版本。您可以在警报 > Citrix 警报策略中修改内置警报策略的阈值参数。 当您的站点中定义了至少一个警报目标(交付组或多会话操作系统 VDA)时,将创建这些策略。此外,这些内置警报会自动添加到新的交付组或多会话操作系统 VDA 中。

如果您升级 Director 和您的站点,则您之前 Director 实例中的警报策略将保留。仅当监控数据库中不存在相应的警报规则时,才会创建内置警报策略。

有关内置警报策略的阈值,请参阅警报策略条件部分。

内置警报

高级警报策略

Director 的主动通知和警报功能已增强,以包含一个名为 高级警报策略 的新警报框架。借助此功能,您可以通过为每个元素或条件包含精细详细信息来创建警报,从而增强对警报范围的控制。目前,这些策略包括成本节约和基础架构的警报。

随着高级警报策略(一种数据源驱动的警报)的引入,您可以使用多条件范围筛选。

此功能可帮助您减少过多的警报,这些警报可能会导致响应能力或解决重要问题的效率降低。此策略有助于衡量警报策略的有效性以及管理员的参与度。

您可以从 警报 > 高级警报策略 > 创建策略 部分创建高级警报策略。

您可以选择以下数据源之一:

  • 计算机
  • 资源调配服务
  • 店面™
  • 交付控制器™

成本节约警报

您可以创建成本节约警报,以帮助您优化成本。目前,您可以为计算机创建警报。

要在计算机上创建警报,请执行以下操作:

  1. 单击警报选项卡 > 高级警报策略。随即显示高级警报策略页面。
  2. 单击创建策略。随即显示创建高级警报策略部分。
  3. 从“数据源”下拉列表中选择计算机。随即显示“成本节约”条件和相应的条件类型。

    Director 高级警报策略

  4. 根据需要选择以下条件类型:

    • 电源管理计算机未能开机
    • 电源管理计算机未能关机
    • 正常运行时间长的电源管理计算机
  5. 针对每个选定的条件,选择其特定的参数和对应的选项。
  6. 为选定的条件类型设置“警告”和“严重”指标:

    • 对于正常运行时间长的电源管理计算机:

      • 超出正常运行时间阈值的计算机数量
      • 重新警报间隔(以分钟为单位),最小间隔为 60 分钟
    • 对于未能开机的电源管理计算机和未能关机的电源管理计算机:

      • 超出正常运行时间阈值的计算机数量
      • 采样间隔(分钟)可以是 30 分钟的倍数
      • 重新警报间隔(分钟)可以是 60 分钟的倍数
  7. 根据需要为选定的警报安排重新警报间隔。
  8. 定义警报的范围。
  9. 设置通知渠道。这可以是电子邮件或 Webhook。

    1. 您可以选择以下复选框:

      • 在 Webhook 中包含 JSON 有效负载作为附件
      • 在电子邮件中包含 CSV 文件作为附件

    有关详细信息,请参阅警报内容增强功能

  10. 输入警报详细信息,例如警报名称描述(可选)。
  11. 单击保存。警报已创建。

用于基础架构监控的警报

您可以创建警报来监控以下受支持的 Citrix Virtual Apps and Desktops™ 组件的运行状况:

  • 资源调配服务

    PVS 高级警报策略

  • 思杰店面

    SF 高级警报策略

  • 交付控制器

    DDC 高级警报策略

完成基础架构监控设置后,您可以使用 Director 中可用的运行状况数据为任何所需组件配置警报。管理员可以设置条件、范围和通知媒介,以通过电子邮件或通过 Webhook 接收 JSON 有效负载来接收重要警报。对于 Provisioning Service 和 Delivery Controller,您可以将警报范围选择为站点级别或单个服务器级别。例如,对于 Provisioning Service,如果您选择“所有 Provisioning Service”,则即使站点有两台服务器,您也只会收到整个站点的单个警报。这被视为站点级警报。触发的警报也可在Citrix Alerts部分中进行分析和管理。

作为新引入的基础架构策略的一部分,警报条件分为以下四个部分:

  • 可达性
  • 依赖的服务
  • 影响
  • 资源利用率

每个类别中的条件可以根据您的组织优先级设置为严重警告级别。您还可以为这些警报安排重新警报间隔。

您可以从警报 > Citrix 警报策略部分创建基础架构策略。您可以选择所需的类别,然后为策略选择所需的条件。有关如何创建策略的更多信息,请参阅创建警报策略。策略创建后,您可以在Citrix Alerts页面上编辑、删除或禁用该策略。

有关每个类别和组件支持的条件的更多详细信息,请参阅以下内容:

以下数据将通过电子邮件或在 Citrix 警报页面上作为警报接收:

字段 详细描述
客户 ID 站点的客户 ID。
警报级别 可能的值为“严重”和“警告”。
目标 当警报被触发时,所涉及的计算机的名称。
时间 警报被触发的具体时间。
范围 策略的范围。
策略 策略的名称。
描述信息 此描述详细说明了导致警报被触发的具体问题。

定义策略的适用范围

您可以定义警报的范围并添加例外。警报仅针对选定的范围生成,使用添加例外排除的子范围不包括在警报生成中。此功能可帮助您在精细级别创建警报。

您可以通过电子邮件或 webhook URL 创建通知。您还可以选择接收警报的首选语言。您还可以选择一个选项,通过电子邮件以 .CSV 文件附件形式接收警报参数,或通过 webhook URL 以 JSON 有效负载形式接收警报参数。附件包含所需参数的详细信息。有关更多信息,请参阅 警报内容的增强功能

以下数据将作为警报通过电子邮件或在 Citrix Alerts 页面上接收:

字段 描述信息
客户 ID 站点的客户 ID。
警报级别 此值是为每个警报条件设置的预定义值。可能的值为“严重”和“警告”。
条件说明 此值是创建策略时设置的条件。例如,未注册计算机的数量等于或多于 20。
目标 警报将在此处触发的交付组或站点的名称。
站点 站点的名称。
范围 策略的范围。此值也包括子范围。
策略 策略的名称。
描述信息 关于触发此警报的问题的详细描述。

如何使用 PowerShell 脚本创建高级警报策略

用于创建警报策略的 PowerShell 脚本:

asnp Citrix.Monitor.*
# Add Parameters
$timeSpan = New-TimeSpan -Seconds 30
$alertThreshold = 1
$alarmThreshold = 2
# Add Target UID's
$targetIds = @()
$targetIds += "e9a211b4-a1f3-4f74-b6c7-85225902e997"
# Add email addresses
$emailaddress = @()
$emailaddress += "loki@abc.com"
# Create new policy
$policy = New-MonitorNotificationPolicy -Name "FailedMachinePercentageAlertCreationViaPowershell" -Description "Policy created to test urm" -Enabled $true
<!--NeedCopy-->

Replace the following line with the correct condition for FailedMachinePercentage

Add-MonitorNotificationPolicyCondition -Uid $policy.Uid -ConditionType FailedMachinePercentage -AlertThreshold $alertThreshold -AlarmThreshold $alarmThreshold -AlertRenotification $timeSpan -AlarmRenotification $timeSpan

Add-MonitorNotificationPolicyTargets -Uid $policy.Uid -Scope "DG-Multisession" -TargetKind DesktopGroup -TargetIds $targetIds

$policy = Get-MonitorNotificationPolicy -Uid $policy.Uid
$policy
<!--NeedCopy-->

故障计算机百分比

从上图中,您可以看到策略已创建,并且 Uid 为 10。

将电子邮件添加到配置

Set-MonitorNotificationEmailServerConfiguration -ProtocolType SMTP -ServerName NameOfTheSMTPServerOrIPAddress -PortNumber 80 -SenderEmailAddress loki@abc.com -RequiresAuthentication 0
<!--NeedCopy-->

将电子邮件添加到策略

Add-MonitorNotificationPolicyEmailAddresses -Uid $policy.Uid -EmailAddresses $emailaddress -EmailCultureName "en-US"
<!--NeedCopy-->

添加电子邮件的示例脚本:

Add-MonitorNotificationPolicyEmailAddresses -Uid 10 -EmailAddresses $emailaddress -EmailCultureName "en-US"
<!--NeedCopy-->

PS 添加电子邮件

将 Webhook 网址添加到策略

Set-MonitorNotificationPolicy –Uid $polcy.Uid –Webhook 'URL'
<!--NeedCopy-->

PS 添加 Web 钩子

添加 Webhook URL 的示例脚本:

Set-MonitorNotificationPolicy –Uid 10  –Webhook  'https://hooks.slack.com/triggers/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'
<!--NeedCopy-->

获取已创建的策略详细信息

Get-MonitorNotificationPolicy -Uid 10
<!--NeedCopy-->

PS 创建策略

创建警报策略

Director 警报和通知策略

例如,要创建警报策略以在满足特定会话计数条件集时生成警报,请执行以下操作:

  1. 转到“警报”>“Citrix 警报策略”,然后选择(例如)“多会话操作系统策略”。
  2. 单击“创建”。
  3. 命名并描述策略,然后设置触发警报必须满足的条件。例如,为“峰值连接会话”、“峰值断开连接会话”和“峰值并发总会话”指定“警告”和“严重”计数。“警告”值不得大于“严重”值。有关详细信息,请参阅警报策略条件
  4. 设置重新警报间隔。如果警报条件仍然满足,警报将在此时间间隔再次触发,并且(如果已在警报策略中设置)将生成电子邮件通知。已解除的警报不会在重新警报间隔生成电子邮件通知。
  5. 设置范围。例如,为特定的交付组设置。
  6. 在通知首选项中,指定警报触发时谁必须通过电子邮件收到通知。您必须在电子邮件服务器配置选项卡上指定电子邮件服务器,才能在警报策略中设置电子邮件通知首选项。

    1. 您还可以通过 .CSV 附件或 json 有效负载接收警报内容。为此,请选择以下复选框:

      • 在 Webhook 中将 json 有效负载作为附件包括在内
      • 在电子邮件中将 csv 文件作为附件包括在内

    注意:

    目前,通过 .CSV 附件和 json 有效负载接收警报内容的选项仅适用于少数警报。有关详细信息,请参阅警报内容增强功能

  7. 单击保存

创建在范围中定义了 20 个或更多交付组的策略可能需要大约 30 秒才能完成配置。在此期间会显示一个加载指示器。

为多达 20 个唯一交付组(总共 1000 个交付组目标)创建 50 个以上的策略可能会导致响应时间增加(超过 5 秒)。

将包含活动会话的计算机从一个交付组移动到另一个交付组可能会触发使用计算机参数定义的错误交付组警报。

注意:

删除警报策略后,策略生成的警报通知可能需要长达 30 分钟才能停止。

警报内容增强功能

Director 的警报功能已增强,现在包含 CSV 附件和 JSON 有效负载。通过此增强功能,您可以通过电子邮件以 CSV 附件形式或在存在 Webhook 时以 JSON 有效负载形式获取警报详细信息。使用此 CSV 附件或 JSON 有效负载,您可以接收详细级别的丰富内容,有助于快速识别和解决问题。

目前,这项增强功能仅限于以下警报才可以使用。

  • 计算机正常运行时间
  • 失败的开机操作
  • 失败的关机操作
  • 未注册的计算机 (%)

要使用此功能,请导航到警报并选择以下复选框:

  • 在 Webhook 中包含 JSON 有效负载作为附件
  • 在电子邮件中包含 CSV 文件作为附件

以下是来自“Citrix 警报策略”部分的屏幕截图:

增强型警报

以下是来自“高级警报策略”部分的屏幕截图:

增强型高级警报

CSV 附件

下表提供了所有受支持警报的 .CSV 附件的列:

适用警报
计算机名称、IP 地址和交付组名称 计算机正常运行时间、关机失败操作和开机失败操作,以及未注册计算机 (%)
当前注册状态、失败日期、故障状态和生命周期状态 未注册计算机 (%)
上次电源操作失败原因、上次电源操作触发者、上次电源操作类型和上次电源操作完成日期 关机失败操作和开机失败操作
电源状态、开机日期和总正常运行时间(分钟) 计算机正常运行时间

Web钩子有效负载

未注册计算机百分比警报
{
  "text": "{\"Address\":\"<Webhook URL>\",\"NotificationId\":\"<NotificationGUID>\",\"NotificationState\":\"NotificationActive\",\"Priority\":\"<Critical/Warning>\",\"Target\":\"<DeliveryGroupName>\",\"Condition\":\"Unregistered machines (in %)\",\"Value\":\"<Value Set as Threshold>\",\"Timestamp\":\"<Timestamp string Eg: April 25, 2024 9:33 PM (UTC +5)>\",\"PolicyName\":\"<Alert Policy Name>\",\"Description\":\"<Alert Policy Description>\",\"Scope\":\"DeliveryGroup\",\"Site\":\"<Name of the Site>\",\"AttachmentData\":[{\"MachineName\":\"<Name of the Machine>\",\"IPAddress\":\"<IP Address>\",\"DeliveryGroupName\":\"<Name of the DeliveryGroup>\",\"CurrentRegistrationState\":\"Unregistered\",\"FailureDate\":\"<Date of Failure>\",\"FaultState\":\"<Fault State of the Machine>\",\"LifecycleState\":\"<Lifecycle state of the Machine>\"},{\"MachineName\":\"<Name of the Machine>\",\"IPAddress\":\"<IP Address>\",\"DeliveryGroupName\":\"<Name of the DeliveryGroup>\",\"CurrentRegistrationState\":\"Unregistered\",\"FailureDate\":\"<Date of Failure>\",\"FaultState\":\"<Fault State of the Machine>\",\"LifecycleState\":\"<Lifecycle state of the Machine>\"}]}"
}
<!--NeedCopy-->
开机失败操作警报
{
  "text": "{\"Address\":\"<Webhook URL>\",\"NotificationId\":\"<NotificationGUID>\",\"NotificationState\":\"NotificationActive\",\"Priority\":\"<Critical/Warning>\",\"Target\":\"<DeliveryGroupName>\",\"Condition\":\"Failure To PowerOn Action\",\"Value\":\"<Value Set as Threshold>\",\"Timestamp\":\"<Timestamp string Eg: April 25, 2024 9:33 PM (UTC +5)>\",\"PolicyName\":\"<Alert Policy Name>\",\"Description\":\"<Alert Policy Description>\",\"Scope\":\"DeliveryGroup\",\"Site\":\"<Name of the Site>\",\"AttachmentData\":[{\"MachineName\":\"<Name of the Machine>\",\"IPAddress\":\"<IP Address>\",\"DeliveryGroupName\":\"<Name of the DeliveryGroup>\",\"LastPowerActionFailureReason\":\"<HypervisorReportedFailure, HypervisorRateLimitExceeded, UnknownError, Power Action Type>\",\"LastPowerActionTriggeredBy\":\"<End-User, Administrator, Auto-Scale, Schedule>\",\"LastPowerActionType\":\"<PowerOn/PowerOff>\",\"LastPowerActionCompletedDate\":\"<Time string Eg: 2024-05-15T15:04:27.723>\"},{\"MachineName\":\"<Name of the Machine>\",\"IPAddress\":\"<IP Address>\",\"DeliveryGroupName\":\"<Name of the DeliveryGroup>\",\"LastPowerActionFailureReason\":\"<HypervisorReportedFailure, HypervisorRateLimitExceeded, UnknownError, Power Action Type>\",\"LastPowerActionTriggeredBy\":\"<End-User, Administrator, Auto-Scale, Schedule>\",\"LastPowerActionType\":\"<PowerOn/PowerOff>\",\"LastPowerActionCompletedDate\":\"<Time string Eg: 2024-05-15T15:04:27.723>\"}]}"
}
<!--NeedCopy-->
关机失败操作警报
{
  "text": "{\"Address\":\"<Webhook URL>\",\"NotificationId\":\"<NotificationGUID>\",\"NotificationState\":\"NotificationActive\",\"Priority\":\"<Critical/Warning>\",\"Target\":\"<DeliveryGroupName>\",\"Condition\":\"Failure To PowerOff Action\",\"Value\":\"<Value Set as Threshold>\",\"Timestamp\":\"<Timestamp string Eg: April 25, 2024 9:33 PM (UTC +5)>\",\"PolicyName\":\"<Alert Policy Name>\",\"Description\":\"<Alert Policy Description>\",\"Scope\":\"DeliveryGroup\",\"Site\":\"<Name of the Site>\",\"AttachmentData\":[{\"MachineName\":\"<Name of the Machine>\",\"IPAddress\":\"<IPV4 Address of the Machine>\",\"DeliveryGroupName\":\"<Name of the DeliveryGroup>\",\"LastPowerActionFailureReason\":\"<HypervisorReportedFailure,HypervisorRateLimitExceeded,UnknownError,Power Action Type>\",\"LastPowerActionTriggeredBy\":\"<End-User,Administrator,Auto-Scale,Schedule>\",\"LastPowerActionType\":\"<PowerOn/PowerOff>\",\"LastPowerActionCompletedDate\":\"<Time string Eg: 2024-05-15T15:04:27.723>\"},{\"MachineName\":\"<Name of the Machine>\",\"IPAddress\":\"<IPV4 Address of the Machine>\",\"DeliveryGroupName\":\"<Name of the DeliveryGroup>\",\"LastPowerActionFailureReason\":\"<HypervisorReportedFailure,HypervisorRateLimitExceeded,UnknownError,Power Action Type>\",\"LastPowerActionTriggeredBy\":\"<End-User,Administrator,Auto-Scale,Schedule>\",\"LastPowerActionType\":\"<PowerOn/PowerOff>\",\"LastPowerActionCompletedDate\":\"<Time string Eg: 2024-05-15T15:04:27.723>\"}]}"
}

<!--NeedCopy-->
计算机正常运行时间警报
{
  "text": "{\"Address\":\"<Webhook URL>\",\"NotificationId\":\"<NotificationGUID>\",\"NotificationState\":\"NotificationActive\",\"Priority\":\"<Critical/Warning>\",\"Target\":\"<DeliveryGroupName>\",\"Condition\":\"Machine Uptime Alert\",\"Value\":\"<Value Set as Threshold>\",\"Timestamp\":\"<Timestamp string Eg: April 25, 2024 9:33 PM (UTC +5)>\",\"PolicyName\":\"<Alert Policy Name>\",\"Description\":\"<Alert Policy Description>\",\"Scope\":\"DeliveryGroup\",\"Site\":\"<Name of the Site>\",\"AttachmentData\":[{\"MachineName\":\"<Name of the Machine>\",\"IPAddress\":\"<IP Address>\",\"DeliveryGroupName\":\"<Name of the DeliveryGroup>\",\"PowerState\":\"<On/Off>\",\"PoweredOnDate\":\"2024-05-15T15:04:27.723\",\"TotalUptimeInMinutes\":180},{\"MachineName\":\"<Name of the Machine>\",\"IPAddress\":\"<IP Address>\",\"DeliveryGroupName\":\"<Name of the DeliveryGroup>\",\"PowerState\":\"<ON/OFF>\",\"PoweredOnDate\":\"2024-05-15T15:04:27.723\",\"TotalUptimeInMinutes\":\"<Uptime Duration>\"}]}"
}

<!--NeedCopy-->

警报策略的条件

下面列出了警报类别、建议的缓解警报措施以及(如果已定义)内置策略条件。内置警报策略的警报和重新警报间隔为 60 分钟。

并发连接会话峰值

  • 在 Director 会话趋势视图中检查并发连接会话峰值。
  • 务必检查以确保有足够的容量来容纳会话负载。
  • 如有需要,添加新计算机

并发断开连接会话峰值

  • 在 Director 会话趋势视图中检查并发断开连接会话峰值。
  • 检查以确保有足够的容量来容纳会话负载。
  • 如有需要,添加新计算机。
  • 如有需要,注销断开连接的会话

峰值并发总会话数

  • 在 Director 的 Director 会话趋势视图中检查并发会话峰值。
  • 检查以确保有足够的容量来容纳会话负载。
  • 如有需要,添加新计算机。
  • 如果需要,注销断开连接的会话。

CPU

CPU 使用率百分比表示 VDA 上的整体 CPU 消耗,包括进程的消耗。您可以从相应 VDA 的“计算机详细信息”页面获取有关单个进程 CPU 利用率的更多信息。

  • 转到“计算机详细信息 > 查看历史利用率 > 前 10 个进程”,识别消耗 CPU 的进程。确保已启用进程监视策略以启动进程级别资源使用情况统计信息的收集。
  • 如有必要,终止进程。
  • 终止进程会导致未保存的数据丢失。
  • 如果一切按预期运行,将来请添加额外的 CPU 资源。

    注意:

    默认情况下,对于监视具有 VDA 的计算机上的 CPU 和内存性能计数器,允许使用“启用资源监视”策略设置。如果禁用此策略设置,则不会触发具有 CPU 和内存条件的警报。有关详细信息,请参阅监视策略设置

    智能策略条件:

    • 范围: 交付组,多会话操作系统范围
    • 阈值: 警告 - 80%,严重 - 90%

内存

内存使用率百分比表示 VDA 上的整体内存消耗,包括进程的消耗。您可以从相应 VDA 的“计算机详细信息”页面获取有关单个进程内存使用情况的更多信息。

  • 转到“计算机详细信息 > 查看历史利用率 > 前 10 个进程”,识别消耗内存的进程。确保已启用进程监视策略以启动进程级别资源使用情况统计信息的收集。
  • 如果需要,终止进程。
  • 终止进程会导致未保存的数据丢失。
  • 如果一切正常,将来请添加额外的内存。

    注意:

    默认情况下,启用资源监视策略设置允许监视具有 VDA 的计算机上的 CPU 和内存性能计数器。如果禁用此策略设置,则不会触发具有 CPU 和内存条件的警报。有关详细信息,请参阅监视策略设置

    智能策略条件:

    • 范围: 交付组、多会话操作系统范围
    • 阈值: 警告 - 80%,严重 - 90%

连接失败发生率

过去一小时内连接失败的百分比。

  • 根据总失败次数与尝试连接总次数计算。
  • 检查 Director 连接失败趋势视图,查看从配置日志中记录的事件。
  • 确定应用程序或桌面是否可访问。

连接失败计数

过去一小时内连接失败的次数。

  • 检查 Director 连接失败趋势视图,查看配置日志中记录的事件。
  • 确定应用程序或桌面是否可访问。

ICA® 往返时间(平均值)

平均 ICA 往返时间。

  • 检查 Citrix ADM 以获取 ICA RTT 的详细分析,从而确定根本原因。有关详细信息,请参阅 Citrix ADM 文档。
  • 如果 Citrix ADM 不可用,请检查 Director 用户详细信息视图中的 ICA RTT 和延迟,并确定是网络问题还是应用程序或桌面问题。

ICA 往返时间 (会话数)

超过阈值 ICA 往返时间的会话数。

  • 检查 Citrix ADM 以获取高 ICA RTT 的会话数。有关详细信息,请参阅 Citrix ADM 文档。
  • 如果 Citrix ADM 不可用,请与网络团队合作以确定根本原因。

    智能策略条件:

    • 范围: 交付组、多会话操作系统范围
    • 阈值: 警告 - 5 个或更多会话 300 毫秒,严重 - 10 个或更多会话 400 毫秒

ICA RTT(会话百分比)

超过平均 ICA 往返时间的会话百分比。

  • 检查 Citrix ADM 中 ICA RTT 较高的会话数量。有关详细信息,请参阅 Citrix ADM 文档。
  • 如果 Citrix ADM 不可用,请与网络团队协作以确定根本原因。

ICA 往返时间 (用户)

适用于指定用户启动的会话的 ICA 往返时间。如果至少一个会话中的 ICA RTT 大于阈值,则会触发警报。

失败的计算机(单会话操作系统)

失败的单会话操作系统计算机数量。失败可能由于各种原因而发生,如 Director 控制板和筛选器视图中所示。

  • 运行 Citrix Scout 诊断以确定根本原因。

    智能策略条件:

    • 范围:交付组,多会话操作系统范围
    • 阈值:警告 - 1,严重 - 2

失败的计算机(多会话操作系统)

失败的多会话操作系统计算机数量。失败可能由于各种原因而发生,如 Director 控制板和筛选器视图中所示。

  • 运行 Citrix Scout 诊断以确定根本原因。

    智能策略条件:

    • 范围:交付组,多会话操作系统范围
    • 阈值: 警告 - 1,严重 - 2

失败的计算机(百分比)

交付组中失败的单会话和多会话操作系统计算机的百分比,根据失败计算机的数量计算。此警报条件允许您将警报阈值配置为交付组中失败计算机的百分比,并每 30 秒计算一次。 故障可能由于各种原因发生,如 Director 控制板和筛选器视图中所示。运行 Citrix Scout 诊断以确定根本原因。有关详细信息,请参阅 解决用户问题

开机操作失败和关机操作失败

交付组中失败的开机操作数量和失败的关机操作数量,根据未能开机或关机的 Power Managed Machines 数量计算。此警报条件允许您将警报阈值配置为交付组中未能开机或关机的 Power Managed Machines 数量,并每 30 分钟计算一次。

管理员可以在高级警报策略中为这些警报配置以下参数:

  • 触发者:是什么触发了电源操作
  • 失败原因:操作为何失败
  • 阈值:未能执行电源操作以触发策略的计算机阈值数量
  • 采样间隔:在此间隔内,需要检查失败的电源操作。
  • 重新警报间隔:警报必须在多长时间后重新发送

故障可能由于各种原因发生,如 Director 控制板和筛选器视图中所示。运行 Citrix Scout 诊断以确定根本原因。有关详细信息,请参阅 解决用户问题

未注册的计算机(百分比)

当计算机因重启而变得不稳定或交付控制器与虚拟机之间存在通信问题时,该计算机被视为未注册。未注册的计算机(百分比) 是交付组中未注册的单会话和多会话操作系统计算机的百分比,根据未注册计算机的数量计算。此警报条件允许您将警告和严重阈值配置为交付组中未注册计算机的百分比。您可以设置重新警报的间隔。您还可以添加电子邮件,以便在满足 未注册的计算机(百分比) 的条件时收到通知。当超出严重或警告阈值时,将生成警报和电子邮件。您可以在 Citrix Alerts 下查看警报。您可以按 未注册的计算机(百分比) 类别以及所需的状态和时间进行筛选。

如果有电子邮件,您还可以通过 CSV 附件接收警报详细信息;如果有 Webhook,则可以通过 JSON 有效负载接收警报详细信息。

注意:

临界值必须设定得比警告值更大。

策略条件:

  • 范围:单会话操作系统和多会话操作系统交付组
  • 阈值:警告和临界

计算机正常运行时间警报

交付组中的计算机正常运行时间是根据交付组中计算机每天、每周或每月开机的小时数计算的。此警报条件允许您将警报阈值配置为交付组中计算机的开机小时数。计算机正常运行时间警报在以下情况下工作方式如下:

  • 每天的小时数 - 您可以指定计算机每天开机的小时数,并每 30 分钟计算一次。您可以设置的最大每天小时数为 24 小时。
  • 每周的小时数 - 您可以指定计算机每周开机的小时数,并每六小时计算一次。您可以设置的最大每周小时数为 168 小时。
  • 每月的小时数 - 您可以指定计算机每月开机的小时数,并每天计算一次。最大每月小时数为 720 小时。 您可以设置的最小重新警报间隔值为 60 分钟。您可以在“警告和临界警报”部分下输入超出计算机正常运行时间阈值的计算机数量。您还可以为任何计算机添加例外。

例如,如果为此警报添加了五个交付组,并且在第一个交付组和第四个交付组中,计算机数量超出警告或临界阈值,则警报将分别为第一个交付组和第四个交付组单独触发。

此警报可帮助管理员分析计算机的正常运行时间,并根据此分析帮助管理员优化成本。如果有电子邮件,您还可以通过 CSV 附件接收警报详细信息;如果有 Webhook,则可以通过 JSON 有效负载接收警报详细信息。

平均登录持续时间

过去一小时内发生的登录的平均登录持续时间。

  • 检查 Director 控制板以获取有关登录持续时间的最新指标。许多用户在短时间内登录可能会增加登录持续时间。
  • 检查登录的基线和细分以缩小原因范围。有关详细信息,请参阅诊断用户登录问题

    智能策略条件:

    • 范围: 交付组,多会话操作系统范围
    • 阈值: 警告 - 45 秒,严重 - 60 秒

登录持续时间(用户)

指定用户在过去一小时内发生的登录持续时间。

负载评估器指数

过去 5 分钟内负载评估器指数的值。

  • 检查 Director 中可能存在峰值负载(最大负载)的多会话操作系统计算机。查看仪表板(故障)和趋势负载评估器指数报告。

    智能策略条件:

    • 范围: 交付组,多会话操作系统范围
    • 阈值: 警告 - 80%,严重 - 90%

使用 Webhook 配置警报策略

除了电子邮件通知,您还可以使用 Webhook 配置警报策略。

注意: 此功能需要 Delivery Controller 7.11 或更高版本。

您可以使用 PowerShell cmdlet 配置带有 HTTP 回调或 HTTP POST 的警报策略。它们已扩展为支持 Webhook。

有关创建新 Octoblu 工作流和获取相应 Webhook URL 的信息,请参阅 Octoblu 开发人员中心

要为新的警报策略或现有策略配置 Webhook URL,请使用以下 PowerShell cmdlet。

创建具有 Webhook URL 的新警报策略:

$policy = New-MonitorNotificationPolicy -Name <Policy name> -Description <Policy description> -Enabled $true -Webhook <Webhook URL>
<!--NeedCopy-->

将 Webhook URL 添加到现有警报策略:

Set-MonitorNotificationPolicy - Uid <Policy id> -Webhook <Webhook URL>
<!--NeedCopy-->

有关 PowerShell 命令的帮助,请使用 PowerShell 帮助,例如:

Get-Help  <Set-MonitorNotificationPolicy>
<!--NeedCopy-->

警报策略生成的通知会通过对 Webhook URL 的 POST 调用触发 Webhook。POST 消息包含 JSON 格式的通知信息:

{"NotificationId" : \<Notification Id\>,

"Target" : \<Notification Target Id\>,

"Condition" : \<Condition that was violated\>,

"Value" : \<Threshold value for the Condition\>,

"Timestamp": \<Time in UTC when notification was generated\>,

"PolicyName": \<Name of the Alert policy\>,

"Description": \<Description of the Alert policy\>,

"Scope" : \<Scope of the Alert policy\>,

"NotificationState": \<Notification state critical, warning, healthy or dismissed\>,

"Site" : \<Site name\>}
<!--NeedCopy-->

批量解除警报

此功能优化了管理员的警报管理流程,提供了灵活性并减少了警报疲劳。管理员可以根据时间、类型或类别批量解除警报,从而在维护期间或处理虚拟机管理程序及其他环境时简化警报管理。

批量解除警报有助于管理员高效地管理其工作负载,同时也能避免他们因警报数量过多而感到不堪重负。

批量解除警报的步骤

  1. 导航到“警报”>“Citrix 警报”选项卡。将显示警报。

    批量警报

  2. 从“”、“类别”、“状态”或“时间段”中选择一个选项以筛选要解除的警报。将显示特定警报。
  3. 选中特定警报旁边的复选框或顶部的复选框以选择所有警报。
  4. 单击解除。将显示一条通知,确认已解除警报。
  5. 单击。选定的警报将标记为已解除,并且警报状态将相应更新。

使用 PowerShell 开发工具包 配置 Web钩子

使用 PowerShell SDK 的 Webhook 配置功能允许管理员创建、修改、删除和列出 Webhook 配置文件。此功能通过允许指定标头、身份验证类型、内容类型、有效负载和 Webhook URL,为配置 Webhook 提供了灵活性。

注意:

支持的有效负载格式为文本,最终用户必须在其 Webhook 中启用文本。

最新的有效负载格式为:

{"text": "This is a message from a Webex incoming webhook."}
<!--NeedCopy-->

创建 Web 钩子

您可以使用以下 PowerShell 示例命令创建 Webhook 配置文件:

创建不带授权标头的 Webhook:

$headers = [System.Collections.Generic.Dictionary[string,string]]::new()

$headers.Add("Content-Type", "application/json")

$payloads = '{ "text": "$PAYLOAD" }'

$url = "<Fill this field with the required URL>"

Add-MonitorWebhookProfile -Name "profile_slack" -Description "webhook profile for slack" -Url $url -Headers $headers -PayloadFormat $payloads
<!--NeedCopy-->

创建带授权标头的 Webhook:

$headers = [System.Collections.Generic.Dictionary[string,string]]::new()

$headers.Add("Content-Type", "application/json")

$headers.Add("Authorization", "Basic <Fill this field with the authorization token>")

$payloads = '{ "text": "$PAYLOAD" }'

$url = "<Fill this field with the required URL>"

Add-MonitorWebhookProfile -Name "profile_azure" -Description "webhook profile for azure function with Authentication" -Url $url -Headers $headers -PayloadFormat $payloads
<!--NeedCopy-->

创建配置文件后,您可以在数据库中进行检查。此外,您可以在Citrix Alerts页面中找到新创建的 Webhook 配置文件。

Web 钩子配置文件

更新 Webhook 配置文件

您可以使用以下 PowerShell 示例命令更新 Webhook 配置文件:

$headers = [System.Collections.Generic.Dictionary[string,string]]::new()

$headers.Add("Content-Type", "application/json")

$payloads = '{ "text": "$PAYLOAD" }'

$url =  "<Fill this field with the required URL>"

Set-MonitorWebhookProfile -Uid 1  -Name "profile_slack_citrix" -Description "webhook profile for citrix slack" -Url $url -Headers $headers -PayloadFormat $payloads
<!--NeedCopy-->

获取所有 Webhook 配置文件列表

您可以使用以下 PowerShell 示例命令获取所有可用的 Webhook 配置文件列表:

Get-MonitorWebhookProfile

Get-MonitorWebhookProfile -Name 'profile_msteams'

Get-MonitorWebhookProfile -Uid 1
<!--NeedCopy-->

删除 Webhook 配置文件

您可以使用以下 PowerShell 示例命令删除 Webhook 配置文件:

Remove-MonitorWebhookProfile -Uid 1
<!--NeedCopy-->

注意:

如果 Webhook 配置文件已映射到任何策略,则无法将其删除。作为一种解决方法,您必须首先从策略中删除 Webhook 映射。

使用 Webhook 配置文件创建策略

您可以使用以下 PowerShell 示例命令创建包含 Webhook 配置文件的策略:

New-MonitorNotificationPolicy -Name "Policy1" -Description "Policy Description" -Enabled $true -WebhookProfileId 1
<!--NeedCopy-->

使用 Webhook 配置文件更新策略

您可以使用以下 PowerShell 示例命令更新包含 Webhook 配置文件的策略:

$Policy = Set-MonitorNotificationPolicy -Uid 1 -WebhookProfileId 1
<!--NeedCopy-->

从策略中删除 Webhook 映射

您可以使用以下 PowerShell 示例命令从策略中删除 Webhook 配置文件:

$Policy = Set-MonitorNotificationPolicy -Uid 1 -WebhookProfileId 0
<!--NeedCopy-->

测试 Webhook 配置文件

您可以使用以下 PowerShell 示例命令测试 Webhook 配置文件:

$headers = [System.Collections.Generic.Dictionary[string,string]]::new()

$headers.Add("Content-Type", "application/json")

$headers.Add("Authorization", "Basic <Fill this with authorization token>")

$payloads = '{ "text": "$PAYLOAD" }'

$url ="<Fill this field with the required URL>"

Test-MonitorWebhookProfile -Url $url -Headers $headers -PayloadFormat $payloads
<!--NeedCopy-->

管理程序警报监控

Director 显示警报以监控管理程序运行状况。来自 XenServer® 和 VMware vSphere 的警报有助于监控管理程序参数和状态。与管理程序的连接状态也会受到监控,以便在主机群集或池重新启动或不可用时提供警报。

管理程序警报筛选器

要接收管理程序警报,请确保在 Web Studio 中创建了托管连接。有关详细信息,请参阅连接和资源。只有这些连接会受到监控以获取管理程序警报。

一旦达到或超出阈值,就会显示这些警报。管理程序警报可以是:

  • 严重—已达到或超出管理程序警报策略的严重阈值
  • 警告—已达到或超出管理程序警报策略的警告阈值
  • 已解除—警报不再显示为活动警报

管理程序警报显示

此功能需要 Delivery Controller 7 1811 或更高版本。如果您使用的是旧版 Director,但站点版本为 7 1811 或更高版本,则仅显示管理程序警报计数。要查看警报,您必须升级 Director。

下表详细说明了管理程序警报的各项参数和状态。

警报 支持的管理程序 触发条件 警报条件 配置详情
CPU 使用率 Xen服务器、威睿虚拟化平台 管理程序 CPU 使用率警报阈值已达到或超出 必须在管理程序中配置警报阈值。
内存使用率 Xen服务器、威睿虚拟化平台 管理程序 内存使用率警报阈值已达到或超出 必须在管理程序中配置警报阈值。
网络使用率 XenServer, VMware vSphere 管理程序 网络使用率警报阈值已达到或超出 必须在管理程序中配置警报阈值。
磁盘使用情况 VMware vSphere 管理程序 磁盘使用情况警报阈值已达到或超出 警报阈值必须在管理程序中配置。
主机连接或电源状态 VMware vSphere 管理程序 管理程序主机已重新启动或不可用 警报在 VMware vSphere 中预先构建。无需额外配置。
管理程序连接不可用 XenServer, VMware vSphere 交付控制器 与管理程序(池或群集)的连接已丢失、已关机或已重新启动。只要连接不可用,此警报就会每小时生成一次。 警报已与 Delivery Controller 预先构建。无需进行任何额外配置。

注意:

有关配置警报的详细信息,请参阅 Citrix XenCenter 警报 或查看 VMware vCenter 警报文档。

电子邮件通知首选项可在 Citrix 警报策略 > 站点策略 > 管理程序运行状况 下配置。管理程序警报策略的阈值条件只能在管理程序中配置、编辑、禁用或删除,而不能在 Director 中进行。但是,修改电子邮件首选项和解除警报可以在 Director 中完成。如果您的角色不涉及基础架构监控,则可以禁用此警报。

重要提示:

  • 由管理程序触发的警报会在 Director 中获取并显示。但是,管理程序警报生命周期/状态的更改不会反映在 Director 中。
  • 在管理程序控制台中处于正常、已解除或已禁用状态的警报仍会显示在 Director 中,并且必须明确解除。
  • 在 Director 中解除的警报不会在管理程序控制台中自动解除。
警报和通知功能