在 Azure 中监视 DaaS 解决方案

监视 Citrix 部署可为您带来多项好处:提高性能、提高可用性、降低成本、增强安全性并提高用户满意度。Microsoft 和 Citrix 都提供了一组核心工具和服务,以帮助监视环境。本文概述了可用工具,并就在 Azure 中针对 Citrix 部署的目标监视区域提出了建议。

Microsoft 工具和服务包括以下内容:Azure Monitor、Azure Advisor、Azure 服务运行状况、Microsoft Sentinel、Azure Network Watcher 和 Azure Spend。Citrix 工具和服务包括以下内容:Citrix Monitor、Citrix Analytics 和 Citrix 托管服务。其中一些服务确实会产生额外费用,但其中大多数都包含在您的订阅中。

本文档提供了推荐工具的列表和一个部分,我们在其中确定了要监视的关键元素的基准值。我们还建议对值进行配置,以帮助您在 Azure 中成功部署 Citrix。

Microsoft

本节介绍了 Microsoft Azure 工具和服务,这些工具和服务可用于监视 Azure 中的 Citrix Virtual Apps and Desktops (CVAD) 部署。

Azure 监视器

对于 Azure 中的 Citrix 部署,Azure Monitor 是最好的起点。Azure Monitor 可帮助您提高 Citrix 部署的性能和可用性。Azure Monitor 收集和分析从本地和 Azure 环境收到的遥测数据。使用 Azure Monitor 可以在用户需要向服务台开具票证之前主动响应资源问题。Azure Monitor 由六种不同的服务组成,这些服务可以相互使用来管理您的 Citrix 资源:

  • 指标:代表某一时间点 Azure 资源特定方面的数值集合。

  • 警报:应监视的条件集合,并在条件发生时充当触发器以启动相关操作。

  • 日志:写入日志并可通过 Azure 指标进行分析的数据集合。

  • 仪表板:可自定义的受监视资源可用信息视图。

  • 应用程序见解:一项监视您的 Web 应用程序并支持性能优化和故障排除的服务。

指标

Azure 指标是 Azure Monitor 中可用的最强大的工具,用于跟踪 Citrix 资源的运行状况。术语“指标”表示有关资源特定方面的信息,这些信息被提炼成数值。指标会随着时间的推移进行跟踪,并按特定的间隔进行报告。例如,Citrix VDA 主机上的活动会话数每 30 秒收集一次,并显示在实时图表中。

Azure 指标允许跟踪每个 Citrix 资源的指标并发出警报。Azure 指标提供 Citrix 虚拟机 (VM) 和底层虚拟机主机的指标。Azure Metrics 还可以添加诊断扩展以从客户机操作系统收集指标。指标近乎实时地提供,可通过“指标资源管理器”图表查看。Metrics Explorer 图表可以比较来自不同资源的指标,并保存到仪表板中以监视环境。

要监视 Azure 中的 Citrix 虚拟机资源,请务必通过虚拟机的诊断设置启用客户机操作系统指标。此设置会自动执行以下操作:

  • 每隔一分钟启用 CPU、内存、磁盘和网络的性能计数器。

  • 启用事件日志条目收集(警告级别及以上)。

  • 提供收集自定义性能计数器和事件日志的选项。

客户机操作系统指标在发送到 Azure 监视指标时将保留 93 天。

建议在 Azure 中对 Citrix 部署使用以下附加设置:

  • 启用“接收器”>“Azure 监视器”>“向 Azure 监视器发送诊断数据”设置。此设置允许使用自定义计数器收集多维度指标,并启用对客户机操作系统指标的警报。

  • 对 Citrix 或 Microsoft 支持部门的问题进行故障排除时,启用崩溃转储设置。此设置将转储文件直接放在存储容器中,您可以在其中轻松检索它们。

收集指标是跟踪 Citrix 资源运行状况和性能的有效方法。Azure 指标可以跟踪任何可用作 Windows 性能监视计数器的指标并发出警报。指标是编排的基础,编排使用规则在 Azure 中自动执行操作。

警报

在 Azure 中监视 Citrix 基础架构的主要目的是能够在用户受到不利影响之前主动响应问题。警报会通知您或对需要快速处理的情况采取自动行动。尽管并非所有中断都会提供警告信号,但谨慎使用警报可以防止大多数常见情况。

警报条件可以基于 Azure 提供的一组预定义信号,也可以基于 Guest OS 指标。这些信号包括指标值(最常见的)、日志搜索结果、Azure 活动日志事件,甚至是 Azure 平台的运行状况。您需要将警报设置为能够提前通知潜在问题的级别,同时最大限度地减少需要采取措施的警报频率。警报规则是启用警报后触发警报必须满足的条件。然后,警报规则可以执行在操作组中定义的一组操作。可用的操作包括以下内容:

  • 通过电子邮件、短信、推送或语音发送通知
  • 触发自动化运行手册、Azure 函数、逻辑应用程序、事件中心或 Webhook
  • 创建 ITSM 票证

警报的范围可以限定为特定的资源组、区域或资源类型。为多个目标配置警报时,只能指定一个条件,并且所有目标都必须支持该条件。对于基于指标的条件,警报规则定义包括严重性级别以及自动解决警报的能力。触发警报后,如果未使用自动响应来处理警报情况,则需要确认警报。警报确实需要每月付费,Azure 会在创建警报规则时显示估计的接受成本。

日志

有时,您要在 Citrix 部署中监视的特定事件的指标不可用。当指标不可用时,可以监视日志中是否有表明事件已发生的条目。Azure Monitor Logs 可以使用应用程序见解接受来自 Azure 服务、虚拟机代理或应用程序的日志。需要一个 Log Analytics 工作区,用于存储日志数据以供分析。然后可以汇总这些日志,查询指示需要管理的条件的密钥条目。可以通过仪表板或工作簿查看查询结果。

Azure 监视器指标仅限于数字数据。Azure Monitor Logs 可以存储和分析不同的数据类型,这在某些情况下具有优势。日志分析需要使用必须创建和维护的查询。查询是用 Kusto 查询语言 (KQL) 编写的,这与 Azure 数据资源管理器使用的语言相同。

控制板

仪表板代表了每天监视 Citrix 环境的可视化方式。仪表板由来自任意数量的图库选项的图块组成。可能的图块包括指标图表、安全图表、用户信息、自动化或指向任何资源或资源组的直接链接。可以创建专注于特定角色或一组资源的自定义仪表板。每个仪表板可以共享或私有,每个门户用户最多可以拥有 100 个私有仪表板和无限数量的共享仪表板。

应用程序洞察

如果您有 Web 应用程序托管在 Azure 中并通过 Citrix 交付,请使用 Application Insights 来监视在常用 Web 平台上编码的应用程序。应用程序洞察可以使用软件开发套件 (SDK) 或应用程序洞察代理与您的 DevOps 流程集成。然后,Application Insights 将提供的遥测与性能计数器和其他诊断信息相结合。这些见解可以帮助诊断问题,并让人们更深入地了解用户如何与您的应用程序交互。

应用程序见解将收集到的信息提供给 Azure Monitor。您可以使用 Microsoft PowerBi 或类似工具来分析存储在 Azure Monitor 中的原始数据。使用 Insights 可以监视的一些区域包括:

  • 哪些页面最受欢迎,它们在一天中的什么时间加载。

  • 哪些页面加载失败,无法帮助您诊断资源问题。

  • 从用户浏览器的角度来看,Web 应用程序的加载性能。

  • 发生的任何异常,无论是由服务器还是浏览器代码引起。

  • 您选择使用 Insights SDK 分析的任何自定义事件或指标。

Application Insights 控制台允许您在 Citrix 上管理 Web 应用程序的性能,从而提供更好的终端用户体验。

Azure 顾问

Azure Advisor 是一项在后台分析资源配置并提出建议以帮助改进 Azure 部署的服务。这些建议分为五类:成本、安全性、可靠性、卓越运营和性能。安全类别来自 Microsoft Defender for Cloud。对于每个类别,顾问都会列出受影响的资源,并就如何改进资源配置提供指导。您可以按资源类型和订阅筛选推荐。

Azure Advisor 支持配置警报,以监视您的 Azure 环境不在最佳做法建议范围内的情况。有关建议,请参阅本文档后面的 Azure 顾问警报 部分。

Microsoft Defender for Cloud

Defender for Cloud 是一项结合了以前在 Azure 安全中心和 Azure Defender 中提供的功能的服务。该服务会持续评估您的 Azure 资源,并提供表明部署安全状况的总体分数。Azure 顾问的安全建议直接来自 Defender for Cloud。Defender for Cloud 还就如何解决该服务发现的任何问题提供直接指导。这些建议来自 Azure 安全基准,这是一套由 Microsoft 撰写的 Azure 特定指南。

具有增强安全功能的 Defender for Cloud 可以在混合配置中部署,以便与其他云提供商一起支持本地部署。

对于 Citrix 部署,启用 Defender for Cloud 可提供以下功能来保护 Citrix 资源:

  • 对从互联网访问的资源进行风险评估,例如来源 IP 地址和频率。

  • 即时 (JIT) 虚拟机访问限制了为初始入站连接打开端口的时间。Microsoft 建议对所有跳箱或堡垒主机连接使用 JIT。

  • 自适应网络强化 (ANH) 进一步强化了网络安全组 (NSG) 规则。ANH 使用机器学习算法、可信配置、威胁情报和其他因素来提供建议。

  • 无文件攻击检测,它定期扫描正在运行的机器的内存,以查找在内存中运行的恶意有效负载,从而避开基于磁盘的检测软件。

  • 与 Microsoft Sentinel 集成。

Microsoft Sentinel

Microsoft Sentinel 既是安全信息和事件管理 (SIEM) 又是安全编排、自动化和响应 (SOAR) 系统。Sentinel 是作为云原生服务设计和构建的。使用复杂的人工智能,Sentinel 持续监视所有内容来源并寻找可疑活动。 Sentinel 为通过代理和数据连接器大规模收集和监视数据提供了一个中心位置。通过触发警报和对常见任务的自动响应来跟踪安全事件。Sentinel 可以在多个云环境中运行,也可以在您的本地基础架构上运行,因此非常适合混合 Citrix 环境。

内容中心提供了一个简单的界面,可以为 Sentinel 启用开箱即用的预打包解决方案。这些软件包包含特定于其主题的分析规则、搜寻查询、剧本、数据连接器和工作簿。建议在 Azure 中部署 Citrix 时使用以下内容中心:

  • Azure 防火墙 有助于提高网络通信的安全性。

  • 网络安全成熟度模型认证 CMMC 可满足您环境中的网络安全合规准则。

  • Microsoft Sentinel Deception 可防范所有威胁。

  • Microsoft 内部风险管理 可帮助防范内部威胁。

  • 威胁分析响应 ,用于管理和关联威胁活动。

数据连接器提供了一种将 Sentinel 与其他 Azure 服务和第三方系统连接的方法。连接器提供由 Sentinel 分析的潜在威胁数据。建议在 Azure 中部署 Citrix 时使用以下数据连接器:

  • Azure Active Directory 提供有关用户身份、登录、配置等的信息

  • Azure Active Directory 身份保护 可提供带有身份的安全警报。

  • 任何Azure 资源活动 的 Azure 活动。

  • Azure DDoS 保护 通过流量日志和 DDoS 通知获取有关分布式拒绝服务攻击的信息。

  • Azure 防火 墙提供有关防火墙活动、网络规则和 DNS 代理的信息。

  • Azure 密钥保管库 获取有关 Azure 密钥保管库活动的信息。

  • Azure 存储帐户 ,了解有关博客、队列、表、文件和资源访问的 Azure 存储帐户活动的信息。

  • Citrix Analytics 了解 Citrix Analytics 收集的信息(请参阅 Citrix Analytics 部分)。

  • 用于 Citrix 防火墙活动的 Citrix Web App Firewall

  • Microsoft Defender for Cloud 用于接收来自

  • Microsoft Office 365 适用于任何 Office 活动,假设您的 Office 365 租户与用于 Citrix 部署的租户相同。

  • 威胁情报 — TAXII 用于识别和修复潜在威胁。

  • Windows 防火墙 用于在 Citrix 服务器上运行的 Windows 防火墙服务生成的事件。

  • 通过 Azure Monitor Agent (AMA) 获取来自 Citrix 服务器上 Windows 安全事件日志的事件的 Windows 安全事件。

Microsoft Sentinel 支持来自各种供应商的数据连接器。这些供应商包括安全、网络和应用程序供应商。考虑至少每年审查一次可用的数据连接器,以尽可能保持 Sentinel 的有效性。

Azure 服务运行状况

Azure 服务运行状况提供了一种简单的方法来监视托管 Citrix 部署的 Azure 基础架构。Service Health 允许您监视服务问题、查看即将到来的计划维护以及跟踪运行状况和安全建议。您可以按订阅、地区和服务筛选活动问题和计划内维护。任何具有广泛影响的问题都显示在“服务问题”刀片下方。

通过运行状况警报,您可以监视自己的 Azure 资源的运行状况。使用运行状况警报配置影响资源的服务中断或计划内维护的自动通知。有关建议,请参阅本文档后面的 Azure 服务运行状况警报 部分。

如果您有其他经常使用的服务,我们建议您也订阅这些服务。如果您正确设置了警报,则在发生任何中断时都会收到通知,并且计划中的维护不会使您措手不及。

Azure Network Watcher Traffic Analytics

尽管 Citrix 的设计旨在确保安全,但用户仍然是一个薄弱环节,登录凭据可能会被泄露。在 Azure 中运行 Citrix 时,安全访问应用程序和数据的最佳方法之一是监视网络流量。流量分析旨在通过分析网络流量为您提供相关信息。通过将原始流日志与网络拓扑知识相结合,Traffic Analytics 可以提供网络通信的全面视图。这些报告包括最活跃的主机或主机对、正在使用的顶级协议、阻塞的流量、开放端口、恶意网络和流量分布。

要使用流量分析,您的 Citrix 资源必须位于同时支持网络安全组 (NSG) 和日志分析工作区的区域。您还需要在同一区域启用网络观察器。对于包含 Citrix 资源的每个网络安全组,创建一个 NSG 流日志,并在创建时启用流日志版本 2 和流量分析。为确保合规性,请确保您的日志分析工作区与生成 NSG 流日志所在的国家/地区相同。

注意:至少要为您的 Citrix Cloud 连接器、交付控制器、ADC 设备和 StoreFront 服务器创建 NSG 流日志。

使用流量分析来识别恶意流量、主机位置和繁忙的主机。请记住,客户端要访问一组特定的主机,因此有时正常流量可能会出现在“频繁通话”列表中。地理地图可用于可视化通信来源,快速识别意外和可能的恶意流量来源。查看流量流量模式、开放端口和阻塞流量可以让您深入了解潜在威胁或未受保护的攻击媒介。

Azure 成本管理

Azure 成本管理和计费允许您配置警报,以便在达到成本限额时向您发出警报。支出提醒是管理 Citrix 资源的最佳方式。对于大型企业,启用预算、信用和配额警报可帮助您识别任何潜在的 Azure 资源配置错误或滥用。

  • 预算提醒:当使用量或美元金额达到基于先前设定的预算的预定义限额时,将发送提醒。

  • 信用提醒:当您的预付款(金钱承诺)达到90%和100%时,系统会自动生成信用警报。

  • 部门支出配额提醒:配额警报只能通过企业协议 (EA) 门户进行配置。触发后,门户网站会在部门所有者的支出达到规定的百分比时向其发送电子邮件。

创建带有支出提醒的月度预算可在资源意外配置时提前通知。意外开支的常见原因包括自动化错误、自动扩展配置错误,甚至是值得信赖的内部人员的恶意意图。您越早收到额外费用的提醒,就能越早解决问题。

Azure 的基准指标和警报

良好的监视环境的关键是要知道哪些需要监视以及哪些项目需要立即关注。您不想监视所有可用的指标,因为您最终会存储无用的信息。信息收集和存储有相关的成本,因此请谨慎使用。在这里,我们提供了用于监视的指标/计数器的基准,并建议警报,这些警报可以为您提供监视 Citrix 环境的起点。您可以在此基准的基础上进行构建,并添加您认为对环境有帮助的其他性能计数器或事件。

指标和警报阈值

对于 Citrix 部署,我们将主要关注 Citrix 虚拟机的客户机操作系统指标。较差的服务器性能指标通常表明用户即将遇到不愉快的问题,如果还没有遇到的话。例如,当用户会话的最大输入延迟达到预定义的延迟时,我们就知道用户遇到了延迟。您可以将操作组配置为向 Citrix 管理员发送电子邮件,提醒他们注意服务器的问题。通过将通知警报设置为在最大输入延迟接近已知不可接受的值时触发,管理员可以主动进行干预。

我们提供了要监视的性能计数器以及在 Citrix 部署中使用时对这些计数器发出警报的建议阈值。建议的警报阈值可能会提前通知用户的不满。调整数值和时间段以满足您的业务需求:

所有 Citrix 服务器

以下是部署中要监视所有 Citrix 服务器的 perfmon 计数器列表:

  • 处理器\% 处理器时间

    • 此计数器是处理器未处于空闲状态的时间量。

    • 在持续 15 分钟内平均值大于 80% 时发出警报。

    • 使用任务管理器或 Citrix Monitor 确定消耗最多 CPU 的进程,并确定 CPU 使用率过高的原因。

    • 如果所有进程都消耗了预期的 CPU 时间,则是时候增加服务器或交付组的容量了。

  • 系统\ 处理器队列长度

    • 此计数器是处理器队列中等待处理的线程数。

    • 在 5 分钟的时间间隔内超过 5* [内核数] 时发出警报。

    • 使用任务管理器或 Citrix 监视器确定哪些进程消耗的 CPU 最多,并确定 CPU 使用率的原因。

    • 如果所有进程都消耗了预期的 CPU 时间,则是时候增加服务器或交付组的容量了。

  • 内存\ 可用字节

    • 此计数器是未分配给进程或缓存的内存量。

    • 当可用内存量在 5 分钟间隔内低于总内存的 20% 时发出警报。

    • 使用任务管理器或 Citrix 监视器确定哪些进程正在消耗内存。确定任何可能降低该内存消耗水平的配置更改。将此指标与“内存页数/秒”和“分页文件使用百分比”计数器一起使用。

    • 如果所有进程都消耗了预期的内存量,则是时候增加服务器或交付组的容量了。

  • 内存\ 页数/秒

    • 此计数器是每秒从磁盘交换到运行内存的页数。

    • 每秒页数持续超过 10 页时发出警报。

    • 使用任务管理器查找导致页面交换的应用程序。研究可能的替代配置。将此指标与“可用内存字节数”和“分页文件\ %使用情况”计数器一起使用。

    • 如果可能,增加主机可用的 RAM 量。如果不是这样,请尝试将应用程序隔离到一组专用服务器上。

  • 分页文件\ %使用情况

    • 此计数器是当前页面文件中正在使用的百分比。

    • 当页面文件使用率在 60 分钟内超过 80% 时发出警报。

    • 使用任务管理器查找导致页面文件使用的应用程序。研究可能的替代配置。将此指标与“可用内存字节数”和“内存页数/秒”计数器一起使用。

    • 如果可能,增加主机可用的 RAM 量。

  • LogicalDisk\ %Disk 时间 (_total)

    • 此计数器表示逻辑磁盘处于非空闲状态的时间。

    • 当磁盘时间百分比在 15 分钟内超过 90% 时发出警报。

    • 使用任务管理器或 Citrix Monitor 查找导致高磁盘使用率的应用程序。调查可能导致高磁盘利用率的原因。将此指标与其他逻辑和物理磁盘指标一起使用。

    • 如果所有活动看起来都正常,请寻找一种方法将应用程序移动到具有更高性能磁盘子系统的磁盘上。

  • 逻辑磁盘\ 当前磁盘队列长度

    • 此计数器表示等待逻辑磁盘处理的事务数量。

    • 当当前磁盘队列在 15 分钟内大于 3 时发出警报。

    • 使用任务管理器或 Citrix Monitor 查找导致高磁盘使用率的应用程序。调查可能导致高磁盘利用率的原因。将此指标与其他逻辑和物理磁盘指标一起使用。

    • 如果所有活动看起来都正常,请寻找一种方法将应用程序移动到具有更高性能磁盘子系统的磁盘上。

  • PhysicalDisk\ %Disk 时间 (_total)

    • 此计数器表示物理磁盘处于非空闲状态的时间。

    • 当磁盘时间百分比在 15 分钟内超过 90% 时发出警报。

    • 使用任务管理器或 Citrix Monitor 查找导致高磁盘使用率的应用程序。调查可能导致高磁盘利用率的原因。将此指标与其他逻辑和物理磁盘指标一起使用。

    • 如果所有活动看起来都正常,请寻找一种方法将应用程序移动到具有更高性能磁盘子系统的磁盘上。

  • 物理磁盘\ 当前磁盘队列长度

    • 此计数器表示等待物理磁盘处理的事务数量。

    • 当当前磁盘队列在 15 分钟内大于 3 时发出警报。

    • 使用任务管理器或 Citrix Monitor 查找导致高磁盘使用率的应用程序。调查可能导致高磁盘利用率的原因。将此指标与其他逻辑和物理磁盘指标一起使用。

    • 如果所有活动看起来都正常,请寻找一种方法将应用程序移动到具有更高性能磁盘子系统的磁盘上。

  • 网络接口\ 总字节/秒

    • 此计数器显示网络适配器处理网络数据包的速率。

    • 当每秒总字节数在 5 分钟内超过 NIC 速度的 80% 时发出警报。

    • 使用任务管理器查找导致高网络使用率的应用程序,以调查可能导致高磁盘利用率的原因。将此指标与其他逻辑和物理磁盘指标一起使用。

    • 如果所有活动看起来都正常,请寻找增加网络带宽或增加交付组容量的方法。

  • 每个会话的用户输入延迟\ 最大输入延迟

    • 此指标提供会话的最大输入延迟(以毫秒为单位)。该指标衡量用户提供鼠标或键盘输入与系统处理其输入之间的时间。

    • 当会话的输入延迟在 2 分钟内超过 1000 毫秒时发出警报。

    • 使用任务管理器或 Citrix 监视器查找导致 CPU、磁盘或网络使用率高的应用程序。

    • 如果活动看起来正常,最好的方法是增加交付组的容量。

Cloud Connector

除了所有 Citrix 服务器的计数器外,还为您的 Citrix Cloud 连接器启用以下自定义性能计数器。这些计数器监视 Cloud Connector 中的关键故障:

  • Citrix 高可用性服务\ 数据库事务错误/秒

    • 此指标表示每秒数据库事务失败的次数。

    • 这个数字应该是 0。

    • 当计数器大于 0 时发出警报。

  • Citrix 高可用性服务\ 租赁枚举失败

    • 此指标表示客户端失败的枚举次数。

    • 这个数字应该是 0。

    • 当计数器大于 0 时发出警报。

  • Citrix 高可用性服务\ 租赁启动失败

    • 此指标表示客户端启动失败的次数。

    • 这个数字应该是 0。

    • 当计数器大于 0 时发出警报。

  • Citrix 高可用性服务\ 注册被拒绝/秒

    • 此指标表示每秒被拒绝的注册数量。

    • 这个数字应该是 0。

    • 当计数器大于 0 时发出警报。

Citrix Virtual Delivery Agent 虚拟机

除了所有 Citrix 服务器的计数器外,还为您的 Citrix Virtual Delivery Agent 主机启用以下自定义性能计数器。这些计数器监视关键故障:

  • ICA 会话\ 延迟-会话平均值

    • 此指标提供用户会话的平均 ICA 延迟(以毫秒为单位)。

    • 使用此指标监视用户体验,该值应低于 150 毫秒才能获得良好的用户体验,任何超过 300 毫秒的值都将被视为降级。

    • 如果您看到高延迟值,请考虑启用自适应传输以帮助减轻延迟的影响。

  • 每个会话的用户输入延迟\ 最大输入延迟

    • 此指标提供会话的最大输入延迟(以毫秒为单位)。该指标衡量用户提供鼠标或键盘输入与系统处理其输入之间的时间。

    • 使用此指标监视用户体验,该值应低于 500 毫秒,低于 150 毫秒被视为良好,任何超过 1000 毫秒的值都被视为不可接受。

  • 终端服务\ 活动会话

    • 此指标提供 Citrix VDA 主机上的活动会话数。

    • 监视多会话主机的此指标。

    • 通过在图表上显示活跃用户数,使用此指标与其他指标相关联。

  • CitrixPrinting\ 总作业失败了

    • 此指标表示 Citrix VDA 主机上失败的打印作业总数,应为低值。

    • 监视此指标以查看 Citrix 主机上失败的打印作业数量。

    • 打印作业失败过多可能导致 Citrix 主机上安装的打印机驱动程序出现问题。

为运行 Citrix Profile Management 的 Citrix Virtual Delivery Agent 虚拟机启用以下自定义性能计数器:

  • CitrixProfileManagement\ 登录时长

    • 此指标表示用户登录事件完成的总时间(以秒为单位)。

    • 监视此指标以了解用户的登录体验。该指标包括将用户配置文件加载到用户会话所花费的时间。

  • CitrixProfileManagement\ 注销持续时间

    • 此指标表示用户注销事件完成的总时间(以秒为单位)。

    • 监视此计数器以跟踪用户注销事件花费了多长时间。该指标包括将用户数据写回个人资料位置所花费的时间。

  • CitrixProfileManagement\ 已处理的注销文件-大于 5MB

    • 此指标表示注销期间上传到用户配置文件存储的大于 5MB 的文件数。

    • 监视此指标,以确定启用大文件处理或文件夹重定向是否可以改善用户登录体验。

  • CitrixProfileManagement\ 已处理的登录文件-大于 5MB

    • 此指标表示登录期间从用户配置文件存储中向下复制的大于 5MB 的文件数。

    • 监视此指标,以确定是否需要启用配置文件流或大文件处理以减少登录时间。

在 Citrix Virtual Delivery Agent 机上启用应用程序日志收集。将以下配置设置为基准:

  • 在出现任何 RDP 许可错误时发出警报。

  • 对这些安全警告发出警报。

    • 事件 ID 4625:帐户登录失败。

    • 事件 ID 4771:Kerberos 预身份验证失败。

  • 针对这些 Citrix 警告或错误消息发出警报。

    • 事件 ID 1001:Citrix 桌面服务未能获取要注册的交付控制器列表。

    • 事件 ID 1017:Citrix 桌面服务未能向任何交付控制器注册。

    • 事件 ID 1022:Citrix 桌面服务在过去 5 分钟内未能向任何控制器注册。

    • 事件 ID 6013:系统正常运行时间,用于查找修补后未重新启动的 Citrix 服务器。

Citrix StoreFront 服务器

除了所有 Citrix 服务器的计数器外,还为您的 Citrix StoreFront 服务器启用以下自定义性能计数器。计数器监视性能不佳:

  • ASP.NET\ 请求已排队

    • ASP 队列中等待处理的请求数。

    • 当值明显超出基准标准时发出警报。根据环境建立基准。

  • ASP.NET\ 请求被拒绝

    • 由于请求队列已满而被拒绝的请求数。

    • 当被拒绝的请求数大于 1 时发出警报。

Citrix 联合身份验证服务 (FAS) 服务器

除了所有 Citrix 服务器的计数器外,还为您的 Citrix 联合身份验证服务主机启用以下自定义性能计数器。这些指标用于监视与性能相关的问题:

  • Citrix 联合身份验证服务\ 高负载级别

    • 此指标跟踪联合身份验证服务每分钟接受的证书签名请求数。

    • 跟踪此指标,因为一旦达到高负载级别,桌面和应用程序将无法启动。

Azure ExpressRoute 指标

如果您有与本地数据中心或对等网络的 ExpressRoute 连接,则应监视该连接。您需要了解您的带宽需求,并知道有多少可计费的出口流量离开 Azure。值得关注的关键指标如下:

  • ExpressRoute circuit\BitsInPerSecond
    • 此指标是每秒进入 Azure 的位数。这些数据是免费的。

    • 使用此指标进行 ExpressRoute 容量规划。

    • 当此指标达到您的可用电路入口带宽的 80% 时,请发出警报。

  • ExpressRoute circuit\BitsOutPerSecond

    • 此指标是每秒离开 Azure 的位数。此数据是可计费的。

    • 使用此指标进行 ExpressRoute 容量规划和数据流量预算。

    • 当此指标达到可用电路出口带宽的 80% 时,请发出警报。

  • ExpressRoute circuit\GlobalReachBitsInPerSecond

    • 此指标是每秒进入Azure re的对等ExpressRoute电路的比特数(此数据是免费的)。

    • 使用此指标进行 ExpressRoute 容量规划。

    • 当此指标达到您的可用电路入口带宽的 80% 时,请发出警报。

  • ExpressRoute circuit\GlobalReachBitsOutPerSecond

    • 此指标是每秒离开 Azure 到对等 ExpressRoute 电路的位数(此数据可计费)。

    • 使用此指标进行 ExpressRoute 容量规划和数据流量预算。

    • 当此指标达到可用电路出口带宽的 80% 时,请发出警报。

  • ExpressRoute Gateway Connection\BitsInPerSecond

    • 此指标是特定连接到 ExpressRoute 电路时每秒进入 Azure 的位数(此数据是免费的)。

    • 当此指标达到您的连接电路入口带宽的 80% 时,发出警报。

  • ExpressRoute Gateway Connection\BitsOutPerSecond

    • 此指标是指每秒离开 Azure 到达 ExpressRoute 电路的特定连接的位数(此数据可计费)。

    • 当此指标达到您的连接出口带宽的 80% 时,发出警报。

  • ExpressRoute Virtual Network Gateway\PacketsPerSecond

    • 此指标是通过 ExpressRoute 网关的入站数据包数量。

    • 当此指标下降到足够低以表明它不再接收流量时,会发出警报。

  • ExpressRoute Virtual Network Gateway\CPU Utilization

    • 此指标是网关实例的 CPU 利用率。

    • CPU 利用率高表示存在性能瓶颈。

    • 当 CPU 利用率超过 85% 时,就此指标发出警报。

Azure 顾问警报

Azure 顾问提供超过 280 个警报。本节提供了在 Azure Advisor 中为您的 Citrix 环境配置的推荐警报。为方便起见,警报分为可靠性、成本、性能和卓越运营。每个警报都有简短的描述,包括在 Citrix 环境中跟踪此警报的重要原因。其中一些警报也可以通过 Azure 策略强制执行。这些警报只需要配置一次,大约需要 30 分钟。

可靠性警报

  • 在虚拟机上启用备份:在虚拟机未启用自动备份时通知您。定期备份所有 Citrix 基础架构虚拟机。

  • 为 Recovery Services 文件库启用软删除:当恢复服务保管库数据设置为硬删除或永久删除而不是软删除时,通知您。使用软删除可避免在意外删除时丢失恢复服务 Citrix 基础架构。

  • 启用软删除以保护您的 Blob 数据:当您的 Blob Storage 数据设置为硬删除或永久删除而不是软删除时,通知您。使用软删除可避免在意外删除时丢失 Citrix 应用程序或用户的任何博客存储数据。

  • 为 Recovery Services Vault 启用跨区域恢复:当恢复服务保管库未启用跨区域还原功能时通知您,这意味着您无法在当前区域之外进行恢复。用于保护您的 Recovery Services Citrix 基础架构,以便在无法访问主区域时,它可以在其他区域联机。

  • 从基本网关移至生产网关 SKU:当您的网关使用性能低于生产 SKU 的基本 SKU 时通知您。始终使用适用于 Citrix 基础架构和用户的生产网关 SKU,以提供最佳性能和最终用户体验。

  • 启用 Active-Active 网关以实现冗余:在网关未设置为主动-主动容错时通知您。务必为容错的 Citrix 基础架构配置主动-主动网关。

  • 在虚拟网络中实现多个 ExpressRoute 电路以实现跨本地弹性:在 ExpressRoute 电路未设置为高可用性时通知您。务必配置 ExpressRoute 电路以实现高可用性,这样所有用户都可以使用您的 Citrix 基础架构。

  • 使用 ExpressRoute GlobalReach 改进灾难恢复设计:当您的 ExpressRoute 电路未使用 GlobalReach 时通知您。务必为 Global Reach 配置 ExpressRoute 电路,以改进您的灾难恢复设计并使其更具弹性。
  • 修复您的日志警报规则: 当日志警报规则被破坏时通知您。如果您使用日志警报规则来监视 Citrix 环境,则需要启用此警报,以便知道规则何时被违反且执行不正常。

  • 日志警报规则已禁用:在禁用日志警报规则时通知您。如果您使用日志警报规则来监视 Citrix 环境,则需要启用此警报,以便知道规则何时被禁用且根本未运行。

费用提醒

  • 调整大小或关闭未充分利用的虚拟机:在虚拟机的计算机实例类型未得到充分利用时通知您,以便您可以选择更小、更便宜的虚拟机来满足您的业务需求。使用此警报降低您的 Citrix 基础架构的成本。

  • 重新调整或删除空闲的虚拟网络网关:当您的虚拟网络网关处于空闲状态并且可以移除以降低成本时通知您。使用此警报可降低网络基础设施的成本和复杂性。

  • 删除提供商状态为“未配置”的 ExpressRoute 电路:当您有 ExpressRoute 电路未完全配置时通知您。使用此警报移除不完整的 ExpressRoute 电路。

  • 使用标准存储存储托管磁盘快照:当您使用更昂贵的存储来存储托管磁盘快照时通知您。使用此警报在存储磁盘快照时省钱。

性能警报

  • 通过在离用户位置更近的地方部署虚拟机来改善用户体验和连接:当用户访问距离用户较远的 Citrix 资源时通知您。用于数据中心和站点位置,将用户放置在靠近其 Citrix 资源的地方。

  • 将生产虚拟机与生产磁盘进行匹配以获得一致的性能:在生产虚拟机未使用生产磁盘时通知您。对于您的 Citrix 虚拟机,请务必使用生产磁盘作为生产虚拟机。

  • 考虑增加 VPN 网关 SKU 的大小以解决 CPU 过高的问题:在 VPN 网关 SKU 不适合您的使用时通知您。如果您有大量 VPN 用户在访问 Citrix 资源时可能受到 VPN 网关性能的影响,请启用此警报。

  • 考虑增加 VNet Gateway SKU 的大小,以解决 CPU 使用率持续偏高的问题:在 VNet Gateway SKU 不适合您的使用时通知您。如果您有大量 VNet 网关在 Citrix 资源的 VNet 之间路由流量时可能会受到影响,请启用此警报。

  • 升级 ExpressRoute 电路带宽以满足您的带宽需求:当您的 ExpressRoute 电路带宽不适合您当前的使用情况时,通知您。当您的 Citrix 基础架构有一条或多条 ExpressRoute 回路时,请使用此警报。
  • 启用加速联网以改善网络性能和延迟:通知您虚拟机何时会从使用加速联网中受益。使用此警报来确定哪些 Citrix 虚拟机需要启用加速联网。

卓越运营警报

  • 使用 Azure 策略在 Azure 环境中启用某些策略。以下是验证 Azure 策略是否到位的警报列表:

    • Azure 策略中强制执行“在资源上添加或替换标签”:用于验证所有 Citrix 资源均已正确标记。

    • 在 Azure 策略中强制执行“允许的位置”:用于验证对 Citrix 资源的访问是否仅限于特定位置,以防止来自不可信位置的恶意意图。

    • 在 Azure 策略中强制执行“允许的虚拟机 SKU”:用于防止创建超出环境成本参数的虚拟机。此政策有助于防止使用昂贵的 GPU 实例进行比特币挖矿。

    • Azure 策略中强制执行“继承资源组的标签”:用于验证资源组中的任何资源也继承分配给该资源组的标签。此策略可用于跟踪自动创建的 Citrix 资源。

  • 启用流量分析以查看对 Azure 资源流量模式的见解:在 Azure 资源未启用流量分析时通知您。用于保护 Citrix 资源并防止无意中或恶意访问可通过 Citrix 主机访问的数据。

  • 在网络性能监视器上实施 ExpressRoute 监视器以进行端到端监视:当 ExpressRoute 电路流量未用于保护 Citrix 资源时通知您。此策略有助于识别和防止通过 ExpressRoute 连接意外或恶意访问数据。

  • 将 Azure Monitor 添加到标记为生产的虚拟机 (VM):当生产虚拟机未启用 Azure 监视器时通知您。用于识别任何未运行 Azure 监视器的 Citrix 虚拟机。

  • 您的磁盘已超过 30 天未连接到 VM:在磁盘未被积极使用时通知您。可用于通过移除未使用的磁盘来降低存储成本。

Azure 服务运行状况警报

本部分提供建议配置的服务运行状况警报。该列表标识了 Citrix 部署使用的关键服务。每个警报都有简短的描述,包括跟踪此警报的重要原因。这些只需要配置一次,大约需要 15 分钟左右才能完成。我们建议订阅以下在 Azure 中运行的 Citrix 环境中最常使用的服务的通知警报:

  • API 管理:用于管理来自 Citrix Cloud 的 Azure 服务。

  • 活动日志和警报:用于监视 Citrix 服务器日志和生成警报。

  • 警报和指标:用于监视 Citrix 服务器指标和生成警报。

  • Azure Active Directory:用于对 Citrix 服务器、Azure 门户和Citrix 工作空间进行身份验证。

  • Azure 监视器:用于监视 Azure 中托管的 Citrix 资源。

  • Azure 策略:用于保护对 Azure 资源的访问并在整个 Citrix 环境中强制执行业务规则。

  • Azure 私有链接:用于从 Citrix 部署中连接到 Azure 服务。

  • Azure Sentinel:用于监视 Azure 中 Citrix 资源的安全性。

  • 备份:用于在云端备份您的 Citrix 资源。

  • ExpressRoute:用于将本地资源与 Azure 中的 Citrix 部署连接起来。

  • 密钥保管库:用于管理保护 Citrix 服务器卷和静态存储的用户数据的加密密钥。

  • 日志分析:用于监视日志,查找影响 Citrix 资源并需要警报的事件。

  • Microsoft Azure 门户:用于管理运行 Citrix 部署的 Azure 资源。

  • 网络基础架构:用于监视 Citrix 资源、本地数据中心和远程用户之间的通信。

  • 网络观察器:用于监视 Citrix 和 Azure 资源之间的网络流量。

  • 站点恢复:用于为 Citrix 部署提供高可用性和跨站点灾难恢复功能。

  • 存储:用于托管云中所有 Citrix 资源的启动卷和存储用户数据。

  • VPN 网关\ 虚拟广域网:用于将用户和本地资源与 Azure 中的 Citrix 部署连接起来。

  • 虚拟机:用于在 Azure 中托管 Citrix 工作负载。

  • 虚拟网络:用于在 Azure 云中托管的 Citrix 资源与远程用户和本地数据中心之间进行通信。

在配置这些服务警报时,请注意您的环境中应包含的其他服务。

Citrix

本节介绍可用于监视 Azure 中的 Citrix Virtual Apps and Desktops (CVAD) 部署的 Citrix 工具和服务。

Citrix 监视器

Citrix Monitor 是 Citrix 推荐的用于监视您的 Citrix Cloud 部署的工具。该工具由以下组件组成:

  • 仪表板:主显示屏,提供环境的实时概览。 控制面板 包括关键指标,例如连接和计算机故障、总会话数、平均登录时长和 Citrix VDA 主机状态。所有报告和图表都提供了对已发现问题的深入分析功能。

  • 趋势:提供以下方面的趋势信息:会话、故障、登录性能、负载评估、容量管理、计算机使用情况、资源利用率和应用程序探测。

  • 警报和警报策略:为预定义的 Citrix 警报策略设置警报的界面。

  • 应用程序:用于管理应用程序和桌面探测器并查看应用程序分析的控制台。

趋势

仅保存过去 90 天的历史数据,可通过 Citrix Monitor 的“趋势”部分查看。您的 Citrix 部署需要监视的主要趋势如下:

连接故障 连接故障可能指向特定 Citrix VDA 虚拟机或特定用户的问题。连接失败选项卡提供有关由于以下常见问题而失败的连接的信息:客户端连接错误、许可错误、容量不可用、计算机故障或配置错误。单会话和多会话故障显示服务器无法启动、启动时挂起或未注册。

登录性能 登录性能概述了用户登录所花费的时间,并将它们分为以下几类:

  • 代理时间:这是 Citrix 代理客户端和 Citrix VDA 主机之间的会话所花费的时间。如果这段时间很长,则问题出在于 Citrix 基础架构,首先要验证 Cloud Connector 和任何 StoreFront 服务器是否有足够的容量。

  • 虚拟机启动时间:这是用户单击图标访问其桌面与为其启动虚拟机所花费的时间之间的时间。如果此指标看起来太长,请考虑增加交付组的缓冲容量。

  • HDX 连接时间:在客户端和 Citrix VDA 主机之间建立 HDX 连接所花费的时间。如果这个指标看起来很慢,请查看网络连接。验证数据包没有被过度丢弃,网络带宽利用率低于 80%。

  • 身份验证时间:完成远程会话的身份验证所花费的时间。如果这段时间很长,请研究使用哪些 AD 域控制器 (DC) 进行身份验证。验证您的站点和服务是否已配置,以便使用最近的域控制器进行身份验证,并且它们具有处理会话负载的计算能力。

  • GPO 时间:将组策略设置(包括 Citrix 策略)应用到会话所花费的时间。如果指标太长,您可以通过单击“详细深入分析”链接来查看每个 GPO 的时间。查看正在应用的 GPO 数量,要么合并 GPO,要么找到同步而不是异步应用 GPO 的第三方解决方案。

  • 登录脚本时间:在 Windows 资源管理器启动之前执行任何登录脚本所花费的时间。如果此指标过长,请调查通过 GPO 应用的登录脚本。寻找优化登录脚本的方法。

  • 配置文件加载时间:在交互式会话开始之前加载 Windows 用户配置文件所花费的时间。请务必记住,如果您使用的是 Citrix Profile Management,则加载时间包含在此指标中。如果您使用的是依赖于 Windows 配置文件的其他配置文件管理解决方案,则实际配置文件加载时间将包含在 Interactive Session 指标中。要缩短加载时间,您可以使用启用了“大文件处理”功能的 Citrix Profile Management 或移至流式配置文件。

  • 交互式会话时间:加载 Windows 配置文件后授予用户键盘和鼠标控制权所花费的时间。该指标包括三个阶段:pre-userinit、userinit 和 shell。这次包括第三方配置文件解决方案,这些解决方案在 Windows 配置文件加载之后和用户被授予桌面控制权之前运行。

资源利用率 此图表提供关键指标视图以及过去 24 小时与当前指标的比较。当您看到登录时间长或连接失败时,此图表可用于一目了然地确定性能瓶颈可能在哪里。如果您发现了计算机的趋势,则可以使用 Azure Monitor 进行进一步调查。

Citrix 策略控制资源监视,并在默认情况下将其启用。默认情况下,Citrix 进程监视策略处于禁用状态,因为它会消耗额外的资源,但它会提供进程的详细信息。

警报

与 Azure 警报类似,可以将 Citrix 警报配置为通过电子邮件向您发送警报,告知需要快速解决的重要指标。设置故障警报策略,以减少频繁查看站点指标所花费的工作量。这使您可以腾出时间来处理优先级更高的任务。使用高级许可证,您可以将值设置为“警告”和“严重”级别以接收电子邮件。在 Azure 中监视 Citrix 部署时,建议使用以下警报:

站点政策

站点策略汇总所有交付组、用户和计算机的警报,并为站点范围的事件提供警告。当您的网站资源不在基准区域之外时,这些警报可用于通知您。

  • 连接失败率:过去一小时内连接失败的百分比。仔细检查此计数器的基准值后设置警报。所有环境都有基本故障率,该故障率在用户尝试连接时自然发生,但理想值为 0%。

  • 连接失败次数:过去一小时内失败的连接数。仔细检查此计数器的基准值后设置警报。尽管理想值为 0,但所有环境都有基本故障计数,该次数在用户尝试连接时自然发生。

  • 失败的计算机(单会话操作系统):出现故障的单会话操作系统计算机的数量。当此计数器的值大于 1 时设置警报。

  • 失败的计算机(多会话操作系统):出现故障的多会话操作系统计算机的数量。当此计数器的值大于 1 时设置警报。

  • 平均登录时长:用户在过去一小时内的平均登录时间。Citrix 建议在平均登录时长超过 45 秒时发出警告。更好的指标可能是平均登录时长超过基准登录时间的 125%。

交付组和多会话策略

这些指标是在交付组、多会话或单会话计算机级别汇总的。当您需要专注于一组特定的资源来验证它们的性能是否符合预期时,这些指标非常有用。例如,当您想要监视专用于高管的虚拟桌面的用户体验时。在这种情况下,您可能会对任何失败率或平均登录事件发出更严格的警报。

  • 连接失败率:过去一小时内连接失败的百分比。仔细检查此计数器的基准值后设置警报。所有环境都有基本故障率,该故障率在用户尝试连接时自然发生,但理想值为 0%。
  • 连接失败次数:过去一小时内失败的连接数。仔细检查此计数器的基准值后设置警报。尽管理想值为 0,但所有环境都有基本故障计数,该次数在用户尝试连接时自然发生。
  • ICA RTT(平均):ICA 平均往返时间。Citrix 建议在 5 个或更多会话遇到 300 毫秒或更长时间的 ICA RTT 时设置警告警报。

  • 平均登录时长:用户在过去一小时内的平均登录时间。Citrix 建议在平均登录时长超过 45 秒时发出警告。更好的指标可能是平均登录时长超过基准登录时间的 125%。

用户政策

用户警报是唯一未聚合到多个资源中的警报。由于它们不是聚合的,因此当实际值超出可接受范围时,您可以提醒实际值。

  • ICA RTT:ICA/HDX 往返时间 (RTT),单位为毫秒 (ms)。任何低于 50 ms 的 RTT 延迟都被认为是理想的。通常,当 RTT 延迟在很长一段时间内超过 100 ms 时,用户体验就会开始下降。当 ICA RTT 大于设置的阈值时,将触发警报。

应用程序

Citrix Monitor 的“应用程序”部分提供了对已发布桌面和应用程序的运行状况和使用情况信息的见解。如果 Citrix Probe Agent 安装在计算机上并通过控制台进行配置,则会显示最近 24 小时的探测结果。Citrix Monitor 显示探测结果以及任何其他应用程序对故障和错误的分析,从而为您提供环境运行状况的摘要视图。探测器显示启动过程中应用程序失败的阶段,例如身份验证、枚举或 ICA 文件下载。在解决应用程序启动问题时,此信息非常宝贵。使用应用程序监视可以让您在问题变为中断之前主动解决问题。

Citrix Analytics

Citrix Analytics 是一项基于云的服务,用于汇总从跨设备、网络和应用程序的 Citrix 用户那里收集的数据。Citrix Analytics 的唯一目的是确定关系和趋势,从而得出切实可行的见解。分析依靠内置的机器学习 (ML) 算法来查找可能表明 Citrix 用户存在问题的行为异常。Citrix Analytics 与包括 Microsoft 在内的第三方提供商合作,收集数据进行分析,并提供以下产品:

Citrix Analytics for Security:重点关注用户和应用程序行为,主要寻找内部威胁或恶意行为。

Citrix Analytics for Performance:侧重于用户体验。性能分析使用来自虚拟应用程序和桌面的数据,根据定义用户体验的关键因素生成用户体验分数。

Citrix Analytics for Usage:重点介绍如何使用 Citrix 基础架构。使用情况分析通过微应用程序和SaaS/Web应用程序的时间轴摘要视图提供核心见解。

Citrix Analytics 与以下产品集成,以提供全面的视图:

  • Citrix Virtual Apps and Desktops

  • Citrix Application Delivery Controller (NetScaler)

  • Citrix Secure Workspace Access(访问控制)

  • Citrix Gateway

  • Citrix Content Collaboration

  • Citrix Endpoint Management

  • Citrix Secure Browser

  • Microsoft Graph 安全

  • Microsoft Active Directory

收集到的任何数据将保留 13 个月或 396 天或直到订阅终止后的 90 天。

数据可以集成到任何支持 Kafka 主题或基于 Logstash 的数据连接器的 SIEM 服务中,例如 Microsoft Sentinel。也可以以逗号分隔值 (CSV) 格式导出数据,以便在其他系统上进行分析。

可以通过您的 Citrix Cloud 帐户访问 Citrix Analytics。设置和配置后,您可以访问提供由 Citrix Analytics 编译的信息和建议的仪表板。

控制板 提供的信息 Citrix Analytics 服务
用户 用户行为模式 安全性
用户访问权限 风险域和入口/出口数据量摘要 安全性
应用程序访问 用户访问的域名、URL 和应用程序摘要 安全性
分享链接 组织共享链接模式摘要 安全性
访问保障地点 CVAD 用户的登录和访问详细信息摘要 安全性
报告 使用可用指标创建自定义报告 安全性
用户体验 关键网站性能指标摘要 性能
基础结构 站点虚拟机的状态和运行状况摘要 性能
Content Collaboration Content Collaboration 服务的基本使用数据摘要 使用情况
微应用 Citrix Workspace Service 基本用法摘要 使用情况
SaaS 和 Web 应用程序 通过安全工作空间访问服务访问的 Web 应用程序和 SaaS 应用程序的基本用法摘要 使用情况

Citrix Analytics-Security 为用户提供这些报告、风险评估分数和指标、共享链接和 IP 地址位置。可以创建自定义风险指标,也可以创建自定义策略,以完善用于风险评估的条件。您可以启用一项名为“请求最终用户响应”的功能,当发现异常活动时,该功能会立即提醒用户。监视列表是另一项功能,它允许您监视构成潜在威胁或更高风险的特定用户。您每周都会收到来自 Citrix Analytics-Security 的电子邮件,其中包含重要的风险指标和已识别的用户。

Citrix 托管服务

如果您没有资源直接监视 Citrix 基础架构,则可以联系并从 Citrix 托管服务团队购买这些服务。让 Citrix 托管服务团队监视您的 Citrix 基础架构时,您将获得以下好处:

  • 通过电子邮件或短信发出警报,全天候监视您的 Citrix 基础架构。

  • 使用为您的环境自定义的微调阈值设置自动警报。

  • 稳定可靠的环境由 Citrix 专家远程优化(无需办公空间)。

  • 自由处理其他优先级更高的任务。

  • 与聘请顾问到现场相比,可降低成本。

  • 直接访问 Citrix 工程部。

Citrix 托管服务团队使用 Citrix 工具套件完全远程工作来配置远程监视和警报。诊断数据将发送给 Citrix 团队进行处理。Citrix 团队审查计数器、日志和事件,以了解需要修复的趋势或模式。您会收到重要事件的实时警报和每月摘要报告。

结论

讨论包括 Microsoft 和 Citrix 提供的最受欢迎的工具和服务,用于管理您在Azure 中的Citrix部署。以下是使用这些工具时需要考虑的一些一般性建议和做法。

  • 通过 Azure Monitor 可以更轻松地跟踪虚拟机和网络的性能监视器指标。 Azure 监视器指标比 Citrix Monitor 中提供的指标更为精细。使用 Azure Monitor 获取性能指标,因为您可以更好地控制收集的指标。

  • 将监视数据保留期设置为尽可能短的时间,以满足您的业务需求。大多数监视数据仅在短时间内有用。无需长期存储监视数据,从而节省成本。创建自动化任务以清理存储帐户中的过时数据。

  • Azure 包括指标、日志、服务中断、计划维护、每月成本和安全警报。使用警报可以挽救生命。我们针对要为您的 Citrix 部署创建的警报提出了大量建议。您只需要实现环境中最有意义的那些即可。通过短信和电子邮件发送重要警报,确保快速采取行动。每季度在日历上设置提醒,以便进入并更新警报通知列表。

  • 对指标进行监视和警报需要按月付费。明智地选择要跟踪的指标。如果您不打算在警报触发时采取行动,请考虑是否仍需要保持该指标。

  • 为您的 Citrix 资源组设置自定义控制面板,并启用指向 Sentinel、服务运行状况、流量分析、顾问等关键服务的链接。在显示您的 ExpressRoute 或 VPN 连接、Cloud Connector 和 Citrix VDA 主机性能的仪表板图表中包括。将控制面板的访问权限限制为仅限需要该信息的个人,以防止任何敏感信息无意中传递给非预期的受众。

  • 对问题进行故障排除时,请查看多个数据源,以帮助将症状与根本原因关联起来。例如,如果平均登录时长很长,则可以在 Azure 中查看指标以确定资源限制存在的位置。

  • 启用流量分析和 NSG 日志是查看流量是否来自意外位置的最佳方法。使用这些信息,您可以简化网络通信。使用这些信息创建 Azure 策略,阻止来自这些意外位置的入站流量。

更多信息参考资料

在 Azure 中监视 DaaS 解决方案