数据的粒度与保留

数据值的聚合与汇总

Monitor Service 收集各种数据,包括用户会话使用情况、用户登录性能详细信息、会话负载平衡详细信息以及连接和计算机故障信息。数据根据其类别以不同方式进行聚合。了解使用 OData 方法 API 呈现的数据值聚合对于解释数据至关重要。例如:

  • 连接会话和计算机故障在一段时间内发生。因此,它们以一段时间内的最大值形式公开。
  • 登录持续时间是时间长度的度量,因此以一段时间内的平均值形式公开。
  • 登录计数和连接故障是某段时间内发生次数的计数,因此以一段时间内的总和形式公开。

并发的数据评估

会话必须重叠才能被视为并发。但是,当时间间隔为 1 分钟时,该分钟内的所有会话(无论是否重叠)都被视为并发。由于间隔太小,计算精度所涉及的性能开销不值得其增加的价值。如果会话发生在同一小时内,但不在同一分钟内,则不视为重叠。

摘要表与原始数据的关联

数据模型以两种不同方式表示指标:

  • 摘要表表示指标的聚合视图,以每分钟、每小时和每天的时间粒度。
  • 原始数据表示在会话、连接、应用程序和其他对象中跟踪的单个事件或当前状态。

尝试跨 API 调用或在数据模型本身内关联数据时,了解以下概念和限制非常重要:

  • 部分间隔无摘要数据。指标摘要旨在满足长期历史趋势的需求。这些指标会聚合到摘要表中,用于完整的间隔。在数据收集的开始(最旧的可用数据)或结束时,没有部分间隔的摘要数据。查看一天的聚合数据(间隔=1440)时,这意味着第一个和最近的不完整日期没有任何数据。尽管这些部分间隔可能存在原始数据,但它们从不进行汇总。您可以通过从特定摘要表中提取最小和最大 SummaryDate 来确定特定数据粒度的最早和最晚聚合间隔。SummaryDate 列表示间隔的开始。Granularity 列表示聚合数据间隔的长度。
  • 按时间关联。如上一节所述,指标会聚合到摘要表中,用于完整的间隔。它们可用于历史趋势,但原始事件的状态可能比为趋势分析而汇总的数据更具时效性。任何基于时间的摘要数据与原始数据比较都必须考虑到,对于可能发生的部分间隔或时间段的开始和结束,没有摘要数据。
  • 遗漏和延迟事件。 如果事件在聚合期间被遗漏或延迟,聚合到汇总表中的指标可能会略有不准确。尽管监控服务尝试维护准确的当前状态,但它不会回溯时间来重新计算汇总表中遗漏或延迟事件的聚合。
  • 连接高可用性。 在连接高可用性期间,当前连接的汇总数据计数中会出现空白,但会话实例仍将在原始数据中运行。
  • 数据保留期。 汇总表中的数据按照与原始事件数据不同的清理计划进行保留。数据可能因已从汇总表或原始表中清理而丢失。对于不同粒度的汇总数据,保留期也可能不同。较低粒度的数据(分钟)比较高粒度的数据(天)清理得更快。如果由于清理而导致某个粒度的数据丢失,则可以在更高粒度中找到它。由于 API 调用仅返回请求的特定粒度,因此某个粒度没有数据并不意味着同一时间段内更高粒度的数据不存在。
  • 时区。 指标以 UTC 时间戳存储。汇总表按小时时区边界进行聚合。对于不属于小时边界的时区,数据聚合的位置可能存在一些差异。

数据粒度和保留

Director 检索的聚合数据的粒度是所请求的时间 (T) 跨度的函数。规则如下:

  • 0 < T <= 1 小时 - 使用每分钟粒度
  • 0 < T <= 30 天 - 使用每小时粒度
  • T > 31 天 - 使用每日粒度

未聚合的请求数据来自原始会话和连接信息。此数据往往增长迅速,因此有其自己的清理设置。清理可确保仅保留长期相关的有用数据。清理可确保更好的性能,同时保持报告所需的粒度。Premium 许可站点的客户可以将其清理保留期更改为所需的保留天数,否则将使用默认值。如果与站点数据库失去连接,监控服务将使用下表中指定的 Premium 权利的默认保留天数。

To access the settings, run the following PowerShell commands on the Delivery Controller™:

asnp Citrix.*
 Get-MonitorConfiguration
 Set-MonitorConfiguration -<setting name> <value>
<!--NeedCopy-->
# 设置名称 受影响的架构表 监控页面中受影响的表和图表 Premium 的保留天数 高级的保留天数
1 清理会话保留天数 监控数据.会话 和 监控数据.连接 表 此设置影响趋势页面上的会话详细信息、按用户会话划分的登录持续时间以及基于应用程序的使用情况表。 90 31
2 清理故障保留天数 监控数据.机器故障日志 和 监控数据.连接故障日志 趋势页面:此设置影响故障选项卡上的图表和表格。 90 31
3 清理负载索引保留天数 监控数据.负载索引 此设置会影响“趋势”页面上“负载评估器索引”选项卡中显示的数据。 3 3
4 GroomDeletedRetentionDays MonitorData.Machine, MonitorData.Catalog, MonitorData.DesktopGroup, and MonitorData.Hypervisor entities that have a LifecycleState of ‘Deleted’. This setting also deletes any related Session, SessionDetail, Summary, Failure, or LoadIndex records. 生命周期状态为“已删除”的计算机、目录、桌面组和虚拟机监控程序实体。此设置还会删除任何相关的会话、会话详细信息、摘要、故障或负载指数记录。 90 31
5 GroomSummariesRetentionDays MonitorData.DesktopGroupSummary, MonitorData.FailureLogSummary, and MonitorData.LoadIndexSummary 此设置会影响“趋势”页面上的所有图表数据。 365 31
6 GroomMachineHotfixLogRetentionDays 监控数据.热修复 此设置会影响“计算机详细信息”页面上显示的 VDA 热修复数据。 90 31
7 清理分钟保留天数 所有摘要表 此设置会影响“趋势”页面上显示的“最近 2 小时”时间段的图表。 3 3
8 清理每小时保留天数 所有汇总表 这会影响趋势页面上显示的每周图表。 32 31
9 清理应用程序实例保留天数 监控数据.应用程序实例 此设置会影响容量管理选项卡上的图表和表格以及趋势页面上的应用程序使用情况表格。 90 不适用于此
10 清理通知日志保留天数 监控数据.通知日志 此设置会影响监视器上显示的警报。 90 不适用于此
11 清理资源使用原始数据保留天数 监控数据.资源利用率 此设置影响“历史计算机利用率”计算机详细信息页面中显示的 CPU 和内存图表。 3 3
12 清理资源使用情况分钟数据保留天数 监控数据.资源利用率摘要 此设置影响“历史计算机利用率”计算机详细信息页面中“最近 2 小时”时间段的 CPU 和内存图表。 7 7
13 清理资源使用小时数据保留天数 监控数据.资源利用率摘要 此设置影响在“历史计算机利用率”计算机详细信息页面中看到的 CPU 和内存图表。 30 30
14 清理资源使用情况日数据保留天数 监控数据.资源利用率摘要 此设置影响在趋势页面上计算机的“资源利用率”以及特定计算机的“计算机利用率”页面中看到的 CPU 和内存图表。 365 31
15 清理进程使用原始数据保留天数 监控数据.进程利用率 此设置影响在计算机历史使用情况页面上显示的每进程资源趋势信息。 1 1
16 清理进程使用分钟数据保留天数 监控数据.进程利用率分钟汇总 此设置会影响“历史计算机利用率”页面上显示的“最近 2 小时”的每个进程的 CPU 和内存使用情况图表。 3 3
17 清理进程使用小时数据保留天数 监控数据.进程利用率小时汇总 此设置会影响计算机历史使用情况页面上显示的每个进程的 CPU 和内存使用趋势。 7 7
18 清理进程使用日数据保留天数 监控数据.进程利用率日摘要 此设置影响计算机历史使用情况页面上显示的每个进程的 CPU 和内存使用趋势。 30 30
19 会话指标数据清理保留天数 监控数据.会话指标 此设置影响用户详细信息页面上“会话性能”选项卡中显示的所有图表。 1 1
20 清理机器指标数据保留天数 监控数据.机器指标 此设置影响趋势页面上“资源利用率”选项卡中的图表和表格。 3 3
21 清理机器指标每日汇总数据保留天数 监控数据.机器指标每日汇总 此设置影响趋势页面上“资源利用率”选项卡中的图表和表格。 365 31
22 清理应用程序错误保留天数 监控数据.应用程序错误 此设置影响应用程序页面上“应用程序错误”列中显示的错误详细信息。 1 1
23 应用程序故障清理保留天数 监控数据.应用程序故障 此设置影响“应用程序”页面上的“应用程序故障”列。 1 1

注意:

修改 Monitor Service 数据库上的值需要重新启动服务以使新值生效。建议您仅在 Citrix 支持的指导下对 Monitor Service 数据库进行更改。

The settings GroomProcessUsageRawDataRetentionDays, GroomResourceUsageRawDataRetentionDays, and GroomSessionMetricsDataRetentionDays are limited to their default values of 1, while GroomProcessUsageMinuteDataRetentionDays is limited to its default value of 3. The PowerShell commands to set these values have been disabled, as the process usage data tends to grow quickly. Also, license based retention settings are as follows:

  • 高级版许可站点 - 所有设置的清理保留期限制为 1000 天(Citrix 建议 365 天)。
  • 进阶版许可站点 - 所有设置的清理保留期限制为 31 天。
  • 所有其他站点 - 所有设置的清理保留期限制为 7 天。

例外:

  • GroomApplicationInstanceRetentionDays can be set only in Premium licensed sites.
  • GroomApplicationErrorsRetentionDays and GroomApplicationFaultsRetentionDays are limited to 31 days in Premium licensed sites.

将数据保留较长时间会对表的大小产生以下影响:

  • 每小时数据。 如果允许每小时数据在数据库中保留长达两年,一个拥有 1000 个交付组的站点可能会导致数据库按如下方式增长:

    1000 个交付组 x 24 小时/天 x 365 天/年 x 2 年 = 17,520,000 行数据。聚合表中如此大量的数据对性能的影响是巨大的。鉴于仪表板数据是从此表中提取的,因此对数据库服务器的要求可能很高。过多的数据可能会对性能产生显著影响。

  • 会话和事件数据。 每次启动会话和建立连接/重新连接时收集的数据。对于大型站点(10 万用户),此数据增长迅速。例如,这些表两年内将收集超过 1 TB 的数据,需要高端企业级数据库。

数据的粒度与保留