Granularidad y retención de datos
Agregación de valores de datos
El servicio Monitor recopila varios datos, incluido el uso de sesiones de usuario, detalles de rendimiento de inicio de sesión de usuario, detalles de equilibrio de carga de sesiones e información de fallos de conexión y máquina. Los datos se agregan de forma diferente según su categoría. Comprender la agregación de los valores de datos presentados mediante las API de método OData es fundamental para interpretar los datos. Por ejemplo:
- Las sesiones conectadas y los fallos de máquina se producen durante un período. Por lo tanto, se exponen como máximos durante un período de tiempo.
- La duración del inicio de sesión es una medida de la duración, por lo tanto, se expone como un promedio durante un período de tiempo.
- El recuento de inicios de sesión y los fallos de conexión son recuentos de ocurrencias durante un período, por lo tanto, se exponen como sumas durante un período de tiempo.
Evaluación de datos simultáneos
Las sesiones deben superponerse para considerarse simultáneas. Sin embargo, cuando el intervalo de tiempo es de 1 minuto, todas las sesiones de ese minuto (se superpongan o no) se consideran simultáneas. El tamaño del intervalo es tan pequeño que la sobrecarga de rendimiento que implica el cálculo de la precisión no compensa el valor añadido. Si las sesiones se producen en la misma hora, pero no en el mismo minuto, no se considera que se superpongan.
Correlación de tablas de resumen con datos sin procesar
El modelo de datos representa las métricas de dos maneras diferentes:
- Las tablas de resumen representan vistas agregadas de las métricas en granularidades de tiempo por minuto, hora y día.
- Los datos sin procesar representan eventos individuales o el estado actual rastreado en la sesión, la conexión, la aplicación y otros objetos.
Al intentar correlacionar datos entre llamadas a la API o dentro del propio modelo de datos, es importante comprender los siguientes conceptos y limitaciones:
- No hay datos de resumen para intervalos parciales. Los resúmenes de métricas están diseñados para satisfacer las necesidades de las tendencias históricas durante largos períodos de tiempo. Estas métricas se agregan a la tabla de resumen para intervalos completos. No hay datos de resumen para un intervalo parcial al principio (datos más antiguos disponibles) de la recopilación de datos ni al final. Al ver agregaciones de un día (Intervalo=1440), esto significa que los días incompletos más antiguos y más recientes no tienen ningún dato. Aunque los datos sin procesar puedan existir para esos intervalos parciales, nunca se resumen. Puede determinar el intervalo agregado más temprano y más reciente para una granularidad de datos particular extrayendo la fecha de resumen mínima y máxima (SummaryDate) de una tabla de resumen particular. La columna SummaryDate representa el inicio del intervalo. La columna Granularity representa la duración del intervalo para los datos agregados.
- Correlación por tiempo. Las métricas se agregan a la tabla de resumen para intervalos completos, como se describe en la sección anterior. Se pueden usar para tendencias históricas, pero los eventos sin procesar pueden estar más actualizados en el estado de lo que se ha resumido para el análisis de tendencias. Cualquier comparación basada en el tiempo de datos de resumen con datos sin procesar debe considerar que no hay datos de resumen para intervalos parciales que puedan ocurrir o para el principio y el final del período de tiempo.
- Eventos perdidos y latentes. Las métricas que se agregan en la tabla de resumen pueden ser ligeramente inexactas si los eventos se pierden o son latentes para el período de agregación. Aunque el Servicio de supervisión intenta mantener un estado actual preciso, no retrocede en el tiempo para volver a calcular la agregación en las tablas de resumen para los eventos perdidos o latentes.
- Alta disponibilidad de la conexión. Durante la alta disponibilidad de la conexión, habrá lagunas en los recuentos de datos de resumen de las conexiones actuales, pero las instancias de sesión seguirán ejecutándose en los datos sin procesar.
- Períodos de retención de datos. Los datos de las tablas de resumen se retienen con una programación de depuración diferente a la de los datos de eventos sin procesar. Es posible que falten datos porque se han depurado de las tablas de resumen o sin procesar. Los períodos de retención también pueden diferir para distintas granularidades de los datos de resumen. Los datos de menor granularidad (minutos) se depuran más rápidamente que los datos de mayor granularidad (días). Si faltan datos de una granularidad debido a la depuración, es posible que se encuentren en una granularidad superior. Dado que las llamadas a la API solo devuelven la granularidad específica solicitada, no recibir datos para una granularidad no significa que los datos no existan para una granularidad superior para el mismo período de tiempo.
- Zonas horarias. Las métricas se almacenan con marcas de tiempo UTC. Las tablas de resumen se agregan en los límites horarios de las zonas horarias. Para las zonas horarias que no coinciden con los límites horarios, puede haber alguna discrepancia en cuanto a dónde se agregan los datos.
Granularidad y retención
La granularidad de los datos agregados recuperados por Director es una función del período de tiempo (T) solicitado. Las reglas son las siguientes:
- 0 < T <= 1 hora: utiliza granularidad por minuto
- 0 < T <= 30 días: utiliza granularidad por hora
- T > 31 días: utiliza granularidad por día
Los datos solicitados que no provienen de datos agregados provienen de la información sin procesar de Sesión y Conexión. Estos datos tienden a crecer rápidamente y, por lo tanto, tienen su propia configuración de depuración. La depuración garantiza que solo los datos relevantes se conserven a largo plazo. La depuración garantiza un mejor rendimiento al tiempo que mantiene la granularidad necesaria para los informes. Los clientes con sitios con licencia Premium pueden cambiar la retención de depuración al número deseado de días de retención; de lo contrario, se utiliza el valor predeterminado. En caso de que haya una pérdida de conectividad con la base de datos del sitio, el Servicio de supervisión utilizará los días de retención predeterminados para la licencia Premium, como se especifica en la siguiente tabla.
Para acceder a la configuración, ejecute los siguientes comandos de PowerShell en el Delivery Controller™:
asnp Citrix.*
Get-MonitorConfiguration
Set-MonitorConfiguration -<setting name> <value>
<!--NeedCopy-->
| Nombre de la configuración | Depuración afectada | Días de retención para Premium | Días de retención para Advanced | ||
|---|---|---|---|---|---|
| 1 | GroomSessionsRetentionDays | Retención de registros de sesión y conexión después de la finalización de la sesión | 90 | 31 | |
| 2 | GroomFailuresRetentionDays | Registros de MachineFailureLog y ConnectionFailureLog | 90 | 31 | |
| 3 | GroomLoadIndexesRetentionDays | Registros de LoadIndex | 90 | 31 | |
| 4 | GroomDeletedRetentionDays | Entidades de máquina, catálogo, grupo de escritorios e hipervisor que tienen un LifecycleState de ‘Deleted’. Esta configuración también elimina cualquier registro relacionado de sesión, detalle de sesión, resumen, fallo o índice de carga. | 90 | 31 | |
| 5 | GroomSummariesRetentionDays | Registros de DesktopGroupSummary, FailureLogSummary y LoadIndexSummary. Datos agregados - granularidad diaria. | 365 | 31 | |
| 6 | GroomMachineHotfixLogRetentionDays | Revisiones aplicadas a las máquinas VDA y Controller | 90 | 31 | |
| 7 | GroomMinuteRetentionDays | Datos agregados - granularidad de minutos | 3 | 3 | |
| 8 | GroomHourlyRetentionDays | Datos agregados - granularidad horaria | 32 | 31 | |
| 9 | GroomApplicationInstanceRetentionDays | Historial de instancias de aplicación | 90 | No aplicable | |
| 10 | GroomNotificationLogRetentionDays | Registros de registro de notificaciones | 90 | No aplicable | |
| 11 | GroomResourceUsageRawDataRetentionDays | Datos de utilización de recursos - datos sin procesar | 3 | 3 | |
| 12 | GroomResourceUsageMinuteDataRetentionDays | Datos de resumen de utilización de recursos - granularidad por minuto | 7 | 7 | |
| 13 | GroomResourceUsageHourDataRetentionDays | Datos de resumen de utilización de recursos - granularidad por hora | 30 | 30 | |
| 14 | GroomResourceUsageDayDataRetentionDays | Datos de resumen de utilización de recursos - granularidad por día | 365 | 31 | |
| 15 | GroomProcessUsageRawDataRetentionDays | Datos de utilización de procesos - datos sin procesar | 1 | 1 | |
| 16 | GroomProcessUsageMinuteDataRetentionDays | Datos de utilización de procesos - granularidad por minuto | 3 | 3 | |
| 17 | GroomProcessUsageHourDataRetentionDays | Datos de utilización de procesos - granularidad por hora | 7 | 7 | |
| 18 | GroomProcessUsageDayDataRetentionDays | Datos de utilización de procesos - granularidad por día | 30 | 30 | |
| 19 | GroomSessionMetricsDataRetentionDays | Datos de métricas de sesión | 1 | 1 | |
| 20 | GroomMachineMetricDataRetentionDays | Datos de métricas de máquina | 3 | 3 | |
| 21 | GroomMachineMetricDaySummaryDataRetentionDays | Datos de resumen de métricas de máquina | 365 | 31 | |
| 22 | GroomApplicationErrorsRetentionDays | Datos de errores de aplicación | 1 | 1 | |
| 23 | GroomApplicationFaultsRetentionDays | Datos de fallos de aplicación | 1 | 1 | |
Precaución:
La modificación de valores en la base de datos del Servicio de supervisión requiere reiniciar el servicio para que los nuevos valores surtan efecto. Se recomienda realizar cambios en la base de datos del Servicio de supervisión solo bajo la dirección del Soporte de Citrix.
La configuración GroomProcessUsageRawDataRetentionDays, GroomResourceUsageRawDataRetentionDays y GroomSessionMetricsDataRetentionDays están limitadas a sus valores predeterminados de 1, mientras que GroomProcessUsageMinuteDataRetentionDays está limitada a su valor predeterminado de 3. Los comandos de PowerShell para establecer estos valores se han deshabilitado, ya que los datos de uso de procesos tienden a crecer rápidamente. Además, la configuración de retención basada en licencias es la siguiente:
- Sitios con licencia Premium - la retención de depuración para todas las configuraciones está limitada a 1000 días (Citrix recomienda 365 días).
- Sitios con licencia Advanced - la retención de depuración para todas las configuraciones está limitada a 31 días.
- Todos los demás sitios - la retención de depuración para todas las configuraciones está limitada a 7 días.
Excepciones:
- GroomApplicationInstanceRetentionDays solo se puede configurar en sitios con licencia Premium.
- GroomApplicationErrorsRetentionDays y GroomApplicationFaultsRetentionDays están limitados a 31 días en sitios con licencia Premium.
Retener datos durante períodos prolongados tiene las siguientes implicaciones en el tamaño de las tablas:
-
Datos por hora. Si se permite que los datos por hora permanezcan en la base de datos hasta por dos años, un sitio de 1000 grupos de entrega puede hacer que la base de datos crezca de la siguiente manera:
1000 grupos de entrega x 24 horas/día x 365 días/año x 2 años = 17,520,000 filas de datos. El impacto en el rendimiento de una cantidad tan grande de datos en las tablas de agregación es significativo. Dado que los datos del panel se extraen de esta tabla, los requisitos del servidor de la base de datos podrían ser grandes. Cantidades excesivamente grandes de datos podrían tener un impacto drástico en el rendimiento.
-
Datos de sesión y eventos. Datos recopilados cada vez que se inicia una sesión y se realiza una conexión/reconexión. Para un sitio grande (100 K usuarios), estos datos crecen rápidamente. Por ejemplo, el valor de dos años de estas tablas recopilaría más de un TB de datos, lo que requeriría una base de datos de nivel empresarial de gama alta.