Granularidad y retención de datos

Agregar valores de datos

Monitor Service recopila una serie de datos, incluidos el uso de las sesiones de usuario, la información del rendimiento de los inicios de sesión de usuario, la información del equilibrio de carga de las sesiones y la información de fallos de conexión y de las máquinas. Los datos se agregan de forma diferente en función de la categoría. Para interpretar los datos, es fundamental comprender la agregación de los valores de los datos presentados mediante las API de Método de OData. Por ejemplo:

  • Los errores de máquinas y sesiones conectadas se producen durante un período de tiempo. Por lo tanto, se exponen como máximos a lo largo de un período de tiempo.
  • La duración del inicio de sesión es una medida de tiempo, por lo que se expone como el promedio en las métricas tomadas a lo largo de un período de tiempo.
  • Los recuentos de inicio de sesión y los fallos de conexión son el número de casos a lo largo de un período de tiempo, por lo que se exponen como sumas para un período de tiempo.

Evaluar datos simultáneos

Las sesiones deben superponerse para considerarse simultáneas. No obstante, cuando el intervalo de tiempo es de 1 minuto, todas las sesiones en ese minuto (se superpongan o no) se consideran simultáneas; es decir, el tamaño del intervalo es tan pequeño que se considera que el esfuerzo de rendimiento que conlleva un cálculo más preciso no añade mucho valor. Si las sesiones se producen en la misma hora, pero no en el mismo minuto, no se consideran superpuestas.

Correlacionar tablas de resumen con datos sin procesar

El modelo de datos representa las métricas de dos maneras diferentes:

  • Las tablas de resumen representan vistas agregadas de las métricas por minuto, por hora y por día.
  • Los datos sin procesar representan eventos individuales o de estado actual de seguimiento de una sesión, conexión, aplicación y otros objetos.

Al intentar establecer una correlación entre las llamadas de la API o en el modelo de datos mismo, es importante comprender los conceptos y las limitaciones siguientes:

  • No hay datos de resumen para intervalos parciales. Los resúmenes de métricas están diseñados para satisfacer las necesidades de tendencias históricas en períodos de tiempo prolongados. Estas métricas se agregan en la tabla de resumen para intervalos completos. No habrá datos de resumen para un intervalo parcial al comienzo (en los datos más antiguos) de la recopilación de datos ni al final de la misma. Cuando se consultan los datos agregados de un día (Intervalo=1440), esto significa que los días incompletos al principio y los más recientes no tendrán datos. Aunque es posible que existan datos sin formato para esos intervalos parciales, estos datos no se resumirán. Para determinar el intervalo combinado más antiguo y más reciente para una granularidad de datos en particular, se puede usar la fecha de resumen (SummaryDate) máxima y mínima de una tabla de resumen. La columna SummaryDate representa el inicio del intervalo. El valor de la columna Granularity representa la duración del intervalo para los datos agregados.
  • Correlación por tiempo. Las métricas se agregan en la tabla de resumen para intervalos completos, como se ha descrito antes. Se pueden usar para descubrir tendencias históricas, pero los eventos sin procesar pueden ser más actualizados en los datos de estado que lo que se resumió para el análisis de tendencias. En cualquier comparación basada en el tiempo entre datos de resumen y datos sin procesar, hay que tener en cuenta que no habrá datos de resumen para intervalos parciales que puedan ocurrir ni para el comienzo o el final del periodo de tiempo en cuestión.
  • Eventos latentes y perdidos. Las métricas agregadas en tablas de resumen pueden ser ligeramente inexactas si hay eventos perdidos o latentes en el periodo de agregación. Aunque Monitor Service intenta mantener un alto nivel de precisión del estado actual, no vuelve atrás en el tiempo para recalcular la agregación en las tablas de resumen para eventos perdidos o latentes.
  • Alta disponibilidad de conexiones. Durante la alta disponibilidad de conexiones (HA), habrá huecos en los recuentos de conexiones actuales en los datos de resumen, pero las instancias de sesión seguirán ejecutándose en los datos sin procesar.
  • Períodos de retención de datos. Los datos de las tablas de resumen se conservan siguiendo una programación de limpieza distinta de la programación para datos de eventos sin procesar. Puede que falten datos porque se hayan limpiado las tablas de resumen y de datos sin procesar. Los períodos de retención también pueden diferir según las distintas granularidades de los datos de resumen. Una granularidad de datos menor (minutos) se limpia más rápidamente que una granularidad de datos mayor (días). Si faltan datos de una granularidad debido a una limpieza, puede que los que encuentre en una granularidad mayor. Puesto que las llamadas de API solo devuelven la granularidad solicitada, si no se reciben datos para una granularidad, eso no significa que los datos no existan en una granularidad mayor, para el mismo periodo de tiempo.
  • Zonas horarias. Las métricas se guardan con marcas de hora UTC. Las tablas de resumen se agregan en límites de una hora de la zona horaria. Para las zonas horarias que no caen en límites de una hora, puede haber una discrepancia en cuanto a dónde se agregan los datos.

Granularidad y retención

La granularidad de los datos agregados obtenida por Director es una función del intervalo de tiempo (T) solicitado. Las reglas son las siguientes:

  • 0 < T < = 1 hora, se utiliza granularidad de minutos
  • 0 < T <= 30 días, se utiliza granularidad de horas
  • T > 31 días, se utiliza granularidad de días

Los datos solicitados que no provienen de datos agregados provienen de la información sin procesar sobre sesiones y conexiones. Estos datos tienden a aumentar rápidamente y, por lo tanto, tienen su propia configuración de limpieza. La limpieza de la base de datos garantiza que solo se conserven los datos que sean relevantes a largo plazo. Esto garantiza un mejor rendimiento, al tiempo que se mantiene la granularidad necesaria para crear informes. Los clientes de Platinum pueden cambiar la retención de limpieza por la cantidad de días de retención que quieran; si no la cambian, se usa la predeterminada.

Para acceder a los parámetros, ejecute los siguientes comandos de PowerShell en el Delivery Controller:

asnp Citrix.*
 Get-MonitorConfiguration
 Set-MonitorConfiguration -<setting name> <value>

Los parámetros siguientes se usan para controlar la limpieza:

  Nombre del parámetro Limpieza afectada Valor predeterminado Platinum (días) Valor predeterminado sin Platinum (días)
1 GroomSessionsRetentionDays Retención de registros de conexión y de sesión después de cerrar la sesión 90 7
2 GroomFailuresRetentionDays Registros de MachineFailureLog y ConnectionFailureLog 90 7
3 GroomLoadIndexesRetentionDays Registros de LoadIndex 90 7
4 GroomDeletedRetentionDays Entidades de máquina, catálogo de máquinas, grupo de escritorios e hipervisor cuyo estado de ciclo de vida (LifecycleState) es “Eliminado” (Deleted). Esta acción también elimina los registros de Session, SessionDetail, Summary, Failure o LoadIndex relacionados. 90 7
5 GroomSummariesRetentionDays Registros de DesktopGroupSummary, FailureLogSummary y LoadIndexSummary. Datos agregados, de granularidad diaria. 90 7
6 GroomMachineHotfixLogRetentionDays Revisiones hotfix aplicadas a las máquinas de VDA y Controllers 90 90
7 GroomMinuteRetentionDays Datos agregados, de granularidad de minuto 3 3
8 GroomHourlyRetentionDays Datos agregados: granularidad horaria 32 7
9 GroomApplicationInstanceRetentionDays Historial de instancia de aplicación 90 0
10 GroomNotificationLogRetentionDays Registros del registro de notificaciones 90  
11 GroomResourceUsageRawDataRetentionDays Datos de utilización de recursos: datos sin procesar 1 1
12 GroomResourceUsageMinuteDataRetentionDays Datos resumidos de utilización de recursos: granularidad de minuto 7 7
13 GroomResourceUsageHourDataRetentionDays Datos resumidos de utilización de recursos: granularidad de hora 30 7
14 GroomResourceUsageDayDataRetentionDays Datos resumidos de utilización de recursos: granularidad de día 90 7
15 GroomProcessUsageRawDataRetentionDays Datos de utilización de procesos: datos sin procesar 1 1
16 GroomProcessUsageMinuteDataRetentionDays Datos de utilización de procesos: granularidad de minuto 3 3
17 GroomProcessUsageHourDataRetentionDays Datos de utilización de procesos: granularidad de hora 7 7
18 GroomProcessUsageDayDataRetentionDays Datos de utilización de procesos: granularidad de día 30 7
19 GroomSessionMetricsDataRetentionDays Datos de métricas de sesiones 7 7
20 GroomMachineMetricDataRetentionDays Datos de métricas de máquinas 3 3
21 GroomMachineMetricDaySummaryDataRetentionDays Datos resumidos de métricas de máquinas 90 7
22 GroomApplicationErrorsRetentionDays Datos de errores de aplicaciones 1 1
23 GroomApplicationFaultsRetentionDays Datos de fallos de aplicaciones 1 1

Precaución: La modificación de los valores en la base de datos del servicio de supervisión (Monitor Service) requiere reiniciar el servicio para que los nuevos valores tengan efecto. Se recomienda realizar cambios en la base de datos de Monitor Service solo cuando se lo indique el personal de asistencia técnica de Citrix.

Notas sobre la retención de limpieza:

  • Sitios con licencias Platinum: se puede actualizar la configuración de retención de limpieza de datos con cualquier cantidad de días.
    • Excepción: GroomApplicationErrorsRetentionDays y GroomApplicationFaultsRetentionDays están limitados a 31 días. GroomProcessUsageRawDataRetentionDays está limitado a 1 día.
  • Sitios con licencias Enterprise: la retención de limpieza de datos para todos los parámetros se limita a 31 días.
  • Todo los demás sitios: la retención de limpieza de datos para todos los parámetros se limita a 7 días.

La retención de datos durante largos periodos de tiempo tiene las implicaciones siguientes en los tamaños de las tablas:

  • Datos por hora. Si se conservan datos por hora en la base de datos durante dos años, un sitio con 1000 grupos de entrega puede hacer que la base de datos crezca así:

    1000 grupos de entrega x 24 horas/día x 365 días/año x 2 años = 17 520 000 filas de datos. El impacto que esta gran cantidad de datos tiene en el rendimiento de las tablas agregadas es importante. Puesto que los datos de panel de mandos se sacan de esta tabla, los requisitos del servidor de la base de datos pueden ser altos. Si la cantidad de datos es excesiva, el impacto en el rendimiento puede resultar significativo.

  • Datos de sesiones y eventos. Estos datos se recopilan cada vez que comienza una sesión y se realiza una conexión o reconexión. En sitios grandes (100 000 usuarios), estos datos pueden crecer muy rápidamente. Por ejemplo, las tablas correspondientes a dos años recopilarían más de un TB de datos, para lo cual se necesitaría una base de datos de nivel empresarial de gama alta.