Die Skalierbarkeit und Wirtschaftlichkeit der Bereitstellung von Citrix Virtual App- und Desktop-Diensten auf Azure

Das Ziel dieses Dokuments ist es, Unternehmen Orientierungshilfen zu geben, die sich auf die Bereitstellung von Citrix Virtual Applications und Desktops (CVAD) in der Microsoft Azure-Cloud begeben. Um unseren Kunden die bestmögliche Beratung zu bieten, haben wir uns entschlossen, die Antwort auf vier Schlüsselfragen zu ermitteln, die sich auf die Architektur- und Designentscheidungen von Citrix auswirken

  1. Was ist die effizienteste Instanz-Serie für das Hosting von CVAD
  2. Was ist der kostengünstigste Instanztyp in der effizientesten Familie
  3. Welche Auswirkungen hat der Machine Creation Services I/O (MCSIO) -Cache?
  4. Wie ist die Skalierbarkeit von Windows 10 Multisession im Vergleich zu Windows Server OS?

Citrix ist ein detaillierteres Papier erhältlich, das sich mit den Besonderheiten der Testmethodik und den während der Evaluierung erfassten Leistungsergebnissen befasst. Dieses Papier konzentriert sich auf die Ergebnisse auf hoher Ebene und bietet Anleitungen zum Entwerfen einer effizienten Citrix-Implementierung in der Microsoft Azure-Cloud.

Um die Leistung zu ermitteln, haben wir LoginVSI 4.1.32.1 verwendet, das simulierte Sitzungen für einen einzelnen Citrix Server erstellt. Die beiden Workloads, die wir zum Testen verwendet haben, werden wie folgt beschrieben:

  • Workload für Task-Worker — umfasst Segmente mit Microsoft Office 2016 Outlook, Excel, Internet Explorer, Adobe Acrobat und PDF Writer. Die Workload-Arbeitslast von Task Worker stellt keine hohen Anforderungen an die Umgebung und repräsentiert Benutzer, die nicht stark auf das System zugreifen.
  • Knowledge Worker Workload — umfasst Segmente mit Microsoft Office 2016 Outlook, Word, PowerPoint, Excel, Adobe Acrobat, FreeMind, PhotoViewer, Doro PDF Writer und umfasst das Anzeigen mehrerer 360p-Filme. Die Workload von Knowledge Worker stellt eine höhere Nachfrage in die Umgebung dar, einschließlich einer stärkeren Nutzung des verfügbaren Speichers, und stellt Benutzer dar, die stärker auf das System zugreifen.

Die Anzahl der Benutzer, die den Multi-Session-Test erfolgreich abgeschlossen haben, liefert einen wichtigen Leistungsindikator unter realen Bedingungen. Dieser Wert, der als VsiMax-Sitzungsanzahl bezeichnet wird, wird für die vergleichende Analyse verwendet. Die Anmelde-VSI-Workloads berechnen die Anzahl der VSIMax-Sitzungen, indem sie die Reaktionszeit eines einzelnen Benutzers auf dem System beobachten. VsiMax wird erreicht, wenn die Reaktionszeit deutlich unter den erwarteten Schwellenwert gesunken ist, der sich aus dem Basiswert abgeleitet hat, der nur mit einem einzigen Benutzer im System genommen wurde.

Um konservative Zahlen bereitzustellen, die ohne Fachwissen konsistent repliziert werden können, spiegeln alle Ergebnisse hier die Testausführung unter Verwendung von Standard-Citrix-Richtlinien und nicht optimierten Standardeinstellungen für Windows- und Office-Produkte wider. Sowohl die Leistung als auch die Dichte können durch die Anwendung von Citrix Optimierungstools wie dem Citrix WEM und verbessert werden Citrix Optimizer.

Welche ist die effizienteste Instanzserie?

Um die effizienteste Instanzserie zu finden, mussten wir die verschiedenen Instanzserien testen, ohne andere Variablen im Mix zu ändern. Das Basisimage war Windows Server 2016 mit der Version 1903.1 des Citrix VDA und einer standardmäßigen Festplatte (HDD) mit 128 GB Festplatte für das Laufwerk C: des Systems. Wir haben die 8-Kern-Instanztypen aus zwei Hauptgründen ausgewählt:

1) Sie repräsentieren das Arbeitspferd von Azure-Instanztypen für gehostete Sitzungen und sind im Allgemeinen die beliebteste Größe 2) Sie bieten eine gute Balance zwischen CPU/RAM und minimale Betriebssystemauswirkungen im Gegensatz zu einem kleineren 2-Core-System.

Das folgende Diagramm zeigt die Ergebnisse der Instanz-Familie zusammen mit den durchschnittlichen Kosten pro Benutzer und Stunde basierend auf den nutzungsabhängigen Preisen für die Region Azure US-West-2, in der die Tests durchgeführt wurden.

8-Kern-Leistung

Analyse

Die meisten dieser Instanztypen verwenden den gleichen Prozessor, Intel (R) Xeon (R) CPU E5-2673 v4 bei 2,30 GHz. Der Hauptunterschied besteht in der Menge des Arbeitsspeichers, der der virtuellen Maschine zur Verfügung steht. Weitere Informationen zu diesen verschiedenen Serien finden Sie unter Microsofts Webseite.

Im Allgemeinen haben die 8-Kern-Instanzen eine ziemlich ähnliche Leistung, insbesondere wenn Sie die physischen Kerne (D13_v2, D4_v2, L8s) im Vergleich zu Hyperthread-Kerne (F8s_v2, D8_v3, E8_v3) berücksichtigen. Wenn jedoch die Stundenkosten der Instanz berücksichtigt werden, bieten die Instanzen D13_v2 und F8S_v2 die effizientere Nutzung. Die E_v3- und LS_v1-Serie sind weniger kosteneffizient, da Microsoft eine höhere Prämie für speicheroptimierte und speicheroptimierte Instanzen verlangt. In Situationen, in denen die Anwendungen Ihres Benutzers extrem speicher- oder speicherintensiv sind, bieten diese Instanzen oft eine gute Kapitalrendite.

Empfehlungen

Wenn die Anwendungen Ihres typischen Benutzers CPU-intensiv sind und für die Ausführung keinen signifikanten Arbeitsspeicher benötigen, ist die kosteneffizienteste Leistung die F-Serie. Wählen Sie die F-Serie aus, wenn Sie hervorragende CPU-Reaktionszeiten benötigen und keinen nennenswerten Arbeitsspeicher benötigen. Wenn die Anwendungen Ihres Benutzers eine angemessene Menge an Speicher verbrauchen, verwenden Sie einen der D-Instanztypen, je nachdem, wie viel zusätzlicher Speicher pro Core für die Umgebung Ihres Benutzers benötigt wird.

Welcher ist der kosteneffektivste Instanztyp in der effizientesten Familie?

Als wir den breiten Test über Familien hinweg abgeschlossen hatten, erwarteten wir, dass eine einzelne Serie ein klarer Anführer sein würde. Die Ergebnisse überzeugten uns jedoch, dass die beiden besten Instanzfamilien für zusätzliche Tests die D-Serie und die F-Serie waren, wenn sie mit Standard-Datenträgerspeicher getestet wurden. Der nächste Schritt bestand darin, die spezifischen Größen zwischen 2 und 16 vCPUs innerhalb der Familien d_V2 und FS_v2 zu testen. Die Ergebnisse dieser Tests sind unten aufgeführt.

Leistung der Serien FS und D

Analyse

Die obige Grafik zeigt die Ergebnisse dieser Tests mit den höchsten Dichten von 74 und 63 Benutzersitzungen für Aufgabenarbeiter bzw. Knowledge Worker, die für den Instanztyp D14_v2 (16 Kerne, 112 GB RAM) erhalten werden. Da die Preise zwischen den Instanztypen variieren, bedeutet eine höhere Dichte nicht notwendigerweise niedrigere Kosten pro Benutzer.

Das Preismodell für Azure-Instanzen variiert je nach Region, Instanztyp und den bereitgestellten Ressourcen. Die obigen Grafiken enthalten auch die Kosteneffizienz jedes Instanztyps basierend auf den VDA-Benutzerdichten, die bei den Einzelservertests erreicht wurden. Die Kosten spiegeln die U.S. West 2 Pay-As-You-Go-Preise für Standard-VM-Instanzen ab September 2019 wider und beinhalten die Kosten für die Microsoft Windows-Lizenzierung.

Wie in der obigen Grafik gezeigt, zeigt der Instanztyp D13_v2 die niedrigsten Kosten pro Stunde pro Benutzer von 0,018 USD für einen Aufgabenarbeiter, wobei der F16s_v2 und F8s_v2 mit Kosten von 0,019 US-Dollar an zweiter Stelle stehen. Was den Wissensarbeiter betrifft, teilen sowohl die Instanztypen F16s_v2 als auch F8S_v2 die besten Stundenkosten von 0,025 USD, dicht gefolgt vom Instanztyp D13_v2 bei 0,026 US-Dollar.

Empfehlungen

In den Tests zeigten die Dichteergebnisse einen deutlichen Vorteil aus den schnelleren Prozessoren, die mit den Instanzen der FS v2-Serie verfügbar waren, wenn sie unter der schwereren Arbeitsbelastung des Wissensarbeiters standen. Das FS v2-Speicher-Core-Verhältnis ist jedoch niedriger als die Verhältnisse der D v2-Serie, und wir empfehlen, die Instanzen der FS v2-Serie nur zu verwenden, wenn der Speicherverbrauch für die Arbeitslast gering ist. Wenn Benutzer speicherintensive Anwendungen ausführen, ist die D_V2-Serie die beste Wahl.

Wenn die Kosten pro Benutzer ähnlich sind, wie z. B. bei F8S_v2 und F16s_v2, wählen Sie die kleineren Instanzgrößen aus, wenn eine der folgenden Bedingungen zutrifft:

  • Notwendigkeit der Ausfallsicherheit: Sie möchten weniger Benutzer während Wartungsfenstern beeinflussen
  • Notwendigkeit einer effizienten Energieverwaltung: Sie möchten ungenutzte Maschinen schnell abschalten

Wählen Sie die größeren Instanz-Größen aus, wenn eine der folgenden Bedingungen zutrifft:

  • Notwendigkeit eines reduzierten Managements: Sie möchten weniger Maschinen in der Umgebung verwalten
  • Benötigen Sie reduzierte API-Aufrufe: Sie benötigen weniger API-Aufrufe an die Azure-Infrastruktur für den Betrieb

Welche Auswirkungen hat der I/O-Cache von Machine Creation Services?

Die zum Testen verwendeten Instanztypen wurden mit Standardspeicher und nicht mit teurerem SSD-Speicher für das Systemlaufwerk auf der virtuellen Maschine konfiguriert. Da die Instanztypen mit SSD-Speicher kleinere ephemere Datenträger haben, auf denen die Auslagerungsdatei gespeichert ist, obwohl die Datenträger schneller waren, war die Skalierbarkeit geringer, da der Instanz nicht genügend Swapfile-Speicherplatz zur Verfügung stand, um den Bedarf an virtuellem Speicher unter höherer Last zu unterstützen.

Bei den von uns verwendeten Datenträgergrößen haben die HDD- und SSD-Datenträger eine ähnliche IOPS-Leistung (500). Während die SSD-Datenträger eine konsistentere Leistung aufweisen, sind die zusätzlichen Kosten nicht immer gerechtfertigt.

Wir haben uns dann entschieden, den Machine Creation Services I/O (MCSIO) -Cache als eine Möglichkeit zu betrachten, eine SSD-ähnliche Leistung mit den größeren Standarddatenträgern zu erzielen. Die Tests wurden mit der Citrix VDA-Version 1903.1 und Windows Server 2016 auf einem D5_v2-Instanztyp (16 vCPU, 56 GB RAM) abgeschlossen. Die folgende Tabelle zeigt die Zunahme der Benutzerdichte, die durch die Aktivierung des MCSIO-Cache mit der Last des Knowledge-Workers gewonnen wird.

MCSIO Leistung

Analyse

Wenn auf dem Betriebssystemdatenträger kein MCSIO-Cache aktiviert ist, lag der VSIMax-Benutzer-Score auf einer 128-GB-HDD bei 61, 74 auf einem 64-GB-SSD-Datenträger und 75 auf einem 128-GB-SSD-Datenträger. Die Aktivierung des MCSIO-Cache auf einem Standard-HDD-Datenträger bot tatsächlich eine bessere Leistung als eine SSD. Bei einem 4-GB-Cache, der auf der 64-GB-Datenträger aktiviert war, stieg die Punktzahl auf 76, und bei einem 2-GB-Cache stieg die Punktzahl leicht auf 77. Der Verlust des zusätzlichen Benutzers zwischen den Cachegrößen von 4 GB und 2 GB ist auf den zusätzlichen RAM zurückzuführen, der für den Cache verwendet wird und nicht für die Arbeitslast des Benutzers verfügbar ist.

Während MCSIO zu niedrigeren Kosten pro Benutzer und Stunde beiträgt, ist diese Zahl allein nicht signifikant. Die tatsächlichen Auswirkungen von MCSIO können bei der Betrachtung der Endbenutzererfahrung festgestellt werden. Die folgende Grafik zeigt den durchschnittlichen Rückgang der Reaktionszeit bei Verwendung von MCSIO.

MCSIO Login Antwort

Empfehlungen

Wenn die Benutzererfahrung bei der Prüfung der Leistung ein treibender Faktor ist, empfehlen wir, den MCSIO-Cache zu aktivieren. Wenn diese Option aktiviert ist, wird empfohlen, eine Standarddatenträger mit dem 2-GB-Cache zu verwenden, da sie die beste Verbesserung bietet, ohne die Benutzerdichte zu beeinträchtigen. Der MCSIO-Cache darf jedoch nicht auf virtuellen Maschinen aktiviert werden, die speichereinschränkt sind, z. B. die Instanztypen der F- oder FS-Serie, die für die Rechenleistung optimiert sind, aber niedrige Kernverhältnisse von Speicher zu CPU aufweisen.

Wie ist die Skalierbarkeit von Windows 10 Multisession im Vergleich zu Windows Server OS?

Mit der Veröffentlichung der Multisitzungs-Betriebssysteme Windows Server 2019 und Windows 10 dachten wir, es wäre am besten, einige Anleitungen dazu zu geben, wie sich das Client-Betriebssystem auf die Skalierbarkeit auswirken würde. Sowohl Windows Server 2019 als auch Windows 10 Multisitzungs-Betriebssysteme erfordern die neuere Citrix VDA-Version 1906.1. Windows 10 Multisession ist mit Windows Virtual Desktop (WVD) Entitlement verfügbar und gewährt dem Mandanten den Basispreis der VM (Linux-Preise). Diese Berechtigung erweitert auch die VM-Preise auf Windows Server 2016 und Windows Server 2019.

Die folgende Grafik zeigt die Dichteänderungen im Vergleich mit denselben Testläufen mit Windows Server 2016 unter Verwendung der Citrix VDA-Version 1906.1 auf derselben D4_v2-Instanz (8 vCPU, 28 GB RAM). Die unten angegebenen Preise verwenden die Linux-VM-Preise im Einklang mit der erforderlichen WVD-Berechtigung.

Leistung des Betriebssystems

Analyse

Im Vergleich zu den Windows Server 2016-Ergebnissen bot der Windows Server 2019 sowohl für den Wissensarbeiter als auch für den Aufgabenarbeiter eine geringfügig niedrigere Benutzerdichte, mit einem Rückgang von 7% für die Aufgabenarbeiter und einem Rückgang von 12% für Wissensarbeiter.

Der Vergleich von Windows Server 2019 auf Windows 10 Multisession-Workload führte zu 19% weniger Task-Worker und 32% weniger Wissensarbeiter. Dieser Leistungsabfall wird erwartet, da Windows 10 eine Vollclientversion ist und nicht für serverbasierte Berechnungen wie Windows Server 2016 und Windows Server 2019 optimiert ist.

Ein Kostenvorteil der Verwendung von Windows 10 Multisession besteht darin, dass keine RDS-CAL-Lizenzen erforderlich sind, damit sich Clients mit der virtuellen Maschine verbinden können. Dieser Kostenvorteil ist in den obigen Berechnungen nicht enthalten, da es sich zusätzlich zu den Azure-Kosten pro Stunde um Microsoft-Lizenzkosten handelt.

Empfehlungen

Wenn Sie ein Upgrade von Windows Server 2016 auf Windows Server 2019 planen, rechnen Sie damit, die Anzahl der virtuellen Maschinen um etwa 10% zu erhöhen. Wenn Sie planen, Windows 10 Multisession für Hosting von Anwendungen zu verwenden, die den Windows-Client aus Kompatibilitätsgründen benötigen, denken Sie daran, dass die Dichte niedriger ist, was zu 30 % zusätzlichen Kosten für die Serverbetriebssysteme führt. Die Windows 10 Multisession ermöglicht Benutzern jedoch den Zugriff auf den Windows Store, was den Serverbetriebssystemen nicht zur Verfügung steht.

Schlussfolgerung

Der Azure-Instanztyp, den Sie zur Bereitstellung virtueller Anwendungsworkloads von Citrix auswählen, ist ein kritisches Element, das die Benutzerdichte und Skalierbarkeit und damit die Kosten pro Benutzer für ein Azure-Bereitstellungsmodell bestimmt. Wie gezeigt, haben die verschiedenen Instanztypen in Azure Vorteile für bestimmte Workloads, wie hohe Rechenanforderungen oder zusätzlichen Speicher. Normalerweise bietet eine D13_v2-Instanz mit Standarddatenträger und einem aktivierten 2-GB-MCSIO-Cache die beste Benutzerleistung zu den niedrigsten Kosten. Berücksichtigen Sie das Betriebssystem Windows 10 Multisession, wenn Sie Windows Store, Anwendungskompatibilität oder eine echte Windows-Clienterfahrung benötigen.

Die hier vorgestellten Citrix on Azure-Ergebnisse stellen nur Richtlinien für die Konfiguration Ihrer Azure-Lösung dar. Wenn Sie keine Daten über Ihre spezifischen Benutzer-Workloads haben, dienen die hier bereitgestellten Zahlen als Ihre Entwurfsschätzungen. Bevor Sie endgültige Größen- und Bereitstellungsentscheidungen treffen, empfehlen wir dringend, dass Sie Proof-of-Concept-Tests für verschiedene Azure-Instanztypen mit Ihren eigenen Workloads durchführen und diese Daten dann für Ihre endgültigen Entwürfe verwenden.

Weitere Informationen

Weitere Informationen zum Bereitstellen von Citrix Virtual Apps-Workloads auf Microsoft Azure Cloud Services finden Sie auf der Citrix and Microsoft Partner-Website unter https://www.citrix.com/global-partners/microsoft/resources.html

Die Skalierbarkeit und Wirtschaftlichkeit der Bereitstellung von Citrix Virtual App- und Desktop-Diensten auf Azure