Tech Brief: Autoscale

Übersicht

Ein schlecht konzipiertes Energieverwaltungsschema kann die Cloud-Computing-Kosten um 70% gegenüber dem erhöhen, was das Unternehmen zur Unterstützung der Benutzer benötigt. Cloud-basierte Dienste verwenden häufig ein Pay-as-you-go-Modell, bei dem Organisationen, manchmal jede Sekunde, für Rechenzeit, Netzwerkdurchsatz, Speicherverbrauch und Transaktionen in Rechnung gestellt werden. Um die Kosten zu minimieren, müssen Unternehmen Ressourcen intelligent nutzen, zuweisen und freigeben, die in krassem Kontrast zu einem traditionellen, on-premises Modell stehen, bei dem Organisationen die zugewiesenen Ressourcen auf unbestimmte Zeit verlassen. In einer virtuellen Desktop-Bereitstellung müssen Unternehmen die Kosten für die dauerhafte Zuweisung von Hunderten oder Tausenden von verwendeten virtuellen Maschinen berücksichtigen. Dieser Ansatz macht die Lösung zu teuer, um sie durchführbar zu machen.

Citrix DaaS verwendet Autoscale mit vertikalem Lastausgleich als eine der Möglichkeiten, die Cloud-Kosten zu senken. Diese Funktionen ermöglichen es Unternehmen, virtuelle Desktops vollständig zu nutzen, Nutzungstrends zu identifizieren und diese Trends in zeitplanmäßige und lastbasierte Regeln umzuwandeln, die Ressourcen dynamisch zuweisen und freigeben, um eine positive Benutzererfahrung zu gewährleisten.

Im Folgenden sind einige wichtige Vorteile aufgeführt, die Kunden in einer Citrix-Umgebung von Autoscale profitieren:

  • Hybrides Multi-Cloud-Lastenausgleich - Unterstützung für die selektive Energieverwaltung von Ressourcen, die nur an einem Ressourcenstandort gehostet werden oder mehr kosten, während Ressourcen, die on-premises oder reservierte Instanzen sind, rund um die Uhr ausgeführt werden können. Ermöglicht On-Demand-Burst zu cloudbasierten Ressourcen und Anwendungsfällen für Disaster Recovery.
  • Serviceintegration - Autoscale ist in die Citrix Cloud-Konsole integriert und erfordert keine zusätzlichen Komponenten, Apps und Skripts. Einfach von der Benutzeroberfläche aus mit wenigen Klicks aktiviert und pro Bereitstellungsgruppe konfiguriert.
  • Abonnementbreiter Support - Power verwaltet Maschinen während eines Abonnements und ermöglicht DR in eine andere Region.
  • Zeitplanbasierte Skalierung — Ermöglicht die Einschaltet eine definierte Anzahl von Maschinen während der Hauptverkehrszeiten und dieser Zeitplan ist für verschiedene Tage in der Woche konfigurierbar.
  • Pufferkapazität - Die vordefinierte Anzahl von VMs kann vor erwarteten Zeitfenstern für gleichzeitige Anmeldung eingeschaltet werden, z. B. an Wochentagen, um eine schnelle und reibungslose Anmeldung für alle Benutzer zu gewährleisten. Die Pufferkapazität ist konfigurierbar und kann für Spitzenzeiten separat eingestellt werden.
  • VDI-Support - Unterstützung für Einzelsitzungs- und Multisitzungs-Bereitstellungsgruppen.
  • Drain-Modus — Kann VMs mit geringer Benutzeranzahl isolieren und ihnen keine neuen Sitzungen zuweisen, damit sie auch während der Stoßzeiten heruntergefahren werden können.
  • Dynamisches Provisioning - Maschinen können mit Citrix Maschinenerstellungsdiensten erstellt und gelöscht werden, was zusätzliche Einsparungen bei den Speicherkosten ermöglicht, wenn der Datenträger freigegeben wird, wenn die Maschine nicht benötigt wird.
  • Weitere Entscheidungsparameter - Entscheidungsregeln für das Energiemanagement können als eine beliebige Kombination aus CPU, Arbeitsspeicher, Datenträgerauslastung und Anzahl der Sitzungen angepasst werden.
  • Director Reporting - Kapazitätsplanung und Energieverwaltungskosteneinsparungen in der Überwachungskonsole.
  • Ausschaltverzögerung — Stellt sicher, dass Maschinen nicht immer weiter zwischen Ein- und Ausschaltzuständen flattern. Der Zeitraum, in dem eine eingeschaltete Maschine ausgeschaltet werden kann, ist konfigurierbar.

Kosten vs. Erfahrung

Der Haupteinfluss von Energieverwaltungsmaschinen auf die Benutzererfahrung liegt in der Zeit, die benötigt wird, um einen Benutzer mit der angeforderten Sitzung zu verbinden. Wenn das Energiemanagement zu aggressiv ist und jeder Computer, der keine Sitzungen hostet, abgeschaltet wird, wird die Poolkapazität (von laufenden Maschinen) abgeschaltet. Wenn ein anderer Benutzer eine Sitzung anfordert und die eingeschalteten Maschinen keine verfügbare Kapazität haben, muss der Benutzer auf das Einschalten einer Maschine warten. Die Wartezeit wirkt sich negativ auf die Benutzererfahrung aus und erhöht die Startzeit der Sitzung einige Minuten. Wenn sich viele Benutzer gleichzeitig anmelden, zum Beispiel zu Beginn einer Schicht, kann die Startzeit noch länger sein, da mehrere Computer gleichzeitig eingeschaltet werden müssen.

Kosteneinsparungen durch das Ausschalten nicht verwendeter Maschinen entstehen dadurch, dass die Rechenkosten gleich Null sind und die Kosten für Eindringen/Ausstieg von Netzwerk- und Datentransaktionen (Lesen und Schreiben in den Speicher) reduziert werden. Dieses Szenario führt dazu, dass der Administrator einen Balanceakt durchführen muss, um sicherzustellen, dass sich Benutzer schnell bei Sitzungen anmelden und gleichzeitig die Kosten senken, indem er so viele nicht genutzte Maschinen wie optimal herunterfährt.

Um Kosten und Erfahrung effektiv in Einklang zu bringen, integriert Citrix die folgenden Technologien:

  1. Autoscale
  2. Load Balancing-Algorithmen
  3. Zonenpräferenz und Tagging

Autoscale

Autoscale ist eine Reihe von Funktionen, die darauf ausgelegt sind, den Prozess der Stromversorgung virtueller Maschinen, die Teil einer Bereitstellung sind, zu automatisieren. Autoscale wurde entwickelt, um die Kosten für den Betrieb von Maschinen in einer Citrix-Umgebung zu senken.

Eine Bereitstellungsgruppe enthält Benutzer, die ähnliche Anforderungen für Apps und Desktops haben. Die Benutzergruppe hat höchstwahrscheinlich ähnliche Arbeitszeiten, zum Beispiel die Personalabteilung eines Unternehmens im Londoner Büro. Daher konfigurieren Administratoren Autoscale auf Ebene einer Bereitstellungsgruppe. Den Benutzern in der Bereitstellungsgruppe werden Ressourcen zugewiesen, die auf Pools von Maschinen (Maschinenkataloge) ausgeführt werden und ihre Anforderungen bearbeiten können. Um genaue Entscheidungen über das Ein- und Ausschalten von Maschinen in einem Pool zu treffen, muss Autoscale die Kapazität der Bereitstellungsgruppe kennen. Um sicherzustellen, dass Autoscale eine genaue Ansicht von Hosts hat, die Sitzungsanfragen annehmen können, enthält Autoscale nur Maschinen, die beim Dienst registriert sind, wenn die Kapazität für eine bestimmte Bereitstellungsgruppe ermittelt wird.

Autoscale ermöglicht es dem Administrator, die Energieverwaltung basierend auf den folgenden zwei Einstellungen durchzuführen:

  1. Zeitplanbasierte Skalierung
  2. Lastbasierte Skalierung

Hinweis: Beide werden zusammen verwendet, um die Energieverwaltungseinstellungen zu definieren.

Autoscale — Konfigurationsdialog für die planen und laden basierte Skalierung

Zeitplanbasierte Skalierung

In einem typischen Büro mit definierten Arbeitszeiten werden Spitzen- und Nebenzeiten differenziert. Administratoren definieren die Anzahl der Maschinen, die während der Arbeitszeit und außerhalb der Arbeitszeit eingeschaltet werden sollen. Die Arbeitszeit (z. B. an Wochentagen von 9 bis 17 Uhr) müssten in der Regel eine Mindestanzahl von Maschinen aktiviert sein, um die Nachfrage zu decken. Wenn der Arbeitstag um 9 Uhr morgens beginnt, müssen die virtuellen Desktops bereits verfügbar sein. Es ist eine gute Idee, die Computer hochgefahren zu haben und ihnen einige Zeit zu geben, ihre Post-Boot-Aufgaben zu beenden, bevor sich Benutzer bei ihnen anmelden. Daher werden irgendwann vor Beginn der Arbeitszeit (in unserem Beispiel 8 Uhr morgens) mehrere Hosts hochgefahren, um die erwartete Last zu bewältigen, was dazu führt, dass die Benutzer das positive Anmeldeerlebnis erhalten. Der Zeitplan würde also von 8 Uhr bis 18 Uhr festgelegt.

Nach Ablauf der Arbeitszeit (in unserem Beispiel um 17 Uhr) beginnen sich die Benutzer abzumelden. Administratoren möchten ungenutzte Hosts herunterfahren. Gegen 6 Uhr Autoscale beginnt mit dem Ausschalten von Hosts, und nur die Anzahl der Hosts, die für den Off-Peak-Einsatz erforderlich sind, bleibt eingeschaltet. Dies führt dazu, dass die Cloud-Verbrauchskosten drastisch gesenkt werden, anstatt das gesamte Inventar der Hosts rund um die Uhr auszuführen. Citrix bietet den Administratoren die Flexibilität, diese Stunden mit einer Granularität von 30 Minuten zu definieren. Bei Bereitstellungsgruppen mit mehreren Sitzungen können Administratoren die Mindestanzahl von laufenden Hosts für jede halbe Stunde des Tages separat festlegen. Bei gepoolten Bereitstellungsgruppen für einzelne Sitzungen können Administratoren die Mindestanzahl von ausgeführten Hosts für jede Stunde des Tages separat festlegen. Administratoren können die Arbeitszeiten für verschiedene Tage individuell festlegen.

Hinweis: Die Schedule Based-Skalierung gilt nicht für statische Single-Sitzungsbereitstellungsgruppen, da der Benutzer eine Verbindung zu einer bestimmten Maschine herstellt. Andere Computer zu bestimmten Zeiten hochgefahren zu haben, hilft nicht, außer wenn ein Benutzer versucht, sich zum ersten Mal anzumelden.

Lastbasierte Skalierung

Mit der lastbasierten Skalierung können Administratoren einen Kapazitätspuffer von Maschinen erstellen, falls sie zum Hosten von Sitzungen benötigt werden. Der Kapazitätspuffer ist ein SafetyNet, das unerwartete Nutzungssteigerungen unterstützt, ohne die Benutzererfahrung zu beeinträchtigen. Die Ermittlung des richtigen Werts für den Kapazitätspuffer (als Prozentsatz der Poolkapazität) basiert auf der Nutzung und dem Verständnis der Lastvarianz in der Kundenumgebung. Wenn für eine Bereitstellungsgruppe die Gesamtsitzungskapazität 100 beträgt und der Administrator den Kapazitätspuffer als 10% definiert, wird die Anzahl der Computer, die benötigt werden, um die Kapazitätsreserven über 10 Sitzungen zu halten, eingeschaltet.

Wenn sich Benutzer anmelden, nimmt die verfügbare Kapazität der Bereitstellungsgruppe ab. Wenn er unter den Kapazitätspufferwert fällt, wird eine andere Maschine im Pool gestartet, um den Kapazitätspuffer wieder über den definierten Wert zu bringen. Auf der anderen Seite, wenn Benutzer mit der Abmeldung beginnen, werden die Maschinen mit der geringsten Last in den Drain-Modus versetzt. Sobald die Maschinen keine Sitzungen haben, werden die Maschinen heruntergefahren, bis sich die Poolkapazität auf den eingestellten Kapazitätspufferwert reduziert.

Autoscale — Abbildung zu Einsparungen

Hinweis: Die lastbasierte Skalierung ist bei Desktop-Bereitstellungsgruppen für einzelne Sitzungen nicht verfügbar, da die Last auf jedem Computer entweder Null oder voll ist, je nachdem, ob auf dem Computer eine Sitzung ausgeführt wird oder nicht. Wenn der Kapazitätspuffer für eine einzelne Sitzungsbereitstellungsgruppe festgelegt ist, basiert er daher auf der Anzahl der Maschinen in der Bereitstellungsgruppe.

Drain-Modus

Wenn mehr Sitzungskapazität als der Kapazitätspuffer vorhanden ist, wird der Computer mit der geringsten Anzahl von Sitzungen in den Drain-Modus versetzt. Eine Maschine im Drain-Modus akzeptiert keine neuen Sitzungen, obwohl sie möglicherweise über freie Kapazitäten verfügt. Autoscale versucht, dass alle Sitzungen auf dem Computer abgemeldet werden, sodass der Computer heruntergefahren werden kann.

Hinweis: Wenn in einer Bereitstellungsgruppe keine freien Kapazitäten mehr vorhanden sind, startet Autoscale Sitzungen auf dem Computer im Drain-Modus, anstatt einen anderen Computer hochzufahren.

Zeitüberschreitungen für dynamische Sitzungen

Mit Autoscale können Sie Zeitlimits für getrennte und im Leerlauf befindliche Sitzungen für Ihre Spitzen- und Nebennutzungszeiten konfigurieren, um eine schnellere Maschinenentladung und Kosteneinsparungen zu erzielen. Dieses Feature gilt für Maschinen mit Einzelsitzungs-OS und Multisitzungs-OS. VDAs melden Leerlaufzeiten für Sitzungen, die über 10 Minuten im Leerlauf sind. Durch dynamische Sitzungstimeouts können daher Sitzungen nicht vor Ablauf von 10 Minuten getrennt werden. Ein geringerer Wert trennt Sitzungen früher und senkt so die Kosten.

Zeitüberschreitungen für dynamische Sitzungen

Benachrichtigungen zur Benutzerabmeldung

Mit Autoscale können Sie das Abmelden von anhaltenden Sitzungen erzwingen. Sie können hierfür eine benutzerdefinierte Benachrichtigung an die Benutzer senden und einen Kulanzzeitraum angeben, nach dessen Ablauf die Sitzungen zwangsweise abgemeldet werden. Dies geschieht nur bei Maschinen im Drainingzustand und nicht bei allen eingeschalteten Maschinen. Um potenziellen Datenverlust durch erzwungene Benutzerabmeldungen zu vermeiden, können Sie dieses Feature so konfigurieren, dass nur Abmeldeerinnerungen gesendet werden, ohne dass eine Benutzerabmeldung erzwungen wird.

Benachrichtigungen zur Benutzerabmeldung

Load-Balancing-Algorithmen

Citrix verwendet standardmäßig einen Algorithmus für den horizontalen Lastenausgleich, um die Maschinen in der Cloud mit Strom zu verwalten. Eingehende Sitzungen sind Lastenausgleich, um die Benutzererfahrung zu optimieren. Jede neue Sitzung wird dem Computer zugewiesen, der am wenigsten geladen ist. Sobald eine neue Maschine in einem Katalog gestartet wurde, hat sie die geringste Last und würde für alle nachfolgenden Anmeldungen verwendet, bis die Last nicht mehr die niedrigste ist.

Im folgenden Beispiel gibt es 6 Maschinen in einer Bereitstellungsgruppe. Wenn der Kapazitätspuffer auf 20% eingestellt ist, wird eine neue Maschine eingeschaltet, sobald die freie Kapazität unter 5 Sitzungen fällt. Wenn sich nun ein neuer Benutzer anmeldet, wird diesem Benutzer der neu eingeschaltete Computer zugewiesen. Dem nächsten Benutzer wird der am wenigsten geladene Computer zugewiesen. In der folgenden Abbildung können Sie sehen, wie die Verteilung erfolgt. Die gleichmäßige Verteilung der Sitzungen verringert die Wahrscheinlichkeit, dass jeder der Computer heruntergefahren werden kann. Wenn sich beispielsweise eine der ersten fünf Sitzungen abmeldet, wird die freie Kapazität auf 5 Sitzungen erhöht, aber keiner der Computer kann heruntergefahren werden, da auf jeder Sitzung mindestens eine Sitzung ausgeführt wird.

Autoscale — Horizontaler Lastausgleich

Mit dem vertikalen Lastenausgleich können Administratoren es so konfigurieren, dass eingehende Sitzungen Lastenausgleich sind, um die Anzahl der am wenigsten eingeschalteten Maschinen zu optimieren. Sitzungen werden dem am stärksten belasteten Computer zugewiesen, sofern er das hohe Wasserzeichen für die maximale Belastung nicht erreicht. Dadurch wird sichergestellt, dass nur die minimale Anzahl von Maschinen, die zur Wartung der aktuellen Last benötigt werden, eingeschaltet wird und somit viel kostengünstiger ist. Betrachten Sie unser vorhergehendes Beispiel: Wenn sich eine der ersten 5 Sitzungen abmeldet und die Sitzungsanzahl von Maschine 1 auf 4 reduziert, wird die freie Kapazität auf bis zu 5 Sitzungen zurückgesetzt. Maschine 3 kann jetzt heruntergefahren werden, was zusätzliche Kosten spart. Außerdem würde eine neue Sitzung der Maschine 1 zugewiesen und nicht einer neuen Maschine, die hochgefahren wird. Außerdem werden Sitzungen auf dem am wenigsten geladenen Computer zuerst zur Abmeldung markiert.

Autoscale — Vertikaler Lastausgleich

Betrachten Sie das Szenario, in dem der Administrator nicht sicher ist, wie viele Computer benötigt werden, um Benutzeranfragen zu bearbeiten. Die Chancen stehen gut, dass der Administrator Maschinen für die Bereitstellungsgruppe übermäßig zuweist. Beim vertikalen Lastenausgleich wird nur die erforderliche Anzahl von Maschinen für die Benutzerlast eingeschaltet. Der Kapazitätspuffer hilft dabei, zusätzliche Maschinen für die Bewältigung der Last in diesem Szenario verfügbar zu halten

Zonenpräferenz und Tag-Beschränkung

In hybriden Bereitstellungen gibt es Ressourcen in der Cloud und vor Ort. Eine Hybridbereitstellung kann eine einzelne Bereitstellungsgruppe in verschiedene Zonen segmentieren:

  • Primär: Der bevorzugte Standort für die Ressourcenauslastung.
  • Sekundär: Der Ressourcenstandort, der abgegriffen wird, wenn die primäre Zone vollständig genutzt ist.

In einem Burst to the Cloud-Szenario würde eine Organisation beispielsweise primäre, on-premises Ressourcen vollständig nutzen. Wenn zusätzliche Kapazität benötigt wird, werden sekundäre Instanzen aus der Cloud verbraucht. Die Bereitstellungsgruppe würde aus zwei Katalogen bestehen, einen für den on-premises Ressourcenstandort und einen für den Cloud-Standort.

Hybride Bereitstellung mit on-premises und cloudbasierten Instanzen

In einem Hybrid-Bereitstellungsmodell sind die on-premises Ressourcen Ihre primäre Zone, während die cloudbasierten Pay-As-You-Go-Instanzen die sekundäre Zone bilden.

Autoscale — Zonenpräferenz Hybridbereitstellung

Cloud-Bereitstellung mit reservierten und Pay-as-you-go-Instanzen

In einer reinen Cloud-Bereitstellung wären die reservierten Instanzen die primäre Zone und die sekundäre Zone enthält die Pay-as-You-Go-Instanzen, die bei Bedarf verbraucht werden.

Autoscale — Zonenpräferenz — Nur Cloud-Bereitstellung

Zonenpräferenz und Kennzeichnung sind entscheidend für die Senkung der Kosten in Hybridbereitstellungen. Primäre Instanzcomputer werden im Voraus bezahlt. Es gibt begrenzte Kosteneinsparungen, wenn diese Ressourcen heruntergefahren werden. Die Organisation verwendet diese Ressourcen zuerst, bevor die sekundären Instanzen verwendet werden.

Citrix DaaS unterstützt die Verwendung mehrerer Ressourcenstandorte mit der Zonenpräferenzoption. Der Administrator verwendet die Zonenpräferenz, um zu definieren, welcher Ressourcenstandort zuerst verwendet werden soll, um den Bedarf zu erfüllen, und welcher Standort zuerst heruntergefahren wird, wenn der Sobald die Kapazität der primären Zone vollständig genutzt ist, wurden die Hosts als sekundärer Start markiert, um die Sitzungsanforderung zu bedienen. Wenn die Nachfrage sinkt, werden die Hosts in der sekundären Zone (Cloudressourcen) zuerst heruntergefahren, was zu einer optimalen Cloud-Auslastung führt. Die Einstellungen für diese werden auf der Ebene des Maschinenkatalogs vorgenommen.

Autoscale — Konfiguration der Zonenpräferenz

Administratoren müssen die Tagbeschränkung zusammen mit der Zonenpräferenz verwenden, damit Autoscale wissen lässt, dass der spezifische Satz von Hosts (der Cloud-Standort) aus der Bereitstellungsgruppe energieverwaltet werden soll oder nicht. Tag-Beschränkung gibt die Hosts an, die von Autoscale mit Strom verwaltet werden sollen. Dies sind Hosts, die für die Burst-/Disaster Recovery-Last vorgesehen sind.

Autoscale - Tagging

Weitere Informationen finden Sie unter Zonenpräferenz und Tags. Folgen Sie den Anweisungen, um Autoscale-Einschränkungen zu konfigurieren.

Autoscale-Kosteneinsparungen durch zeitplanbasierte Skalierung

Hinweis: Die Ergebnisse variieren je nach Nutzungs- und Lasteigenschaften der einzelnen Organisationen. Beobachten Sie diese Muster in Ihrem eigenen System, um die Autoscale-Einstellungen für Ihre Umgebung zu optimieren. Die folgenden Ergebnisse basieren auf unseren internen Tests mit LoginVSI-Lasten.

Um die Cloud-Kosteneinsparungen mit Autoscale zu messen, müssen wir die Kosten für laufende Maschinen in der Cloud ermitteln. Die Größen und Kosten (zum Zeitpunkt des Schreibens dieses Papiers) für die nutzungsabhängige Bezahlung der VMs in den USA, wie sie mit dem Azure-Preisrechner berechnet wurden, lauten wie folgt:

VM-Instanz VM-Spezifikationen Kosten pro Monat Kosten pro Stunde Lagerkosten pro Monat
D3_V2 4 vCPU\ 14 GB $367.92 $0.504 $5.94
D4_V2 8 vCPU\ 28 GB $735.84 $1.008 $5.94
F16 16 Kerne\ 32 GB $1264.36 $1.732 $5.94

Bei der Kostenberechnung pro Monat wird davon ausgegangen, dass die Maschine für den gesamten Monat (730 Stunden) läuft. Die Speicherkosten sind feste monatliche Kosten, unabhängig davon, ob die Maschine ein- oder ausgeschaltet ist.

Mit Autoscale reduzieren wir die Zeit, die der Computer eingeschaltet bleibt, um besser auf das Benutzerverhalten abzustimmen.

Um die potenziellen Kosteneinsparungen mit Autoscale besser zu ermitteln, führte Citrix LoginVSI-Skalierbarkeitstests für Einzelserver mit folgendem Setup durch:

  • Citrix Virtual Apps and Desktops 1902
  • Citrix Workspace-App 1903
  • Azure VMs für Windows Server 2016 für mehrere Sitzungsbetriebssysteme
    • D3_V2
    • D4_V2
    • F16
  • LoginVSI Workload: Wissensarbeiter

Dies führte zu folgendem Auslastung des Benutzers pro VM-Instanz:

Autoscale — Sitzung pro Computer für verschiedene Azure-VM-Größen

Die Skalierbarkeitszahlen werden verwendet, um eine Größenanleitung für die folgenden drei Szenarien bereitzustellen.

Szenario 1 - Horizontale Skalierung mit definierten Spitzenzeiten. Nebenzeiten - Null aktive Nutzer

  • Benutzeranzahl während der Spitzenzeit: 1.000 Benutzer
  • Benutzeranzahl pro Off Peak Time: 0 Benutzer
  • Anzahl der Benutzer während der Off Peak-Wochenendzeit: 0 Benutzer
  • Spitzenanmeldezeit: 9 Uhr
  • Spitzenabmeldezeit: 17 Uhr
  • Spitzenstartzeit: 8:30 Uhr
  • Spitzenende: 17:30 Uhr
  • Aktiv pro Tag: 9 Stunden
  • Aktiv pro Monat: 198 Stunden
  • Load Balancing-Algorithmus: Horizontal

Basierend auf diesem Szenario lauten die aktiven Sitzungen während des Tages wie folgt:

Autoscale — Diagramm für aktive Sitzungen in Szenario 1

Wenn alle Maschinen nach Beginn der Auslaufzeiten heruntergefahren werden, beträgt die Anzahl der Stunden, die die Maschinen während eines einzelnen Monats eingeschaltet wären, 198 Stunden. Die Berechnungen der Kosteneinsparungen sind:

Knowledge Worker - Größe der Maschine D3_V2 D4_V2 F16
VSImax - Sitzungen/ Maschine 25 50 74
Anzahl der benötigten Maschinen 40 20 14
Rechenkosten pro Stunde (in USD) 0.504 1.008 1.732
Kosten pro Stunde (inkl. 128 GB Disk) für 1000 Benutzer 20.48548 20.32274 24.36192
Kosten pro Monat (100% On) 14954.4 14835.6 17784.2
Kosten pro Monat mit Autoscale (198 Std.) 4229.28 4110.48 4884.26
Prozentuale Kostenersparnisse 71.72 72.29 72.54

Das folgende Diagramm zeigt den Unterschied bei den Kosten für den Betrieb der Maschinen, wenn sie ständig eingeschaltet werden, im Vergleich zur Leistungsverwaltung von Autoscale in diesem Szenario.

Autoscale — Szenario 1 Diagramm zur Kosteneinsparung

Aus der Tabelle entfallen die Kosten für die ständig eingeschaltete Maschine bei über 350% der Kosten, wenn die Maschinen von Autoscale mit Strom versorgt werden. Ein Administrator in diesem Szenario kann mithilfe von Autoscale rund 70% der Rechenkosten einsparen.

Szenario 2 - Horizontale Skalierung mit definierten Spitzenzeiten. Nebenzeiten — 10% aktive Nutzer

  • Benutzeranzahl während der Spitzenzeit: 1.000 Benutzer
  • Benutzeranzahl pro Off Peak Time: 100 Benutzer (anders als Szenario 1)
  • Anzahl der Benutzer während der Off Peak-Wochenendzeit: 0 Benutzer
  • Spitzenanmeldezeit: 9 Uhr
  • Spitzenabmeldezeit: 17 Uhr
  • Spitzenstartzeit: 8:30 Uhr
  • Spitzenende: 17:30 Uhr
  • Aktiv pro Tag: 9 Stunden
  • Aktiv pro Monat: 198 Stunden
  • Load Balancing-Algorithmus: Horizontal

Basierend auf diesem Szenario lauten die aktiven Sitzungen für die Woche wie folgt:

Autoscale — Diagramm für aktive Sitzungen in Szenario 2

Die Anzahl der Stunden, die alle Maschinen während eines einzelnen Monats eingeschaltet wären, beträgt 198. Außerdem würden 10% der Maschinen (aufgerundet) für weitere 15 Stunden laufen, multipliziert mit 18 Tagen im Monat. Die Berechnungen der Kosteneinsparungen sind:

Knowledge Worker - Größe der Maschine D3_V2 D4_V2 F16
VSImax - Sitzungen/ Maschine 25 50 74
Anzahl der benötigten Maschinen 40 20 14
Rechenkosten pro Stunde (in USD) 0.504 1.008 1.732
Kosten pro Stunde (inkl. 128 GB Disk) für 1000 Benutzer 20.48548 20.32274 24.36192
Kosten pro Monat (100% On) 14954.4 14835.6 17784.2
Kosten pro Monat mit Autoscale (198 Std.) 4773.6 4564.8 5819.54
Prozentuale Kostenersparnisse 68.08 68.62 67.28

Das folgende Diagramm zeigt den Unterschied bei den Kosten für den Betrieb der Maschinen, wenn sie ständig eingeschaltet werden, im Vergleich zur Leistungsverwaltung von Autoscale in diesem Szenario:

Autoscale — Szenario 2 Diagramm Kosteneinsparungen

Aus der Tabelle gehen die Kosten für ständig eingeschaltete Maschinen bei über 300% der Kosten bei, wenn die von Autoscale mit Strom versorgt wird. Ein Administrator in diesem Szenario kann mithilfe von Autoscale rund 68% der Rechenkosten einsparen. Vergleicht man die Autoscale-Kosten pro Monat mit dem vorherigen Szenario, belaufen sich die Spitzenkosten pro Monat für die D_V2-VM-Größen auf etwa 545 US-Dollar, während die größeren F16-VMs während außerhalb der Hauptverkehrszeiten 935 USD pro Monat ausmachen. Die Grafik zeigt deutlich, dass für die gleiche Anzahl von Sitzungen die kleineren Maschinen insgesamt nicht nur kostengünstig sind, sondern auch weniger kosten, wenn die Nachfrage geringer ist.

Szenario 3 - Vertikale Skalierung mit gestaffelten Spitzenzeiten. Nebenzeiten — 10% aktive Nutzer

  • Benutzeranzahl während der Spitzenzeit: 1.000 Benutzer
  • Benutzeranzahl pro Off Spitzenzeit: 100 Benutzer
  • Anzahl der Benutzer während der Off Peak-Wochenendzeit: 0 Benutzer
  • Spitzenanmeldezeit: 9 Uhr
  • Spitzenabmeldezeit: 17 Uhr
  • Spitzenstartzeit: 8:30 Uhr
  • Spitzenende: 17:30 Uhr
  • Aktiv pro Tag: 9 Stunden
  • Aktiv pro Monat: 198 Stunden
  • Load Balancing-Algorithmus: Vertikal (anders als Szenario 2)
  • Anmeldung\ Abmelderate: 25% pro Stunde

Basierend auf diesem Szenario lauten die aktiven Sitzungen für die Woche wie folgt:

Autoscale — Diagramm für aktive Sitzungen in Szenario 3

Zu Beginn des Tages werden weniger Maschinen benötigt. Da die Berechnung die Anzahl der Maschinen und Stunden multipliziert, reduziert sich die Anzahl der Rechenstunden um 1 Stunde pro Tag, 22 Stunden im Monat. Wie besprochen, würden sich Benutzer von zufälligen Maschinen abmelden. Daher gehen wir davon aus, dass die erforderliche Anzahl von Maschinen nach dem Ende des Arbeitstages auf 10% sinkt. Die Berechnungen der Kosteneinsparungen sind:

Knowledge Worker - Größe der Maschine D3_V2 D4_V2 F16
VSImax - Sitzungen/ Maschine 25 50 74
Anzahl der benötigten Maschinen 40 20 14
Rechenkosten pro Stunde (in USD) 0.504 1.008 1.732
Kosten pro Stunde (inkl. 128 GB Disk) für 1000 Benutzer 20.48548 20.32274 24.36192
Kosten pro Monat (100% On) 14954.4 14835.6 17784.2
Kosten pro Monat mit Autoscale (198 Std.) 3893.6 4214.4 5511.54
Prozentuale Kostenersparnisse 73.96 71.59 69.01

Das folgende Diagramm zeigt den Unterschied bei den Kosten für den Betrieb der Maschinen, wenn sie ständig eingeschaltet werden, im Vergleich zur Leistungsverwaltung von Autoscale in diesem Szenario.

Autoscale — Szenario 3 Diagramm Kosteneinsparungen

Aus der Tabelle gehen die Kosten für ständig eingeschaltete Maschinen bei über 300% der Kosten bei, wenn die von Autoscale mit Strom versorgt wird. Für die kleinste Maschine, D3_V2, liegt es bei 384%. Je kleiner die Maschinengröße ist, desto höher kann sie heruntergefahren werden, um die gleiche Last zu bedienen, verglichen mit größeren Maschinen. In ähnlicher Weise können sie schneller heruntergefahren werden und erreichen schneller keine Sitzungen, die auf ihnen laufen, wenn sich Benutzer abmelden.

In Anbetracht aller drei Szenarien und unter Berücksichtigung der Kosteneinsparungsdiagramme ist es offensichtlich, dass je kleiner die Maschinengröße ist, desto kostengünstiger ist es, wenn Autoscale aktiviert ist.

Wichtiger Hinweis: Damit Autoscale Computer herunterfahren kann, müssen Benutzer die Verbindung trennen oder sich von ihnen abmelden. Ziehen Sie daher in Erwägung, Timer zum Trennen und Abmelden in den Autoscale-Einstellungen für Bereitstellungsgruppen zu konfigurieren, damit die Kosteneinsparungen höher sind.

Überwachen

Administratoren können die folgenden Metriken von mit AutoScale verwalteten Maschinen auf der Registerkarte Überwachen überwachen. Die Registerkarte zeigt die Diagramme des Verbrauchs der Ressourcen pro Bereitstellungsgruppe. Diese Diagramme werden verwendet, um die tatsächliche Verwendung der Bereitstellungsgruppen zu ermitteln, um dem Administrator bei der korrekten Dimensionierung der Kataloge zu helfen. Die folgenden Diagramme werden angezeigt:

  • Maschinennutzung
  • Geschätzte Einsparungen
  • Warnmeldungsbenachrichtigungen für Maschinen und Sitzungen
  • Maschinenstatus
  • Lastauswertungstrends

Die Einsparungen werden basierend auf den Kosten pro Stunde der Maschinen berechnet, die vom Administrator bei der Konfiguration der Autoscale-Einstellungen eingegeben wurden. Wenn der Administrator Alle Bereitstellungsgruppen auswählt, wird der Durchschnittswert der geschätzten Einsparungen in allen Bereitstellungsgruppen angezeigt.

Autoscale — Überwachung

Zusammenfassung

  1. Autoscale ermöglicht bessere Kosteneinsparungen (~ 300%) ohne Einbußen bei der Benutzeraussparung. Dies geschieht durch Zeitplan-/ladungsbasierte Einstellungen
  2. Die Verwendung kleinerer VMs führt zu besseren Kosteneinsparungen bei horizontalem Lastausgleichszenario
  3. Verwenden Sie Zonenpräferenz und Kennzeichnung, um mehr Kosteneinsparungen

Weitere Informationen: Erfahren Sie mehr über Autoscale in unserer technischen Dokumentation.