Citrix DaaS

Cloud Connectorのサイズおよびスケールの考慮事項

Citrix DaaS(旧称Citrix Virtual Apps and Desktopsサービス)のサイジングとスケーラビリティを評価する場合、すべてのコンポーネントを考慮する必要があります。特定の要件に応じて、Citrix Cloud ConnectorとStoreFrontの構成を調査し、テストします。サイジングとスケーラビリティのためのリソースが不十分だと、お使いの環境のパフォーマンスに悪影響を及ぼします。

この記事では、テスト済みの最大容量の詳細と、Cloud Connectorのマシン構成に関するベストプラクティスの推奨事項について説明します。

説明内容は、各リソースの場所にVDIワークロードまたはRDSワークロードのいずれかが含まれる環境に適用されます。VDIワークロードとRDSワークロードが一緒に含まれるリソースの場所については、Citrixコンサルティングサービスにお問い合わせください。

Citrix Workspaceを使用しているお客様と、StoreFrontを使用しているお客様には、別々の情報が提供されます。小さなワークロードに対しては、Citrix Workspaceでテストを行いました。大きなワークロードに対しては、StoreFrontでテストを行いました。Citrix Workspaceによるテストは、サービス継続性機能を有効にせずに行いました。サービス継続性に関するサイズとスケーラビリティの推奨事項については、この記事の改訂版で予定されています。

Cloud Connectorは、次の方法でワークロードをCitrix DaaSにリンクします:

  • VDAとCitrix DaaS間の通信用プロキシの提供
  • Citrix DaaSとお使いのActive Directory(AD)およびハイパーバイザー間の通信用プロキシの提供
  • StoreFrontサーバーを含む環境では、Cloud Connectorは、クラウドの停止時に一時的なセッションブローカーとして機能し、ユーザーにリソースへの継続的なアクセスを提供

特定のニーズを満たすために、Cloud Connectorを適切なサイズと構成にすることが重要です。

Cloud Connectorの各セットは、リソースの場所(ゾーンとも呼ばれます)に割り当てられます。リソースの場所は、どのリソースがそのCloud Connectorのセットと通信するかを指定する論理的な分離です。Active Directory(AD)と通信するには、ドメインごとに少なくとも1つのリソースの場所が必要です。

各マシンカタログとホスティング接続は、リソースの場所に割り当てられます。

複数のリソースの場所を使用する環境では、マシンカタログとVDAをリソースの場所に割り当て、停止中に接続を仲介する ローカルホストキャッシュ(LHC) の機能を最適化します。リソースの場所の作成と管理について詳しくは、「 Citrix Cloudへの接続」を参照してください。最適なパフォーマンスを得るには、VDA、Active Directoryサーバー、およびハイパーバイザーへの低遅延接続でCloud Connectorを構成します。

推奨されるプロセッサとストレージ

今回のテストと同様のパフォーマンスを得るには、SHA拡張機能に対応している最新のプロセッサを使用してください。SHA拡張機能により、CPUの暗号化負荷が軽減されます。推奨されるプロセッサは次のとおりです:

  • Advanced Micro Devices(AMD)Zen以降のプロセッサ
  • Intel Ice Lake以降のプロセッサ

この記事で説明されているテストは、AMD EPYXプロセッサおよびIntel Cascade Lakeプロセッサを使用して行われました。

Cloud Connectorでは、クラウドとの通信中に暗号化の負荷が高くなります。SHA拡張機能対応のプロセッサを使用するCloud Connectorでは、CPUの負荷が低くなります。これは、Windows Local Security Authority Subsystem Service(LSASS)によるCPU使用率の低下によって示されています。

特に、LHCを使用する環境では、1秒あたりのI/O操作数(IOPS)が十分な最新のストレージを使用することをお勧めします。ソリッドステートドライブ(SSD)が推奨されますが、プレミアムクラウドストレージ階層は必要ありません。Cloud Connectorがデータベースの小さなコピーを実行することを想定しているLHCの場合は、より高いIOPSが必要です。このデータベースは、サイト構成の変更にともなって定期的に更新され、Citrix Cloudの停止時にリソースの場所に仲介機能を提供します。

推奨されるローカルホストキャッシュの処理能力

Cloud Connectorは、インストール時に自動的にインストールされるMicrosoft SQL Express Server LocalDBを実行します。LHCを使用する環境では、Cloud ConnectorのCPU構成、特にSQL Express Server LocalDBで使用可能なコアの数が、LHCのパフォーマンスに直接影響します。SQL Server Express Server LocalDBで使用可能なCPUコアの数は、メモリ割り当てよりも大きな影響をLHCのパフォーマンスに与えます。このCPUオーバーヘッドは、Citrix DaaSとの通信ができず、LHCブローカーがアクティブなLHCモードの場合にのみ確認されます。LHCを使用するすべての環境では、ソケットごとに4つのコアと、Cloud Connectorごとに最低4つのCPUコアの使用が推奨されます。SQL Express Server LocalDBのコンピューティングリソースの構成については、「SQL Serverのエディションごとの処理能力の上限」を参照してください。

SQL Express Server LocalDBで使用可能なコンピューティングリソースが正しく構成されていない場合、構成の同期時間が長くなり、停止中のパフォーマンスが低下する可能性があります。一部の仮想化環境では、処理能力はCPUコアの数ではなく、論理プロセッサの数に依存します。

テスト結果の要約

この概要のすべての結果は、詳細セクションに記載されたとおりに構成されたテスト環境での結果に基づきます。異なるシステム構成では、異なる結果になる可能性があります。

この図は、テストされた構成の概要をグラフィカルに示しています。

テストされた構成の概要

この表は、Cloud Connectorのサイズを決定するためのクイックガイドを提供します。結果はCitrixの内部テストに基づいています。記載されている構成は、高レートセッション起動テストや登録ストームなど、さまざまなワークロードでテストされました。

各構成には、それぞれのリソースの場所に高可用性を確保するために最低限必要となる2つのCloud Connectorがあります。Citrix Cloudとの高可用性接続を維持するために、Cloud Connectorを使用する環境では、N+1の冗長モデルを使用することをお勧めします。

  最小 Medium 最大
VDA 500 VDIまたは50 RDS 1,000 VDIまたは100 RDS 1,000 VDIまたは100 RDS 5,000 VDIまたは500 RDS 10,000 VDIまたは1,000 RDS
ホスト接続 10 10 20 40 40
ワークスペースまたはStoreFront Workspace Workspace Citrix ADCを使用したStoreFront Citrix ADCを使用したStoreFront Citrix ADCを使用したStoreFront
NetScaler Gateway Serviceプロキシ はい はい いいえ いいえ いいえ
Rendezvous v1 はい はい いいえ いいえ いいえ
ローカルホストキャッシュ いいえ いいえ はい はい はい
コネクタ用CPU 仮想CPU×2 仮想CPU×4 仮想CPU×4 仮想CPU×4 8 CPU
コネクタ用メモリ 4GB 4GB 6GB 8GB 10GB

今回のテストの構成について

  • CPUとメモリの要件は、ベースOSとCitrixサービスのみです。サードパーティのアプリやサービスには、追加のリソースが必要になる場合があります。
  • VDAは、Citrix Virtual Delivery Agentを実行している仮想マシンまたは物理マシンです。
  • テストされたすべてのVDAは、Citrix DaaSを使用して電力管理されました。
  • リソースの場所ごとに、最大20,000 RDSセッションまでテストを実施しました。
  • Citrix Workspaceは、Rendezvous v1プロトコルを使用してテストされました。Citrix Workspaceを使用する環境では、Rendezvousプロトコルを使用することをお勧めします。Rendezvousプロトコルは、HDXトラフィックをCitrix Gatewayサービスに渡すことにより、Cloud ConnectorのCPU負荷を軽減します。Rendezvousプロトコルについて詳しくは、「Rendezvousプロトコル」を参照してください。
  • テストされた構成では、ワークスペースサービス継続性機能は有効になっていませんでした。

テスト方法

負荷を追加し、環境コンポーネントのパフォーマンスを測定するためのテストが実施されました。コンポーネントの監視では、パフォーマンスデータと手順のタイミング(ログオン時間、登録時間など)のデータを収集しました。必要な場合は、VDAとセッションをシミュレートするために、独自のCitrixシミュレーションツールが使用されました。これらのツールは、実際のセッションやVDAをホストするために必要なリソースがなくても、従来のVDAやセッションと同様にCitrixコンポーネントを使用できるように設計されています。Cirix StoreFrontを使用するテストは、クラウドブローカリングモードとローカルホストキャッシュモードの両方で実施されました。

この記事のCloud Connectorのサイジングの推奨事項は、これらのテストから収集されたデータに基づいています。

実施されたテストは次のとおりです:

  • セッションログオン/起動ストーム: ログオンが集中する期間をシミュレートするテスト。
  • VDA登録ストーム: VDAの登録が集中する期間をシミュレートするテスト。たとえば、アップグレードサイクルの後、またはクラウドブローカリングモードとローカルホストキャッシュモード間の移行。
  • VDA電源操作ストーム: 大量のVDA電源操作をシミュレートするテスト。

Citrix Workspace使用(最小および小規模のワークロード)

Citrix Workspaceは、場所とデバイスを選ばず、アプリ、デスクトップ、およびコンテンツ(リソース)へのセキュアで統合されたアクセスを可能にする、デジタルワークスペースソリューションです。Citrix Workspaceでは、サービス継続性機能が有効になっていない限り、LHCを使用して停止中にユーザーがリソースを利用できるようになることはありません。サービス継続性が有効になっていない場合、Citrix High Availability ServiceとMicrosoft SQL Express Server LocalDBは無効になります。今回のテストでは、サービスの継続性は有効になっていません。

最大で1,000 VDIワークロードまたは200 RDSワークロードに対して、Citrix Workspaceを使用してテストを実施しました。

高可用性を確保するために、リソースの場所ごとに、N+1の冗長モデルを使用した2つ以上のCloud Connector。Cloud Connectorは、メンテナンスのために再起動または停止される可能性があるため、今回のテストは1つのCloud Connectorを使用して実施されました。2つのCloud Connectorを使用すると、今回のテスト結果よりもわずかに優れたパフォーマンスが得られる可能性があります。

Citrix Workspaceを使用する構成では、Cloud Connectorは以下の処理を行います:

  • VDAとCitrix DaaS間の通信
  • Citrix DaaSからオンプレミスActive Directoryへのリクエスト
  • ハイパーバイザーへのプロキシ電源操作
  • セッション起動リクエスト
  • VDA登録

テスト条件:

  • 1つのCloud Connectorを使用してテストを実施しました。高可用性を実現するには、2つのCloud Connectorが必要です。
  • Intel Cascade Lakeプロセッサで構成されたCloud Connectorでテストを実施しました。
  • RDSセッション数は推奨値であり、上限ではありません。ご使用の環境下でのRDSセッション上限をテストしてください。
  • セッションは、Rendezvous v1プロトコルを使用してCitrix Workspaceを介して開始されました。
  • サービス継続性は有効にせずにテストを実施しました。

テスト結果は次の表にまとめられています。

最小限のワークロード

これらのワークロードに対して、2つのvCPUと4 GBのメモリでテストを実施しました。

テストのワークロード VDA登録時間 登録CPUとメモリ使用状況 起動テストの長さ セッション起動CPUとメモリ使用状況 起動レート
500 VDI 5分 CPU最大 = 16%、CPU平均 = 4%、メモリ最大 = 2.5 GB 3分 CPU最大 = 45%、CPU平均 = 40%、メモリ最大 = 3.0 GB 毎分150
50 RDS、1,000セッション 2分 CPU最大 = 15%、CPU平均 = 3%、メモリ最大 = 2.3 GB 6分 CPU最大 = 25%、CPU平均 = 15%、メモリ最大 = 2.9 GB 毎分166

小規模のワークロード

これらのワークロードに対して、4つのvCPUと4 GBのメモリでテストを実施しました。

テストのワークロード VDA登録時間 登録CPUとメモリ使用状況 起動テストの長さ セッション起動CPUとメモリ使用状況 起動レート
1,000 VDI 5分 CPU最大 = 15%、CPU平均 = 5%、メモリ最大 = 3.5 GB 6分 CPU最大 = 48%、CPU平均 = 33%、メモリ最大 = 3.4 GB 毎分166
200 RDS、5,000セッション 3分 CPU最大 = 5%、CPU平均 = 2%、メモリ最大 = 3.5 26分 CPU最大 = 18%、CPU平均 = 3%、メモリ最大 = 3.2 GB 毎分192

Citrix StoreFront使用(中規模、大規模、および最大のワークロード)

大規模なワークロードの場合、高可用性のためにLHCを使用することをお勧めします。LHCの使用について詳しくは、「ローカルホストキャッシュ」を参照してください。LHCには、オンプレミスのStoreFrontサーバーが必要です。StoreFrontについて詳しくは、StoreFront製品のドキュメントを参照してください。

StoreFrontを使用して、1,000〜10,000 VDIまたは200〜1,000 RDSのワークロードに対してテストを実施しました。

StoreFront構成の推奨事項:

  • 1つのStoreFrontサーバーまたはサーバーグループで複数のリソースの場所がある場合は、StoreFrontストアの高度なヘルスチェックオプションを有効にします。「ローカルホストキャッシュ」の、「StoreFrontの要件」を参照してください。
  • セッション起動レートを高くするには、StoreFrontサーバーグループを使用します。StoreFront製品ドキュメントの、「サーバーグループの構成」を参照してください。

テスト条件:

  • 1つのCloud Connectorを使用してテストを実施しました。高可用性を実現するには、2つのCloud Connectorが必要です。
  • Intel Cascade Lakeプロセッサで構成されたCloud Connectorでテストを実施しました。
  • RDSセッション数は推奨値であり、上限ではありません。ご使用の環境下でのRDSセッション上限をテストしてください。
  • セッションは、単一のCitrix StoreFrontサーバーを介して開始されました。
  • LHC停止セッションは、マシンが再登録された後に実行されるテストを開始します。 テスト結果は次の表にまとめられています。

中規模のワークロード

これらのワークロードに対して、4つのvCPUと6 GBのメモリでテストを実施しました。

テストのワークロード サイトの状態 VDA登録時間 登録CPUとメモリ使用状況 起動テストの長さ セッション起動CPUとメモリ使用状況 起動レート
1,000 VDI オンライン 5分 CPU最大 = 36%、CPU平均 = 33%、メモリ最大 = 5.3 GB 2分 CPU最大 = 29%、CPU平均 = 27%、メモリ最大 = 3.7 GB 毎分500
1,000 VDI 停止 4分 CPU最大 = 11%、CPU平均 = 10%、メモリ最大 = 4.5 GB 2分 CPU最大 = 42%、CPU平均 = 28%、メモリ最大 = 4.0 GB 毎分500
200 RDS、5,000セッション オンライン 3分 CPU最大 = 14%、CPU平均 = 4%、メモリ最大 = 3.5 GB 9分 CPU最大 = 46%、CPU平均 = 21%、メモリ最大 = 3.7 GB 毎分555
200 RDS、5,000セッション 停止 3分 CPU最大 = 15%、CPU平均 = 5%、メモリ最大 = 3.7 9分 CPU最大 = 51%、CPU平均 = 32%、メモリ最大 = 4.2 GB 毎分555

大規模なワークロード

これらのワークロードに対して、4つのvCPUと8 GBのメモリでテストを実施しました。

テストのワークロード サイトの状態 VDA登録時間 登録CPUとメモリ使用状況 起動テストの長さ セッション起動CPUとメモリ使用状況 起動レート
5,000 VDI オンライン 3〜4分 CPU最大 = 45%、CPU平均 = 25%、メモリ最大 = 7.0 GB 5分 CPU最大 = 75%、CPU平均 = 55%、メモリ最大 = 7.0 GB 毎分1,000
5,000 VDI 停止 4〜6分 CPU最大 = 15%、CPU平均 = 5%、メモリ最大 = 7.5 GB 5分 CPU最大 = 45%、CPU平均 = 40%、メモリ最大 = 7.5 GB 毎分1,000
500 RDS、10,000セッション オンライン 3分 CPU最大 = 45%、CPU平均 = 25%、メモリ最大 = 7.0 GB 10分 CPU最大 = 75%、CPU平均 = 55%、メモリ最大 = 7.0 GB 毎分1,000
500 RDS、10,000セッション 停止 3分 CPU最大 = 15%、CPU平均 = 5%、メモリ最大 = 7.5 10分 CPU最大 = 45%、CPU平均 = 40%、メモリ最大 = 7.5 GB 毎分1,000

最大ワークロード

これらのワークロードに対して、8つのvCPUと10 GBのメモリでテストを実施しました。

テストのワークロード サイトの状態 VDA登録時間 登録CPUとメモリ使用状況 起動テストの長さ セッション起動CPUとメモリ使用状況 起動レート
10,000 VDI オンライン 3〜4分 CPU最大 = 85%、CPU平均 = 10%、メモリ最大 = 8.5 GB 7分 CPU最大 = 66%、CPU平均 = 28%、メモリ最大 = 7.0 GB 毎分1,400
10,000 VDI 停止 4~5 minutes CPU最大 = 90%、CPU平均 = 17%、メモリ最大 = 8.2 GB 5分 CPU最大 = 90%、CPU平均 = 45%、メモリ最大 = 8.5 GB 毎分2,000
1,000 RDS、20,000セッション オンライン 1〜2分 CPU最大 = 60%、CPU平均 = 20%、メモリ最大 = 8.6 GB 17分 CPU最大 = 66%、CPU平均 = 25%、メモリ最大 = 6.8 GB 毎分1,200
1,000 RDS、20,000セッション 停止 3〜4分 CPU最大 = 22%、CPU平均 = 10%、メモリ最大 = 8.5 21分 CPU最大 = 90%、CPU平均 = 50%、メモリ最大 = 7.5 GB 毎分1,000

構成同期リソース使用量

構成の同期プロセスにより、Cloud ConnectorがCitrix DaaSで最新の状態に保たれます。更新プログラムは自動的にCloud Connectorに送信され、停止が発生した際にはCloud Connectorがいつでもブローカリングを引き継げる状態になっています。構成の同期により、LHCデータベースであるSQL Express Server LocalDBが更新されます。プロセスはデータを一時データベースにインポートし、インポートされるとそのデータベースに切り替えます。これにより、引き継ぎ可能なLHCデータベースが常に存在することが保証されます。

データが一時データベースにインポートされている間、CPU、メモリ、およびディスクの使用率が一時的に増加します。

テスト結果:

  • データのインポート時間: 7〜10分
  • CPU使用率:
    • 最大 = 25%
    • 平均 = 15%
  • メモリ使用率:
    • 最大 = 9GB
    • 約2 GBから3 GBの増加
  • ディスク使用率:
    • 4 MB/sのディスク読み取りスパイク
    • 18 MB/sのディスク書き込みスパイク
    • 構成ファイルのダウンロードおよび書き込み中に、70 MB/sのxmlディスク書き込みスパイク
    • インポート完了時に、4 MB/sのディスク読み取りスパイク
  • LHCデータベースのサイズ:
    • 400〜500 MBのデータベースファイル
    • 200〜300 MBのログデータベース

テスト条件:

  • 8 vCPU AMD EPYXでテストを実施
  • インポートされたサイト構成データベースは、サイト全体で合計80,000 VDAおよび300,000ユーザー(100,000ユーザーの3シフト)の環境用
  • データのインポート時間は、10,000 VDIのリソースの場所でテスト

リソース使用に関する補足的な注意事項:

  • インポート中に、完全なサイト構成データがダウンロードされます。このダウンロードは、サイトのサイズによってはメモリスパイクを引き起こす可能性があります。
  • テストされたサイトでは、データベースとデータベースログファイルの合計で約800 MBを使用しました。構成の同期中に、これらのファイルは、最大合計サイズ約1,600 MBで複製されます。Cloud Connectorに複製ファイル用の十分なディスクスペースがあることを確認してください。ディスクがいっぱいになると、構成の同期プロセスは失敗します。