コンテンツへスキップ

自動スケーリング

Knative Serving は、受信トラフィックに合わせてアプリケーションを自動的にスケーリングする、つまり自動スケーリングを提供します。これは、Knative Pod Autoscaler(KPA)を使用することでデフォルトで提供されます。

たとえば、アプリケーションがトラフィックを受信しておらず、スケールダウンが有効になっている場合、Knative Serving はアプリケーションをゼロレプリカにスケールダウンします。スケールダウンが無効になっている場合、アプリケーションはクラスター上のアプリケーションに指定された最小レプリカ数までスケールダウンされます。アプリケーションへのトラフィックが増加すると、需要を満たすためにレプリカがスケールアップされます。

クラスター管理者権限がある場合は、クラスターのスケールダウン機能を有効および無効にできます。「ゼロへのスケールを構成する」を参照してください。

クラスターで有効になっている場合にアプリケーションの自動スケーリングを使用するには、同時実行性スケール境界を構成する必要があります。

追加のリソース

サイトのトラフィックを把握するために、分析と Cookie を使用しています。当サイトの利用に関する情報は、その目的のために Google と共有されます。詳細はこちら。