自動スケーリング¶

Knative Serving は、受信トラフィックに合わせてアプリケーションを自動的にスケーリングする、つまり自動スケーリングを提供します。これは、Knative Pod Autoscaler（KPA）を使用することでデフォルトで提供されます。

たとえば、アプリケーションがトラフィックを受信しておらず、スケールダウンが有効になっている場合、Knative Serving はアプリケーションをゼロレプリカにスケールダウンします。スケールダウンが無効になっている場合、アプリケーションはクラスター上のアプリケーションに指定された最小レプリカ数までスケールダウンされます。アプリケーションへのトラフィックが増加すると、需要を満たすためにレプリカがスケールアップされます。

クラスター管理者権限がある場合は、クラスターのスケールダウン機能を有効および無効にできます。「ゼロへのスケールを構成する」を参照してください。

クラスターで有効になっている場合にアプリケーションの自動スケーリングを使用するには、同時実行性とスケール境界を構成する必要があります。

追加のリソース¶

Go Autoscale サンプルアプリをお試しください。
デフォルトの KPA の代わりに Kubernetes Horizontal Pod Autoscaler（HPA）を使用するように Knative デプロイを構成します。HPA のインストール方法については、「オプションの Serving 拡張機能をインストールする」を参照してください。
オートスケーラーが消費するメトリクスの種類を構成します。