自動スケーリング¶
Knative Serving は、受信トラフィックに合わせてアプリケーションを自動的にスケーリングする、つまり自動スケーリングを提供します。これは、Knative Pod Autoscaler(KPA)を使用することでデフォルトで提供されます。
たとえば、アプリケーションがトラフィックを受信しておらず、スケールダウンが有効になっている場合、Knative Serving はアプリケーションをゼロレプリカにスケールダウンします。スケールダウンが無効になっている場合、アプリケーションはクラスター上のアプリケーションに指定された最小レプリカ数までスケールダウンされます。アプリケーションへのトラフィックが増加すると、需要を満たすためにレプリカがスケールアップされます。
クラスター管理者権限がある場合は、クラスターのスケールダウン機能を有効および無効にできます。「ゼロへのスケールを構成する」を参照してください。
クラスターで有効になっている場合にアプリケーションの自動スケーリングを使用するには、同時実行性とスケール境界を構成する必要があります。
追加のリソース¶
- Go Autoscale サンプルアプリをお試しください。
- デフォルトの KPA の代わりに Kubernetes Horizontal Pod Autoscaler(HPA)を使用するように Knative デプロイを構成します。HPA のインストール方法については、「オプションの Serving 拡張機能をインストールする」を参照してください。
- オートスケーラーが消費するメトリクスの種類を構成します。