HPA 工作原理

Pod 弹性伸缩器（HPA）是 Kubernetes 的一项功能，可以对您的应用进行自动扩容和自动缩容。本节将介绍 HPA 在 Kubernetes 集群中是如何工作的。

使用 HPA，您可以自动缩放在 Replication Controller，Deployment 或者 Replica Set 中的 Pod。HPA 将自动缩放正在运行的 Pod 的数量，以实现最高效率。HPA 中影响 Pod 数量的因素包括：

HPA 通过以下方式改善您的服务：

HPA 是通过循环控制来实现的，其循环周期由下面的 kube-controller-manager 启动参数控制：

参数	默认值	描述
`—horizontal-pod-autoscaler-sync-period`	`30s`	HPA 审核应用使用资源情况或自定义指标的频率。
`—horizontal-pod-autoscaler-downscale-delay`	`5m0s`	缩容操作完成后，HPA 必须等待多长时间才能进行另外一次缩容操作。
`—horizontal-pod-autoscaler-upscale-delay`	`3m0s`	扩容操作完成后，HPA 必须等待多长时间才能进行另外一次扩容操作。

有关 HPA 的完整文档，请参考Kubernetes 文档。

HPA 是 Kubernetes autoscaling API 组中的 API 资源。当前的稳定版本是 autoscaling/v1 ，仅支持 CPU 自动缩放。为了获得更多基于内存和自定义指标的扩展支持，请改用 beta 版本： autoscaling/v2beta1 。

有关 HPA API 对象的更多信息，请参见HPA GitHub Readme。