K8s之自动扩缩容

最新推荐文章于 2025-07-03 14:26:48 发布

james二次元

最新推荐文章于 2025-07-03 14:26:48 发布

阅读量2.4k

点赞数 19

CC 4.0 BY-SA版权

分类专栏： docker 微服务运维文章标签： kubernetes 容器云原生自动伸缩自动扩缩容

本文链接：https://blog.csdn.net/youziguo/article/details/141526211

docker 同时被 3 个专栏收录

17 篇文章

订阅专栏

运维

10 篇文章

订阅专栏

微服务

9 篇文章

订阅专栏

Kubernetes (K8s) 的动态扩缩容（自动伸缩）功能是集群管理中非常关键的一部分，能够根据工作负载的变化自动调整应用程序的副本数，以确保资源的高效利用和服务的稳定性。

K8s介绍文章容器之k8s(Kubernetes)-CSDN博客

1. 动态扩缩容的类型

Kubernetes 提供了三种主要的动态扩缩容机制：

水平Pod自动扩缩容 (Horizontal Pod Autoscaler, HPA):
- 作用：HPA 根据指标（如 CPU 使用率、内存使用率、自定义指标等）自动调整应用程序的 Pod 副本数量。
- 使用场景：适用于需要根据工作负载动态增加或减少应用实例的场景。
- 配置示例：
```
apiVersion: autoscaling/v1
kind: HorizontalPodAutoscaler
metadata:
  name: my-app-hpa
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: my-app
  minReplicas: 2
  maxReplicas: 10
  targetCPUUtilizationPercentage: 50
```
  这个示例配置了一个 HPA，针对 my-app 部署进行扩缩容。当 CPU 使用率超过 50% 时，会增加 Pod 的副本数量，最多扩展至 10 个实例；当使用率低于 50% 时，会缩减至不低于 2 个实例。
垂直Pod自动扩缩容 (Vertical Pod Autoscaler, VPA):
- 作用：VPA 自动调整单个 Pod 的资源请求和限制（如 CPU、内存），而不是 Pod 的数量。
- 使用场景：适用于工作负载不变但需要动态调整资源分配的应用，如长期运行的服务或数据库。
- 配置示例：
```
apiVersion: autoscaling.k8s.io/v1
kind: VerticalPodAutoscaler
metadata:
  name: my-app-vpa
spec:
  targetRef:
    apiVersion: "apps/v1"
    kind:       Deployment
    name:       my-app
  updatePolicy:
    updateMode: "Auto"
```
  这个配置示例会自动根据应用程序的资源使用情况调整 my-app 的 Pod 资源请求和限制。
集群自动扩缩容 (Cluster Autoscaler):
- 作用：Cluster Autoscaler 根据集群中 Pod 的需求，自动增加或减少节点数。
- 使用场景：当集群资源不足以支持当前 Pod 的资源需求时，会自动增加节点；当资源利用率较低时，自动减少节点以节省成本。
- 配置示例： Cluster Autoscaler 通常通过命令行参数或配置文件来配置，并与云提供商（如 GCP、AWS）或裸机集群集成。例如，在 GKE 中，Cluster Autoscaler 可以在创建节点池时启用：
```
gcloud container clusters create my-cluster \
  --enable-autoscaling --min-nodes=1 --max-nodes=10 \
  --num-nodes=3
```

2. 工作机制

水平Pod自动扩缩容 (HPA)

HPA 定期（默认 15 秒）查询指标服务器（Metrics Server）来获取 Pod 的资源使用情况。如果平均使用率超过了定义的阈值，HPA 会自动增加 Pod 的副本数。反之，如果使用率低于阈值，则会减少副本数。

垂直Pod自动扩缩容 (VPA)

VPA 监控 Pod 的实际资源使用情况，并根据实际需要调整 Pod 的资源请求值。当发现资源请求不合理（如经常超出或远低于实际使用）时，VPA 会推荐或自动应用新的资源请求和限制。

集群自动扩缩容 (Cluster Autoscaler)

Cluster Autoscaler 监控集群中所有未调度的 Pod 以及当前节点的资源使用情况。如果有 Pod 无法调度（即集群资源不足），它会尝试扩展集群。如果发现某些节点的资源利用率长期很低（如未调度 Pod 数为 0 且占用率低），则会尝试缩减集群节点数。

3. 应用场景

电子商务网站：在促销活动期间，流量会大幅增加，HPA 可以动态增加服务实例以应对流量高峰，而在活动结束后自动减少实例，节约资源。
数据处理任务：对于需要大量计算资源的批处理任务，可以使用 VPA 动态调整资源分配，确保任务在资源充足的情况下高效执行。
成本控制：Cluster Autoscaler 在夜间或业务低峰期自动缩减节点，降低云资源成本。

4. 配置和调优建议

监控和指标：确保 Metrics Server 或 Prometheus 等监控系统正常工作，以便 HPA 和 VPA 能够获取准确的指标数据。
平滑过渡：为 HPA 配置合适的 minReplicas 和 maxReplicas，避免频繁扩缩容导致的不稳定。也可以使用 scaleDownStabilizationWindow 等参数来调节缩容的响应速度。
资源限制：合理设置 Pod 的资源请求和限制，以便 VPA 可以有效工作，避免资源浪费或因资源不足导致的性能问题。
扩展策略：根据业务需求，设置 Cluster Autoscaler 的扩展和缩减策略，确保集群既能在高负载时满足需求，也能在低负载时节省成本。