Kubernetes 日志收集

服务器系统日志：记录服务器硬件、操作系统（如 CPU、内存、磁盘）的运行状态，是排查底层问题的基础。
Kubernetes 组件日志：如 kube-apiserver、kube-controller-manager 等核心组件的日志，反映集群控制平面的运行状态。
应用程序日志：容器化应用输出的业务日志，包括访问记录、错误信息等，是业务问题排查的关键。

此外，网关日志、服务调用链日志等也可能根据业务需求纳入采集范围。

二、主流日志采集工具对比

日志采集工具众多，选择时需结合资源消耗、功能适配性和运维复杂度综合考量。以下是主流工具的核心特性：

1. ELK 与 EFK：传统日志平台的容器化演进

ELK（Elasticsearch+Logstash+Kibana）

组成：Logstash 负责日志采集与解析，Elasticsearch 存储，Kibana 可视化。
优势：成熟稳定，适用于传统架构。
缺陷：Logstash 资源消耗高（CPU / 内存占用大），配置复杂，不适合容器化环境。

EFK（Elasticsearch+Fluentd+Kibana）

改进：用 Fluentd 替代 Logstash，轻量且配置简单，可直接采集控制台日志并输出到 Elasticsearch。
局限：仅支持控制台日志采集，无法直接处理容器内的文件日志（需通过 Sidecar 容器转发，操作繁琐）。

2. Filebeat：轻量级日志采集器

特性：基于 Go 语言开发，资源消耗极低（CPU / 内存可忽略），支持多种部署模式。
适用场景：

以 Sidecar 模式与应用部署在同一 Pod 中，通过 Volume 共享日志文件，采集自定义文件日志。
以 DaemonSet 模式部署在集群节点，采集系统日志或控制台日志。

架构优化：通常与 Kafka（缓冲日志）、Logstash（日志处理）配合，减轻 Elasticsearch 压力。

3. Loki：Kubernetes 原生轻量日志方案

核心优势：

不做全文索引，仅索引日志元数据（如 Pod 标签、命名空间），大幅降低存储和资源消耗。
与 Prometheus 类似的服务发现机制，天然适配 Kubernetes，支持水平扩展和多租户。

组成：

Loki：日志存储与查询服务。
Promtail：日志采集代理，自动添加 Kubernetes 元数据（如 Pod 名、命名空间）。
Grafana：日志可视化界面（与 Loki 深度集成）。

三、案例：EFK 收集控制台日志

EFK 是 Kubernetes 官方推荐的控制台日志解决方案，以下是部署步骤及命令解析。

1. 环境准备

前提：已安装 Kubernetes 集群（1.23+），节点可访问互联网（或使用离线包）。
目标：部署 Elasticsearch 集群、Fluentd（日志采集）、Kibana（可视化），并验证日志采集功能。

2. 部署步骤

（1）下载部署文件

# 克隆GitHub仓库获取部署清单（离线环境可跳过，直接使用本地文件）
[root@k8s-master ~]# git clone https://github.com/dotbalo/k8s.git

解释：该仓库包含 EFK 部署所需的 YAML 配置文件，简化手动编写流程。

（2）创建专用命名空间

# 进入EFK配置目录
[root@k8s-master ~]# cd k8s/efk-7.10.2/
# 创建日志采集专用命名空间（隔离资源，便于管理）
[root@k8s-master efk-7.10.2]# kubectl create -f create-logging-namespace.yaml
namespace/logging created

解释：命名空间logging用于隔离日志相关组件（如 Elasticsearch、Fluentd），避免与业务资源冲突。

（3）部署 Elasticsearch 集群

# 创建Elasticsearch服务（暴露9200端口供Fluentd写入，9300端口供节点间通信）
[root@k8s-master efk-7.10.2]# kubectl create -f es-service.yaml
service/elasticsearch-logging created

# 部署Elasticsearch StatefulSet（有状态应用，保证集群稳定性）
[root@k8s-master efk-7.10.2]# kubectl create -f es-statefulset.yaml
statefulset.apps/elasticsearch-logging created

验证：检查 Pod 状态（Running表示部署成功）：

[root@k8s-master efk-7.10.2]# kubectl get pod -n logging
NAME                      READY  STATUS  RESTARTS  AGE
elasticsearch-logging-0   1/1    Running 0         5m

端口说明：

9200：HTTP API 端口，供 Fluentd、Kibana 访问。
9300：节点间通信端口，用于集群选举、分片同步等。

（4）部署 Kibana

# 部署Kibana Deployment和Service（NodePort类型，便于外部访问）
[root@k8s-master efk-7.10.2]# kubectl create -f kibana-deployment.yaml -f kibana-service.yaml

验证：查看服务端口（Kibana 默认端口 5601，通过 NodePort 暴露）：

[root@k8s-master efk-7.10.2]# kubectl get svc -n logging
NAME              TYPE       PORT(S)          AGE
kibana-logging   NodePort   5601:32734/TCP   34m

访问方式：通过节点 IP + 暴露的端口（如http://192.168.10.101:32734）访问 Kibana 界面。

（5）部署 Fluentd（日志采集）

# 修改Fluentd部署文件，通过NodeSelector指定采集节点
[root@k8s-master efk-7.10.2]# grep "nodeSelector" fluentd-es-ds.yaml -A3
nodeSelector:
  fluentd: "true"  # 仅部署在标记为fluentd=true的节点

# 为目标节点添加标签
[root@k8s-master efk-7.10.2]# kubectl label node k8s-node01 fluentd=true
node/k8s-node01 labeled

# 部署Fluentd DaemonSet（每个目标节点运行一个实例）
[root@k8s-master efk-7.10.2]# kubectl create -f fluentd-es-ds.yaml -f fluentd-es-configmap.yaml

解释：

NodeSelector 用于限制 Fluentd 部署范围，避免资源浪费。
ConfigMap 定义 Fluentd 配置，默认将日志输出到 Elasticsearch（通过elasticsearch-logging服务访问）。

3. 验证日志采集

（1）部署测试应用

# 创建Nginx Deployment和Service（生成访问日志）
[root@k8s-master efk-7.10.2]# cat <<EOF > nginx-service.yaml
apiVersion: v1
kind: Service
metadata:
  name: mynginx
  namespace: default
spec:
  type: LoadBalancer
  ports:
  - port: 80
    targetPort: 80
  selector:
    app: mynginx
---
apiVersion: apps/v1
kind: Deployment
metadata:
  name: mynginx-deployment
spec:
  replicas: 2
  selector:
    matchLabels:
      app: mynginx
  template:
    metadata:
      labels:
        app: mynginx
    spec:
      containers:
      - name: mynginx
        image: nginx:1.15.2
        ports:
        - containerPort: 80
EOF

# 部署应用
[root@k8s-master efk-7.10.2]# kubectl create -f nginx-service.yaml

（2）生成日志并查看

# 访问Nginx服务，触发日志输出
[root@k8s-master efk-7.10.2]# curl 192.168.10.101:32019  # 32019为Service暴露的端口

在 Kibana 中通过索引模式（如logstash-*）查看日志，验证采集结果。

四、案例：Filebeat 收集自定义文件日志

对于输出到文件的非云原生应用，需通过 Filebeat Sidecar 模式采集日志。以下是结合 Kafka 和 Logstash 的优化方案。

1. 环境准备

工具：Helm（Kubernetes 包管理工具，简化 Zookeeper/Kafka 部署）。
架构：Filebeat → Kafka（缓冲） → Logstash（处理） → Elasticsearch。

2. 部署步骤

（1）安装 Helm

# 下载并安装Helm客户端
[root@k8s-master ~]# wget https://get.helm.sh/helm-v3.6.2-linux-amd64.tar.gz
[root@k8s-master ~]# tar zxvf helm-v3.6.2-linux-amd64.tar.gz
[root@k8s-master ~]# mv linux-amd64/helm /usr/local/bin/

（2）部署 Kafka 和 Logstash

# 部署Zookeeper（Kafka依赖）
[root@k8s-master ~]# cd /root/efk-7.10.2/filebeat/
[root@k8s-master filebeat]# helm install zookeeper zookeeper/ -n logging

# 部署Kafka
[root@k8s-master filebeat]# helm install kafka kafka/ -n logging

# 部署Logstash（从Kafka消费日志并转发到Elasticsearch）
[root@k8s-master filebeat]# kubectl create -f logstash-service.yaml -f logstash-cm.yaml -f logstash.yaml -n logging

（3）部署应用与 Filebeat Sidecar

# 创建应用和Filebeat配置（通过Volume共享日志目录）
[root@k8s-master filebeat]# kubectl create -f filebeat-cm.yaml -f app-filebeat.yaml -n logging

关键配置说明：

应用容器将日志写入/opt/date.log，通过emptyDir与 Filebeat 共享该目录。
Filebeat 配置从/opt/date.log读取日志，并输出到 Kafka。

（4）验证日志流程

# 查看应用日志文件内容
[root@k8s-master filebeat]# kubectl exec -it <app-pod-name> -n logging -- tail /opt/date.log

# 在Kibana中查看经过Logstash处理后的日志

五、案例：Loki 日志系统

Loki 适合追求轻量、低资源消耗的场景，以下是基于 Helm 的快速部署流程。

1. 部署步骤

（1）添加 Helm 仓库并下载 Chart

# 添加Grafana仓库（包含Loki相关Chart）
[root@k8s-master ~]# helm repo add grafana https://grafana.github.io/helm-charts
[root@k8s-master ~]# helm repo update

# 下载Loki Stack Chart
[root@k8s-master ~]# helm pull grafana/loki-stack --version 2.8.3

（2）部署 Loki Stack

# 创建命名空间
[root@k8s-master ~]# kubectl create ns loki

# 部署Loki、Promtail和Grafana（启用Grafana并暴露NodePort）
[root@k8s-master ~]# helm upgrade --install loki loki-stack \
  --set grafana.enabled=true \
  --set grafana.service.type=NodePort \
  -n loki

（3）访问 Grafana 并查看日志

# 查看Grafana服务端口
[root@k8s-master ~]# kubectl get svc -n loki
NAME           TYPE       PORT(S)          AGE
loki-grafana   NodePort   80:32734/TCP     2m40s

# 获取Grafana管理员密码（base64解码）
[root@k8s-master ~]# kubectl get secret loki-grafana -n loki -o jsonpath="{.data.admin-password}" | base64 --decode && echo

# 访问Grafana：http://<节点IP>:32734，登录后添加Loki数据源，使用查询语句过滤日志
# 示例：查询default命名空间下特定Pod的日志
{namespace="default", pod="mynginx-deployment-xxx"}