在k8s中部署Kafka高可用集群超详细讲解_ar

弹性和可伸缩性：kubernetes提供了强大的自动伸缩和调度功能，可以根据负载情况自动扩展kafka集群的节点数量，以满足不同工作负载的需求。这种弹性能力使得kafka能够更好地应对数据量的变化和突发性负载。
易于管理：kubernetes提供了统一的管理接口和工具，简化了kafka集群的部署、扩展、更新和监控。通过kubernetes的控制面板，管理员可以轻松地管理kafka集群的生命周期，而无需深入了解底层的部署细节。
高可用性：kubernetes具有自动故障检测和恢复机制，可以在节点故障时自动重新调度kafka的副本，确保数据的高可用性和持久性。
资源隔离：通过kubernetes的命名空间和资源限制功能，可以实现kafka集群与其他应用程序之间的资源隔离，避免因资源竞争导致的性能问题。

编辑

二、kubernetes基础

1、kubernetes概述

kubernetes的主要功能

1. 自动化部署和扩展：

kubernetes提供了丰富的调度和自动伸缩功能，可以根据负载情况自动调度和扩展应用程序的副本数量，以适应不同的工作负载需求。

2. 服务发现和负载均衡：

kubernetes通过service对象提供了统一的服务发现和负载均衡功能，使得应用程序可以通过简单的域名访问其他服务，并自动实现负载均衡。

3. 存储管理：

kubernetes支持多种存储后端和存储卷类型，可以为应用程序提供持久化存储和共享存储功能，如persistentvolume、persistentvolumeclaim等。

4. 自我修复：

kubernetes具有自我修复和健康检查机制，可以监控容器和节点的健康状态，并在出现故障时自动进行修复和恢复。

2、pods、services、deployments等基本概念

1. pods（容器组）

pod是kubernetes中最小的可部署单元，它可以包含一个或多个紧密相关的容器。这些容器共享相同的网络命名空间和存储卷，并且通常在同一节点上运行。pod提供了一种逻辑主机的概念，使得容器之间可以共享资源和通信。pod通常用于部署一个应用程序的一组相关容器。

2. services（服务）

服务是kubernetes中一种抽象，用于定义一组pod的逻辑集合，并为它们提供统一的访问入口。服务通过标签选择器（selector）将请求路由到对应的pod，并实现负载均衡和服务发现功能。kubernetes支持多种类型的服务，如clusterip、nodeport、loadbalancer和externalname。

3. deployments（部署）

部署是kubernetes中用于管理pod副本数量和应用程序版本更新的对象。部署定义了应用程序的期望状态，包括所需的副本数量、容器镜像和其他配置信息。部署控制器负责根据部署的定义创建、更新和删除pod实例，同时提供滚动更新和回滚的功能。

三、kafka集群架构

1、kafka集群的组成与工作原理

工作原理

1. 消息存储：

生产者将消息发布到主题，并根据主题的分区策略选择将消息存储到对应的分区中。每个分区的消息按顺序存储，并根据消息的偏移量（offset）进行标识。

2. 消息复制：

kafka通过副本集机制实现数据的高可用性和持久性。每个分区都有一个主副本（leader replica）和多个副本（follower replica），主副本负责处理读写请求，而副本用于备份数据。当主副本故障时，kafka会自动选举一个新的主副本来接管工作。

3. 消息传输：

生产者将消息发送到broker的主副本，broker负责将消息复制到副本并进行持久化存储。消费者从broker的主副本拉取消息进行处理，可以选择从不同的副本读取消息以实现负载均衡和故障恢复。

4. 消息保留策略：

kafka支持设置消息的保留策略，包括基于时间、基于大小或基于日志段的策略。一旦消息达到保留期限或超过指定的大小限制，kafka将自动删除过期消息，以释放存储空间。

2、kafka集群的高可用性设计

1. 多副本复制

kafka通过在多个broker之间复制分区的副本来实现数据的冗余和高可用性。每个分区通常有多个副本，其中一个是主副本（leader replica），负责处理读写请求；其他副本是从副本（follower replica），用于备份数据。当主副本发生故障时，kafka会自动选举一个新的主副本来接管工作，确保数据的可用性和一致性。

2. 自动故障检测与恢复

kafka集群内置了自动故障检测和恢复机制，可以监控broker和分区的健康状态，并在发现故障时自动进行故障转移和数据恢复。当broker或分区发生故障时，kafka会触发重新选举过程，选举出新的主副本并将数据复制到新的副本中，以实现快速的故障恢复。

3. 副本分布和均衡

kafka会将分区的副本分布在不同的broker上，以确保数据的冗余和均衡。通过将副本分布在不同的机架、数据中心或云区域中，可以提高系统的容错能力，即使整个机架或数据中心发生故障，系统仍然能够继续运行。

4. 水平扩展和动态伸缩

kafka支持水平扩展和动态伸缩，可以根据负载情况和性能需求来增加或减少broker的数量和容量。通过添加更多的broker和分区，可以提高系统的吞吐量和容量，同时降低单点故障的风险，实现更高的可用性和可伸缩性。

四、准备部署环境

1、准备k8s集群

这里我们使用的k8s集群版本为 1.23，也可以使用其他的版本，只是镜像导入命令不通，如果还未搭建k8s集群，请参考《在centos中搭建 k8s 1.23 集群超详细讲解》这篇文章

2、准备storageclass

因为我们要对kafka中的数据进行持久化，避免pod漂移后数据丢失，保证数据的完整性与可用性

如果还未创建存储类，请参考《k8s 存储类（storageclass）创建与动态生成pv解析，（附带镜像）》这篇文件。

3、准备部署kafka集群所需的镜像

在k8s node节点上执行以下命令

[root@node1 ~]# docker pull zookeeper:3.8
[root@node1 ~]# docker pull kafka:3.1.0
[root@node2 ~]# docker pull zookeeper:3.8
[root@node2 ~]# docker pull kafka:3.1.0
[root@node3 ~]# docker pull zookeeper:3.8
[root@node3 ~]# docker pull kafka:3.1.0

五、部署kafka集群

1、部署zookeeper集群

为什么部署kafka前要部署zookeeper？

kafka依赖zookeeper来实现分布式协调和配置管理。在kafka集群中，zookeeper扮演着多种角色，包括：

配置管理：kafka集群的配置信息和元数据存储在zookeeper中，包括主题（topics）、分区（partitions）、副本（replicas）等配置信息。
leader选举：kafka的分区（partitions）被分布式存储在集群中的多个broker上，每个分区都有一个leader和多个follower。zookeeper负责leader选举，确保每个分区都有一个活跃的leader。
broker注册：kafka broker在启动时会向zookeeper注册自己的信息，包括地址、id等，以便其他broker和客户端发现和连接。
健康监测：zookeeper监控kafka集群中各个节点的健康状态，并在节点出现故障或宕机时触发相应的处理操作。

因此，在部署kafka之前，需要先部署zookeeper，确保kafka集群正常运行所需的分布式协调和配置管理功能可用。没有zookeeper，kafka无法正常运行，并且无法实现高可用性、数据一致性和故障容错等特性。

编写部署zookeeper集群的yaml文件

[root@master ~]# vim zook.yaml
# 添加如下内容
apiversion: v1
kind: namespace
metadata:
  name: kafka
---
apiversion: v1
kind: service
metadata:
  name: zookeeper-cluster  #无头服务的名称，需要通过这个获取ip，与主机的对应关系
  namespace: kafka
  labels:
    app: zookeeper
spec:
  ports:
    - port: 2181
      name: zookeeper
    - port: 2188
      name: cluster1
    - port: 3888
      name: cluster2
  clusterip: none
  selector:
    app: zookeeper
---
apiversion: v1
kind: service
metadata:
  name: zookeeper-nodeport-service-0
  namespace: kafka
spec:
  type: nodeport
  selector:
    statefulset.kubernetes.io/pod-name: zookeeper-0
  ports:
    - protocol: tcp
      port: 80        # service 暴露的端口
      targetport: 2181   # pod 中容器的端口
      nodeport: 32181   # nodeport 类型的端口范围为 30000-32767，可以根据需要调整
---
apiversion: v1
kind: service
metadata:
  name: zookeeper-nodeport-service-1
  namespace: kafka
spec:
  type: nodeport
  selector:
    statefulset.kubernetes.io/pod-name: zookeeper-1
  ports:
    - protocol: tcp
      port: 80        # service 暴露的端口
      targetport: 2181   # pod 中容器的端口
      nodeport: 32182   # nodeport 类型的端口范围为 30000-32767，可以根据需要调整
---
apiversion: v1
kind: service
metadata:
  name: zookeeper-nodeport-service-2
  namespace: kafka
spec:
  type: nodeport
  selector:
    statefulset.kubernetes.io/pod-name: zookeeper-2
  ports:
    - protocol: tcp
      port: 80        # service 暴露的端口
      targetport: 2181   # pod 中容器的端口
      nodeport: 32183   # nodeport 类型的端口范围为 30000-32767，可以根据需要调整
---
apiversion: v1
kind: configmap
metadata:
  name: zookeeper-config
  namespace: kafka
  labels:
    app: zookeeper
data:             #具体挂载的配置文件
  zoo.cfg: |+
    ticktime=2000
    initlimit=10
    synclimit=5
    datadir=/data
    datalogdir=/datalog
    clientport=2181
    server.1=zookeeper-0.zookeeper-cluster.kafka:2188:3888
    server.2=zookeeper-1.zookeeper-cluster.kafka:2188:3888
    server.3=zookeeper-2.zookeeper-cluster.kafka:2188:3888
    4lw.commands.whitelist=*
---
apiversion: apps/v1
kind: statefulset
metadata:
  name: zookeeper
  namespace: kafka
spec:
  servicename: "zookeeper-cluster"   #填写无头服务的名称
  replicas: 3
  selector:
    matchlabels:
      app: zookeeper
  template:
    metadata:
      labels:
        app: zookeeper
    spec:
      initcontainers:
      - name: set-zk-id
        image: busybox:latest
        command: ['sh', '-c', "hostname | cut -d '-' -f 2 | awk '{print $0 + 1}' > /data/myid"]
        volumemounts:
        - name: data
          mountpath: /data
      containers:
      - name: zookeeper
        image: zookeeper:3.8
        imagepullpolicy: never
        resources:
          requests:
            memory: "500mi"
            cpu: "500m"
          limits:
            memory: "1000mi"
            cpu: "1000m"
        ports:
        - containerport: 2181
          name: zookeeper
        - containerport: 2188
          name: cluster1
        - containerport: 3888
          name: cluster2
        volumemounts:
          - name: zook-config            #挂载配置
            mountpath: /conf/zoo.cfg
            subpath: zoo.cfg
          - name: data
            mountpath: /data
        env:
        - name: my_pod_name
          valuefrom:
            fieldref:
              fieldpath: metadata.name  #metadata.name获取自己pod名称添加到变量my_pod_name
      volumes:
      - name: zook-config
        configmap:                                #configmap挂载
          name: zookeeper-config
  volumeclaimtemplates:                     #这步自动创建pvc，并挂载动态pv
    - metadata:
        name: data
      spec:
        accessmodes: ["readwritemany"]
        storageclassname: nfs
        resources:
          requests:
            storage: 10gi

创建zookeeper集群

[root@master ~]# kubectl apply -f  zook.yaml

查看pod状态

2、部署kafka集群

编写部署kafka集群的yaml文件

[root@master ~]# vim kafka.yaml
# 输入如下内容 
apiversion: v1
kind: service
metadata:
  name: kafka-cluster  #无头服务的名称，需要通过这个获取ip，与主机的对应关系
  namespace: kafka
  labels:
    app: kafka
spec:
  ports:
    - port: 9092
      name: kafka
  clusterip: none
  selector:
    app: kafka
---
apiversion: v1
kind: service
metadata:
  name: kafka-nodeport-service-0
  namespace: kafka
spec:
  type: nodeport
  selector:
    statefulset.kubernetes.io/pod-name: kafka0-0
  ports:
    - protocol: tcp
      port: 9092        # service 暴露的端口
      targetport: 9092   # pod 中容器的端口
      nodeport: 30092   # nodeport 类型的端口范围为 30000-32767，可以根据需要调整
      name: kafka
---
apiversion: v1
kind: service
metadata:
  name: kafka-nodeport-service-1
  namespace: kafka
spec:
  type: nodeport
  selector:
    statefulset.kubernetes.io/pod-name: kafka1-0
  ports:
    - protocol: tcp
      port: 9092        # service 暴露的端口
      targetport: 9092   # pod 中容器的端口
      nodeport: 30093   # nodeport 类型的端口范围为 30000-32767，可以根据需要调整
      name: kafka
---
apiversion: v1
kind: service
metadata:
  name: kafka-nodeport-service-2
  namespace: kafka
spec:
  type: nodeport
  selector:
    statefulset.kubernetes.io/pod-name: kafka2-0
  ports:
    - protocol: tcp
      port: 9092        # service 暴露的端口
      targetport: 9092   # pod 中容器的端口
      nodeport: 30094   # nodeport 类型的端口范围为 30000-32767，可以根据需要调整
      name: kafka
---
apiversion: apps/v1
kind: statefulset
metadata:
  name: kafka0
  namespace: kafka
spec:
  servicename: "kafka-cluster"   #填写无头服务的名称
  replicas: 1
  selector:
    matchlabels:
      app: kafka0
  template:
    metadata:
      labels:
        app: kafka0
    spec:
      containers:
      - name: kafka
        image: kafka:3.1.0
        imagepullpolicy: never
        resources:
          requests:
            memory: "500mi"
            cpu: "500m"
          limits:
            memory: "1000mi"
            cpu: "2000m"
        ports:
        - containerport: 9092
          name: kafka
        command:
        - sh 
        - -c 
        - "exec /app/kafka/bin/kafka-server-start.sh /app/kafka/config/server.properties --override broker.id=0 \
          --override listeners=plaintext://:9092 \
          --override advertised.listeners=plaintext://192.168.40.181:30092 \
          --override zookeeper.connect=192.168.40.181:32181,192.168.40.181:32182,192.168.40.181:32183/kafka \
          --override log.dirs=/var/lib/kafka/data \
          --override auto.create.topics.enable=true \
          --override auto.leader.rebalance.enable=true \
          --override background.threads=10 \
          --override compression.type=producer \
          --override delete.topic.enable=true \
          --override leader.imbalance.check.interval.seconds=300 \
          --override leader.imbalance.per.broker.percentage=10 \
          --override log.flush.interval.messages=9223372036854775807 \
          --override log.flush.offset.checkpoint.interval.ms=60000 \
          --override log.flush.scheduler.interval.ms=9223372036854775807 \
          --override log.retention.bytes=-1 \
          --override log.retention.hours=168 \
          --override log.roll.hours=168 \
          --override log.roll.jitter.hours=0 \
          --override log.segment.bytes=1073741824 \
          --override log.segment.delete.delay.ms=60000 \
          --override message.max.bytes=1000012 \
          --override min.insync.replicas=1 \
          --override num.io.threads=8 \
          --override num.network.threads=3 \
          --override num.recovery.threads.per.data.dir=1 \
          --override num.replica.fetchers=1 \
          --override offset.metadata.max.bytes=4096 \
          --override offsets.commit.required.acks=-1 \
          --override offsets.commit.timeout.ms=5000 \
          --override offsets.load.buffer.size=5242880 \
          --override offsets.retention.check.interval.ms=600000 \
          --override offsets.retention.minutes=1440 \
          --override offsets.topic.compression.codec=0 \
          --override offsets.topic.num.partitions=50 \
          --override offsets.topic.replication.factor=3 \
          --override offsets.topic.segment.bytes=104857600 \
          --override queued.max.requests=500 \
          --override quota.consumer.default=9223372036854775807 \
          --override quota.producer.default=9223372036854775807 \
          --override replica.fetch.min.bytes=1 \
          --override replica.fetch.wait.max.ms=500 \
          --override replica.high.watermark.checkpoint.interval.ms=5000 \
          --override replica.lag.time.max.ms=10000 \
          --override replica.socket.receive.buffer.bytes=65536 \
          --override replica.socket.timeout.ms=30000 \
          --override request.timeout.ms=30000 \
          --override socket.receive.buffer.bytes=102400 \
          --override socket.request.max.bytes=104857600 \
          --override socket.send.buffer.bytes=102400 \
          --override unclean.leader.election.enable=true \
          --override zookeeper.session.timeout.ms=6000 \
          --override zookeeper.set.acl=false \
          --override broker.id.generation.enable=true \
          --override connections.max.idle.ms=600000 \
          --override controlled.shutdown.enable=true \
          --override controlled.shutdown.max.retries=3 \
          --override controlled.shutdown.retry.backoff.ms=5000 \
          --override controller.socket.timeout.ms=30000 \
          --override default.replication.factor=1 \
          --override fetch.purgatory.purge.interval.requests=1000 \
          --override group.max.session.timeout.ms=300000 \
          --override group.min.session.timeout.ms=6000 \
          --override log.cleaner.backoff.ms=15000 \
          --override log.cleaner.dedupe.buffer.size=134217728 \
          --override log.cleaner.delete.retention.ms=86400000 \
          --override log.cleaner.enable=true \
          --override log.cleaner.io.buffer.load.factor=0.9 \
          --override log.cleaner.io.buffer.size=524288 \
          --override log.cleaner.io.max.bytes.per.second=1.7976931348623157e308 \
          --override log.cleaner.min.cleanable.ratio=0.5 \
          --override log.cleaner.min.compaction.lag.ms=0 \
          --override log.cleaner.threads=1 \
          --override log.cleanup.policy=delete \
          --override log.index.interval.bytes=4096 \
          --override log.index.size.max.bytes=10485760 \
          --override log.message.timestamp.difference.max.ms=9223372036854775807 \
          --override log.message.timestamp.type=createtime \
          --override log.preallocate=false \
          --override log.retention.check.interval.ms=300000 \
          --override max.connections.per.ip=2147483647 \
          --override num.partitions=1 \
          --override producer.purgatory.purge.interval.requests=1000 \
          --override replica.fetch.backoff.ms=1000 \
          --override replica.fetch.max.bytes=1048576 \
          --override replica.fetch.response.max.bytes=10485760 \
          --override reserved.broker.max.id=1000"
        volumemounts:
          - name: data0
            mountpath: /var/lib/kafka/data
        env:
        - name: my_pod_name
          valuefrom:
            fieldref:
              fieldpath: metadata.name  #metadata.name获取自己pod名称添加到变量my_pod_name
        - name: allow_plaintext_listener
          value: "yes"
        - name: kafka_heap_opts
          value : "-xms1g -xmx1g"
        - name: jmx_port
          value: "5555"
  volumeclaimtemplates:                     #这步自动创建pvc，并挂载动态pv
    - metadata:
        name: data0
      spec:
        accessmodes: ["readwritemany"]
        storageclassname: nfs
        resources:
          requests:
            storage: 10gi
---
apiversion: apps/v1
kind: statefulset
metadata:
  name: kafka1
  namespace: kafka
spec:
  servicename: "kafka-cluster"   #填写无头服务的名称
  replicas: 1
  selector:
    matchlabels:
      app: kafka1
  template:
    metadata:
      labels:
        app: kafka1
    spec:
      containers:
      - name: kafka
        image: kafka:3.1.0
        imagepullpolicy: never
        resources:
          requests:
            memory: "500mi"
            cpu: "500m"
          limits:
            memory: "1000mi"
            cpu: "2000m"
        ports:
        - containerport: 9092
          name: kafka
        command:
        - sh 
        - -c 
        - "exec /app/kafka/bin/kafka-server-start.sh /app/kafka/config/server.properties --override broker.id=1 \
          --override listeners=plaintext://:9092 \
          --override advertised.listeners=plaintext://192.168.40.181:30093 \
          --override zookeeper.connect=192.168.40.181:32181,192.168.40.181:32182,192.168.40.181:32183/kafka \
          --override log.dirs=/var/lib/kafka/data \
          --override auto.create.topics.enable=true \
          --override auto.leader.rebalance.enable=true \
          --override background.threads=10 \
          --override compression.type=producer \
          --override delete.topic.enable=true \
          --override leader.imbalance.check.interval.seconds=300 \
          --override leader.imbalance.per.broker.percentage=10 \
          --override log.flush.interval.messages=9223372036854775807 \
          --override log.flush.offset.checkpoint.interval.ms=60000 \
          --override log.flush.scheduler.interval.ms=9223372036854775807 \
          --override log.retention.bytes=-1 \
          --override log.retention.hours=168 \
          --override log.roll.hours=168 \
          --override log.roll.jitter.hours=0 \
          --override log.segment.bytes=1073741824 \
          --override log.segment.delete.delay.ms=60000 \
          --override message.max.bytes=1000012 \
          --override min.insync.replicas=1 \
          --override num.io.threads=8 \
          --override num.network.threads=3 \
          --override num.recovery.threads.per.data.dir=1 \
          --override num.replica.fetchers=1 \
          --override offset.metadata.max.bytes=4096 \
          --override offsets.commit.required.acks=-1 \
          --override offsets.commit.timeout.ms=5000 \
          --override offsets.load.buffer.size=5242880 \
          --override offsets.retention.check.interval.ms=600000 \
          --override offsets.retention.minutes=1440 \
          --override offsets.topic.compression.codec=0 \
          --override offsets.topic.num.partitions=50 \
          --override offsets.topic.replication.factor=3 \
          --override offsets.topic.segment.bytes=104857600 \
          --override queued.max.requests=500 \
          --override quota.consumer.default=9223372036854775807 \
          --override quota.producer.default=9223372036854775807 \
          --override replica.fetch.min.bytes=1 \
          --override replica.fetch.wait.max.ms=500 \
          --override replica.high.watermark.checkpoint.interval.ms=5000 \
          --override replica.lag.time.max.ms=10000 \
          --override replica.socket.receive.buffer.bytes=65536 \
          --override replica.socket.timeout.ms=30000 \
          --override request.timeout.ms=30000 \
          --override socket.receive.buffer.bytes=102400 \
          --override socket.request.max.bytes=104857600 \
          --override socket.send.buffer.bytes=102400 \
          --override unclean.leader.election.enable=true \
          --override zookeeper.session.timeout.ms=6000 \
          --override zookeeper.set.acl=false \
          --override broker.id.generation.enable=true \
          --override connections.max.idle.ms=600000 \
          --override controlled.shutdown.enable=true \
          --override controlled.shutdown.max.retries=3 \
          --override controlled.shutdown.retry.backoff.ms=5000 \
          --override controller.socket.timeout.ms=30000 \
          --override default.replication.factor=1 \
          --override fetch.purgatory.purge.interval.requests=1000 \
          --override group.max.session.timeout.ms=300000 \
          --override group.min.session.timeout.ms=6000 \
          --override log.cleaner.backoff.ms=15000 \
          --override log.cleaner.dedupe.buffer.size=134217728 \
          --override log.cleaner.delete.retention.ms=86400000 \
          --override log.cleaner.enable=true \
          --override log.cleaner.io.buffer.load.factor=0.9 \
          --override log.cleaner.io.buffer.size=524288 \
          --override log.cleaner.io.max.bytes.per.second=1.7976931348623157e308 \
          --override log.cleaner.min.cleanable.ratio=0.5 \
          --override log.cleaner.min.compaction.lag.ms=0 \
          --override log.cleaner.threads=1 \
          --override log.cleanup.policy=delete \
          --override log.index.interval.bytes=4096 \
          --override log.index.size.max.bytes=10485760 \
          --override log.message.timestamp.difference.max.ms=9223372036854775807 \
          --override log.message.timestamp.type=createtime \
          --override log.preallocate=false \
          --override log.retention.check.interval.ms=300000 \
          --override max.connections.per.ip=2147483647 \
          --override num.partitions=1 \
          --override producer.purgatory.purge.interval.requests=1000 \
          --override replica.fetch.backoff.ms=1000 \
          --override replica.fetch.max.bytes=1048576 \
          --override replica.fetch.response.max.bytes=10485760 \
          --override reserved.broker.max.id=1000"
        volumemounts:
          - name: data1
            mountpath: /var/lib/kafka/data
        env:
        - name: my_pod_name
          valuefrom:
            fieldref:
              fieldpath: metadata.name  #metadata.name获取自己pod名称添加到变量my_pod_name
        - name: allow_plaintext_listener
          value: "yes"
        - name: kafka_heap_opts
          value : "-xms1g -xmx1g"
        - name: jmx_port
          value: "5555"
  volumeclaimtemplates:                     #这步自动创建pvc，并挂载动态pv
    - metadata:
        name: data1
      spec:
        accessmodes: ["readwritemany"]
        storageclassname: nfs
        resources:
          requests:
            storage: 10gi
---
apiversion: apps/v1
kind: statefulset
metadata:
  name: kafka2
  namespace: kafka
spec:
  servicename: "kafka-cluster"   #填写无头服务的名称
  replicas: 1
  selector:
    matchlabels:
      app: kafka2
  template:
    metadata:
      labels:
        app: kafka2
    spec:
      containers:
      - name: kafka
        image: kafka:3.1.0
        imagepullpolicy: never
        resources:
          requests:
            memory: "500mi"
            cpu: "500m"
          limits:
            memory: "1000mi"
            cpu: "2000m"
        ports:
        - containerport: 9092
          name: kafka
        command:
        - sh 
        - -c 
        - "exec /app/kafka/bin/kafka-server-start.sh /app/kafka/config/server.properties --override broker.id=2 \
          --override listeners=plaintext://:9092 \
          --override advertised.listeners=plaintext://192.168.40.181:30094 \
          --override zookeeper.connect=192.168.40.181:32181,192.168.40.181:32182,192.168.40.181:32183/kafka \
          --override log.dirs=/var/lib/kafka/data \
          --override auto.create.topics.enable=true \
          --override auto.leader.rebalance.enable=true \
          --override background.threads=10 \
          --override compression.type=producer \
          --override delete.topic.enable=true \
          --override leader.imbalance.check.interval.seconds=300 \
          --override leader.imbalance.per.broker.percentage=10 \
          --override log.flush.interval.messages=9223372036854775807 \
          --override log.flush.offset.checkpoint.interval.ms=60000 \
          --override log.flush.scheduler.interval.ms=9223372036854775807 \
          --override log.retention.bytes=-1 \
          --override log.retention.hours=168 \
          --override log.roll.hours=168 \
          --override log.roll.jitter.hours=0 \
          --override log.segment.bytes=1073741824 \
          --override log.segment.delete.delay.ms=60000 \
          --override message.max.bytes=1000012 \
          --override min.insync.replicas=1 \
          --override num.io.threads=8 \
          --override num.network.threads=3 \
          --override num.recovery.threads.per.data.dir=1 \
          --override num.replica.fetchers=1 \
          --override offset.metadata.max.bytes=4096 \
          --override offsets.commit.required.acks=-1 \
          --override offsets.commit.timeout.ms=5000 \
          --override offsets.load.buffer.size=5242880 \
          --override offsets.retention.check.interval.ms=600000 \
          --override offsets.retention.minutes=1440 \
          --override offsets.topic.compression.codec=0 \
          --override offsets.topic.num.partitions=50 \
          --override offsets.topic.replication.factor=3 \
          --override offsets.topic.segment.bytes=104857600 \
          --override queued.max.requests=500 \
          --override quota.consumer.default=9223372036854775807 \
          --override quota.producer.default=9223372036854775807 \
          --override replica.fetch.min.bytes=1 \
          --override replica.fetch.wait.max.ms=500 \
          --override replica.high.watermark.checkpoint.interval.ms=5000 \
          --override replica.lag.time.max.ms=10000 \
          --override replica.socket.receive.buffer.bytes=65536 \
          --override replica.socket.timeout.ms=30000 \
          --override request.timeout.ms=30000 \
          --override socket.receive.buffer.bytes=102400 \
          --override socket.request.max.bytes=104857600 \
          --override socket.send.buffer.bytes=102400 \
          --override unclean.leader.election.enable=true \
          --override zookeeper.session.timeout.ms=6000 \
          --override zookeeper.set.acl=false \
          --override broker.id.generation.enable=true \
          --override connections.max.idle.ms=600000 \
          --override controlled.shutdown.enable=true \
          --override controlled.shutdown.max.retries=3 \
          --override controlled.shutdown.retry.backoff.ms=5000 \
          --override controller.socket.timeout.ms=30000 \
          --override default.replication.factor=1 \
          --override fetch.purgatory.purge.interval.requests=1000 \
          --override group.max.session.timeout.ms=300000 \
          --override group.min.session.timeout.ms=6000 \
          --override log.cleaner.backoff.ms=15000 \
          --override log.cleaner.dedupe.buffer.size=134217728 \
          --override log.cleaner.delete.retention.ms=86400000 \
          --override log.cleaner.enable=true \
          --override log.cleaner.io.buffer.load.factor=0.9 \
          --override log.cleaner.io.buffer.size=524288 \
          --override log.cleaner.io.max.bytes.per.second=1.7976931348623157e308 \
          --override log.cleaner.min.cleanable.ratio=0.5 \
          --override log.cleaner.min.compaction.lag.ms=0 \
          --override log.cleaner.threads=1 \
          --override log.cleanup.policy=delete \
          --override log.index.interval.bytes=4096 \
          --override log.index.size.max.bytes=10485760 \
          --override log.message.timestamp.difference.max.ms=9223372036854775807 \
          --override log.message.timestamp.type=createtime \
          --override log.preallocate=false \
          --override log.retention.check.interval.ms=300000 \
          --override max.connections.per.ip=2147483647 \
          --override num.partitions=1 \
          --override producer.purgatory.purge.interval.requests=1000 \
          --override replica.fetch.backoff.ms=1000 \
          --override replica.fetch.max.bytes=1048576 \
          --override replica.fetch.response.max.bytes=10485760 \
          --override reserved.broker.max.id=1000"
        volumemounts:
          - name: data2
            mountpath: /var/lib/kafka/data
        env:
        - name: my_pod_name
          valuefrom:
            fieldref:
              fieldpath: metadata.name  #metadata.name获取自己pod名称添加到变量my_pod_name
        - name: allow_plaintext_listener
          value: "yes"
        - name: kafka_heap_opts
          value : "-xms1g -xmx1g"
        - name: jmx_port
          value: "5555"
  volumeclaimtemplates:                     #这步自动创建pvc，并挂载动态pv
    - metadata:
        name: data2
      spec:
        accessmodes: ["readwritemany"]
        storageclassname: nfs
        resources:
          requests:
            storage: 10gi

创建kafka集群

[root@master ~]# kubectl apply -f  kafka.yaml

查看pod状态

至此，kafka集群部署完成

在k8s中部署Kafka高可用集群超详细讲解

2024年08月06日 • ar •我要评论

一、引言

1、kafka简介

2、为什么在kubernetes中部署kafka

二、kubernetes基础

1、kubernetes概述

2、pods、services、deployments等基本概念

三、kafka集群架构

1、kafka集群的组成与工作原理

2、kafka集群的高可用性设计

四、准备部署环境

1、准备k8s集群

2、准备storageclass

3、准备部署kafka集群所需的镜像

五、部署kafka集群

1、部署zookeeper集群

2、部署kafka集群

相关文章:

2024年网络安全最新疯狂Hadoop之分布式集群搭建（一）_hadoop yarn 多节点(1)

Hadoop3.1.3完全分布式平台搭建

黑马大数据学习笔记2-HDFS基本操作

计算机毕业设计hadoop+spark+hive物流大数据分析平台仓储数据分析物流预测系统物流信息爬虫物流大数据机器学习深度学习知识图谱大数据

发表评论


验证码：

在k8s中部署Kafka高可用集群超详细讲解

2024年08月06日 • ar •我要评论

一、引言

1、kafka简介

2、为什么在kubernetes中部署kafka

二、kubernetes基础

1、kubernetes概述

2、pods、services、deployments等基本概念

三、kafka集群架构

1、kafka集群的组成与工作原理

2、kafka集群的高可用性设计

四、准备部署环境

1、准备k8s集群

2、准备storageclass

3、准备部署kafka集群所需的镜像

五、部署kafka集群

1、部署zookeeper集群

2、部署kafka集群

相关文章:

2024年网络安全最新疯狂Hadoop之分布式集群搭建（一）_hadoop yarn 多节点(1)

Hadoop3.1.3完全分布式平台搭建

黑马大数据学习笔记2-HDFS基本操作

计算机毕业设计hadoop+spark+hive物流大数据分析平台 仓储数据分析 物流预测系统 物流信息爬虫 物流大数据 机器学习 深度学习 知识图谱 大数据

发表评论

计算机毕业设计hadoop+spark+hive物流大数据分析平台仓储数据分析物流预测系统物流信息爬虫物流大数据机器学习深度学习知识图谱大数据