文章目录
前言
一、kafka
1、什么是消息队列
假设我们有两个服务:生产者a每秒能生产200个消息,消费者b每秒能消费100个消息。
那么b服务是处理不了a这么多消息的,那么怎么使b不被压垮的同时还能处理a的消息呢,我们引入一个中间件,即kafka
。(当然着并不能使消费者的处理速度上升)
offset
那么我们可以在b服务中加入一个队列,也就是一个链表,链表的每个节点相当于一条消息,每个节点有一个序号即offset
,记录消息的位置。
但是这样也会有个问题,还没有处理的消息是存储在内存中的,如果b服务挂掉,那么消息也就丢失了。
所以我们可以把队列移出,变成一个单独的进程,即使b服务挂掉,消息也不会丢失。
2、高性能
b服务由于性能差,队列中未处理的消息会越来越多,我们可以增加更多的消费者来处理消息,相对的也可以增加更多的生产者来生成消息。
topic
但是,生产者与消费者会争抢同一个队列,没有抢到就要等待,那么怎么解决呢?
我们可以将消息进行分类,每一类消息是一个topic
,生产者按消息的类型投递到不同的topic
中,消费者也按照不同的topic进行消费。
partition
但是单个topic的消息还是有可能过多,我们可以将单个队列拆分,每段是一个partition
分区,每个消费者负责一个partition
。
3、高扩展
broker
随着partition
过多,所有的partition
都在同一个机器上,就可能会导致单机的cpu和内存过高,影响性能,那么我们可以使用多台机器,将partition
分散部署在不同的机器上。每台机器就代表一个broker
。
我们可以增加broker
来缓解服务器的cpu过高的性能问题。
4、高可用
replicas、leader、follower
假如某个broker
挂了, 那么其中partition
中的消息也就都丢失了,那么这个问题怎么解决呢?
我们可以给partition
多加几个副本,统称replicas
,并将它们分为leader
和follower
。
leader
负责生产者和消费者的读写,follower
只负责同步leader
的数据。假如leader
挂了,也不会影响follower
,随后在follower
中选出一个leader
,保证消息队列的高可用。
5、持久化和过期策略
在上面讲述了leader
挂掉的情况,如果所有的broker
都挂了,消息不就都丢失了?
为了解决这个问题,就不能只把数据存在内存中,也要存在磁盘中。
但是如果所有消息一直保存在磁盘中,那磁盘也会被占满,所以引入保留策略。
6、消费者组
如果我想在原有的基础上增加一个消费者,那么它只能跟着最新的offset
接着消费,如果我想从某个offset
开始消费呢?
我们引入消费者组,实现不同消费者维护自己的消费进度。
7、zookeeper
上面介绍了很多的组件,每个组件都有自己的状态信息,那么就需要有一个组件去统一维护这些组件的状态信息,于是引入了zookeeper
组件,它会定期与broker
通信,获取kafka
集群的状态,判断哪些broker
挂了,消费者组消费到哪了等等。
8、架构图
二、安装zookeeper
1、官网地址
2、下载
选择稳定版本下载
3、解压,修改配置文件
解压后,复制 zoo_sample.cfg,重命名为 zoo.cfg
修改数据文件目录位置
4、启动
我们是在windows系统下安装的,运行 bin 目录下的 zkserver.cmd
三、安装kafka
1、官网地址
2、下载
3、解压,修改配置文件
修改 config 目录下 server.properties 文件
修改日志文件位置,其他参数(如zookeeper端口,根据需要修改)
4、启动
bin\windows\kafka-server-start.bat config\server.properties
四、java中使用kafka
1、引入依赖
<dependency>
<groupid>org.apache.kafka</groupid>
<artifactid>kafka-clients</artifactid>
</dependency>
2、生产者
public static void main(string[] args) throws interruptedexception {
properties prop = new properties();
prop.put(producerconfig.bootstrap_servers_config, "127.0.0.1:9092");
prop.put(producerconfig.key_serializer_class_config, "org.apache.kafka.common.serialization.stringserializer");
prop.put(producerconfig.value_serializer_class_config, "org.apache.kafka.common.serialization.stringserializer");
prop.put(producerconfig.acks_config, "all");
prop.put(producerconfig.retries_config, 0);
prop.put(producerconfig.batch_size_config, 16384);
prop.put(producerconfig.linger_ms_config, 1);
prop.put(producerconfig.buffer_memory_config, 33554432);
string topic = "hello";
kafkaproducer<string, string> producer = new kafkaproducer<>(prop);
for (int i = 0; i < 100; i++) {
producer.send(new producerrecord<string, string>(topic, integer.tostring(2), "hello kafka" + i));
system.out.println("生产消息:" + i);
thread.sleep(1000);
}
producer.close();
}
3、消费者
public static void main(string[] args) {
properties prop = new properties();
prop.put(consumerconfig.bootstrap_servers_config,"127.0.0.1:9092");
prop.put(consumerconfig.key_deserializer_class_config, "org.apache.kafka.common.serialization.stringdeserializer");
prop.put(consumerconfig.value_deserializer_class_config, "org.apache.kafka.common.serialization.stringdeserializer");
prop.put(consumerconfig.group_id_config, "con-1"); // 消费者组
prop.put(consumerconfig.auto_offset_reset_config, "latest");
prop.put(consumerconfig.enable_auto_commit_config, true); //自动提交偏移量
prop.put(consumerconfig.auto_commit_interval_ms_config, 1000); //自动提交时间
kafkaconsumer<string, string> consumer = new kafkaconsumer<>(prop);
arraylist<string> topics = new arraylist<>();
//可以订阅多个消息
topics.add("hello");
consumer.subscribe(topics);
try {
while(true) {
consumerrecords<string, string> poll = consumer.poll(duration.ofseconds(10));
for (topicpartition topicpartition : poll.partitions()) {
// 通过topicpartition获取指定的消息集合,获取到的就是当前topicpartition下面所有的消息
list<consumerrecord<string, string>> partitionrecords = poll.records(topicpartition);
// 获取topicpartition对应的主题名称
string topic = topicpartition.topic();
// 获取topicpartition对应的分区位置
int partition = topicpartition.partition();
// 获取当前topicpartition下的消息条数
int size = partitionrecords.size();
system.out.printf("--- 获取topic: %s, 分区位置:%s, 消息总数: %s%n",
topic,
partition,
size);
for(int i = 0; i < size; i++) {
consumerrecord<string, string> consumerrecord = partitionrecords.get(i);
// 实际的数据内容
string key = consumerrecord.key();
// 实际的数据内容
string value = consumerrecord.value();
// 当前获取的消息偏移量
long offset = consumerrecord.offset();
// 表示下一次从什么位置(offset)拉取消息
long commitoffser = offset + 1;
system.out.printf("消费消息 key:%s, value:%s, 消息offset: %s, 提交offset: %s%n",
key, value, offset, commitoffser);
thread.sleep(1500);
}
}
}
} catch (exception e) {
e.printstacktrace();
} finally {
consumer.close();
}
}
4、运行效果
生产消息
消费消息
发表评论