欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

kafka_2.12集群搭建

程序员文章站 2022-06-14 11:00:30
...

kafka集群搭建需要用到zookeeper 存储状态,zk搭建过程参考zookeeper3.5.5 集群安装

一、下载kafka安装包
$ cd /usr/local/src
$ wget https://www-eu.apache.org/dist/kafka/2.3.0/kafka_2.12-2.3.0.tgz
$ tar xf kafka_2.12-2.3.0.tgz -C /usr/local
$ cd ../kafka_2.12-2.3.0
主配置文件位置
$ ls -al /usr/local/kafka_2.12-2.3.0/config/server.properties
Kafka server 基本配置
###是kafka集群server的唯一标识
broker.id=1

### Kafka 网络相关配置
listeners=PLAINTEXT://:9092 ### 由用户配置协议,ip,port
advertised.listeners=PLAINTEXT://10.100.20.177:9092
num.network.threads=3   ###这个是borker进行网络处理的线程数
num.io.threads=8   ###这个是borker进行I/O处理的线程数
socket.send.buffer.bytes=102400 ### 发送缓冲区buffer大小,数据不是一下子就发送的,先回存储到缓冲区了到达一定的大小后在发送,能提高性能
socket.receive.buffer.bytes=102400  ###kafka接收缓冲区大小,当数据到达一定大小后在序列化到磁盘
socket.request.max.bytes=104857600 ### 这个参数是向kafka请求消息或者向kafka发送消息的请请求的最大数,这个值不能超过java的堆栈大小

### 日志配置
log.dirs=/data/kafka/kafka-logs  ###log文件存储路径
num.partitions=3 ###topic默认的partitions数量。在创建topic时,一般会指定partitions数量,因此该配置项在上述条件下基本无用。为了防止在创建topic时,未指定partitions数量,因此推荐使用配置为3。


##内部topic配置
num.recovery.threads.per.data.dir=1
offsets.topic.replication.factor=3
transaction.state.log.replication.factor=3
transaction.state.log.min.isr=2

## log保留策略配置
log.retention.hours=168 ###日志保留时间,单位小时
log.retention.bytes=1073741824 ### 
log.segment.bytes=1073741824
log.retention.check.interval.ms=300000

###zookeeper 配置
zookeeper.connect=10.100.210.177:2181,10.100.210.191:2181,10.100.210.192:2181
zookeeper.connection.timeout.ms=6000
group.initial.rebalance.delay.ms=3000
Kafka 网络相关配置

listeners:由用户配置协议,ip,port。
num.network.threads:这个是borker进行网络处理的线程数
num.io.threads:
socket.send.buffer.bytes: 发送缓冲区buffer大小,数据不是一下子就发送的,先回存储到缓冲区了到达一定的大小后在发送,能提高性能
socket.receive.buffer.bytes:
socket.request.max.bytes:

内部topic配置

开发测试环境推荐使用默认配置,均为1
生产环境推荐如下配置,replication数量为3,isr数量为2。

log 刷盘、落盘机制

log.flush.interval.messages:日志落盘消息条数间隔,即每接收到一定条数消息,即进行log落盘。
log.flush.interval.ms:日志落盘时间间隔,单位ms,即每隔一定时间,即进行log落盘。
强烈推荐开发、测试、生产环境均采用默认值,即不配置该配置,交由操作系统自行决定何时落盘,以提升性能。
若对消息高可靠性要求较高的应用系统,可针对topic级别的配置,配置该属性。

log保留策略配置

log.retention.hours:日志保留时间,单位小时。和log.retention.minutes两个配置只需配置一项。
message.max.bytes:表示接受消息体的最大大小,单位是字节
default.replication.factor:默认的备份的复制自动创建topics的个数
replica.fetch.max.bytes:最大备份的拉取数量
log.retention.bytes:日志保留大小。一topic的一partition下的所有日志大小总和达到该值,即进行日志清除任务。当日志保留时间或日志保留大小,任一条件满足即进行日志清除任务,-1表示不限制。
log.segment.bytes:日志分段大小。即一topic的一partition下的所有日志会进行分段,达到该大小,即进行日志分段,滚动出新的日志文件。
log.retention.check.interval.ms:日志保留策略定期检查时间间隔,单位ms。
日志保留大小,保留时间以及日志分段大小可根据具体服务器磁盘空间大小,业务场景自行决定。

zookeeper 配置

zookeeper.connect:zk连接地址
zookeeper.connection.timeout.ms:zk连接超时时间,默认6s。可根据具体的应用场景进行更改

consumer group 协调配置

生产环境推荐配置3000
开发测试环境推荐配置0

二、启动Kafka集群并测试
启动Kafka集群(3台都需要启动)
$ cd /usr/local/kafka_2.12-2.3.0/config/
$ ../bin/kafka-server-start.sh -daemon server.properties 

查看日志

$ tail -f -n 400 ../logs/server.log

问题记录:

Kafka超时错误:Timed out waiting for connection while in state

解决:

1)测试是否能和集群中的其它zooKeeper节点端口通讯

2)测试是否能和集群中的其它节点Kafka端口通讯

3)查看防火墙配置,如果配置不好iptables,建议关闭

4)关闭SELINUX

5)查看/etc/hosts中有无其它绑定地址,如果有影响,建议临时注释后再启动查看

6)查看/etc/resolv.conf中的DNS配置

我的原因是因为/etc/resolv.conf中添加了其它的DNS地址,所以导致在Kafka启动时无法解析到集群中的其它节点,我把以下节点注释以后,启动成功

查看三套机器启动是否成功

$ jps
25977 Jps
18298 QuorumPeerMain
24524 Kafka
$ netstat -anlp|egrep '2181|9092|2888|3888'
tcp        0      0 10.100.210.191:2888      0.0.0.0:*               LISTEN      22886/java          
tcp        0      0 10.100.210.191:3888      0.0.0.0:*               LISTEN      22886/java          
tcp        0      0 0.0.0.0:9092            0.0.0.0:*               LISTEN      26661/java          
tcp        0      0 0.0.0.0:2181            0.0.0.0:*               LISTEN      22886/java  

其中2888端口是leader的端口 ,其中一台会有这个端口
确定启动成功

测试集群
$ cd /usr/local/kafka_2.12-2.3.0/bin/
## 创建Topic来验证是否创建成功
## 		--replication-factor 2   #复制两份
##		--partitions 1 #创建1个分区
##		--topic
$ ./kafka-topics.sh --create --zookeeper 10.100.210.177:2181 --replication-factor 2 --partitions 1 --topic summer

## 查看所有topic和topic 状态
$ ./kafka-topics.sh --list --zookeeper  10.100.210.177:2181
summer
$ ./kafka-topics.sh --describe --zookeeper 10.100.210.177:2181 --topic summer
Topic:summer        PartitionCount:1        ReplicationFactor:2     Configs:
        Topic: summer       Partition: 0    Leader: 0       Replicas: 0,2   Isr: 0,2
#分区为1  复制因子为2   Topic summer的分区为0 
#Replicas: 0,2   复制的为0,2

## 创建一个broker,发布者发布消息
$  ./kafka-console-producer.sh --broker-list 10.100.210.177:9092 --topic summer
>This is a messages

## 在到另一台机器或同一台一台机器开一个终端创建一个消费者消费
$  ./kafka-console-consumer.sh --bootstrap-server 10.100.210.191:9092 --topic basketball --from-beginning         
This is a messages

kafka集群搭建完毕

登录zk来查看zk的目录情况
$ cd /usr/local/apache-zookeeper-3.5.5-bin/bin/
$ ./zkCli.sh  -server 10.100.210.177
[zk: 10.100.20.177(CONNECTED) 1] ls /
[admin, brokers, cluster, config, consumers, controller, controller_epoch, isr_change_notification, latest_producer_id_block, log_dir_event_notification, zoo, zoo1, zookeeper]

[zk: 10.100.20.177(CONNECTED) 1] get /brokers/ids/
0   1   2   
[zk: 10.100.20.177(CONNECTED) 1] get /brokers/ids/
0   1   2   
[zk: 10.100.20.177(CONNECTED) 1] get /brokers/ids/1
{"listener_security_protocol_map":{"PLAINTEXT":"PLAINTEXT"},"endpoints":["PLAINTEXT://10.100.20.191:9092"],"jmx_port":-1,"host":"10.100.210.191","timestamp":"1569809877524","port":9092,"version":4}