生产者

将数据发布到 Kafka 主题的应用程序称为生产者。应用程序集成了一个Kafka 客户端库来写入 Kafka。编写过程从创建 ProducerRecird开始。

Kafka Producers 中的组件/流程

拦截器——可以在发送之前改变记录的拦截器，例如Claim-check-interceptor。
生产者元数据——管理生产者所需的元数据：集群中的主题和分区、充当分区领导者的代理节点等。
序列化器——将对象转换为字节数组的键/值序列化器。
Partitioner — 计算给定记录的分区。如果 ProducerRecord 中指定了分区，则分区器将返回相同的分区，否则，它将根据分区策略（轮询、哈希键或自定义分区）为消息键选择分区。org.apache.kafka.clients.producer.internals.DefaultPartitioner, org.apache.kafka.clients.producer.RoundRobinPartitioner, org.apache.kafka.clients.producer.UniformStickyPartitioner, org.apache.kafka.clients.producer.Partitioner (Inteface)
Record Accumulator - 累积记录并按主题分区将它们分组为批次。一批未发送的记录保存在缓冲存储器中。一个单独的 I/O 线程负责将这些批次的记录作为请求发送到 Kafka 代理。
事务管理器——管理事务并维护必要的状态以确保幂等生产。
通道选择器——创建一个网络客户端来与代理建立通信。

Kafka 生产者将数据写入分区的当前领导代理。如果我们希望消息在被视为成功写入之前必须写入最少数量的副本，我们需要设置在被视为成功写入之前acks需要确认收到消息的代理数量。

注意：当acks=all使用 a时replication.factor=N，min.insync.replicas=M我们可以容忍N-M代理出于主题可用性的目的而关闭。

重试
delivery.timeout.ms
retry.backoff.ms

max.in.flight.requests.per.connection

重试发送失败消息的重复风险很小。如果数据被复制到 ISR 但确认未到达生产者并因此重试，则可能会发生这种情况。为了避免这种情况，Kafka 使用了不断增加的 PID 序列。Kafka 总是采用成功写入的最大 PID-Sequence Number 组合。当接收到较低的序列号时，将其丢弃。

enable.idempotence=true
acks=all

compression.type
none、gzip、lz4、snappy 和 zstd

如果我们使用生产者级压缩，那么我们应该将代理级设置设置为compression.type=producer. 如果生产者级别压缩和代理级别压缩不匹配，代理将解压并再次压缩。

linger.ms — 发送批次前的等待时间
batch.size — 批次中包含的最大字节数

生产者记录落在套接字接收缓冲区上。网络线程之一拾取消息并将其传递到共享请求队列。
记录由 I/O 线程拾取。它验证数据的CRC。然后将记录写入提交日志。
I/O 线程将响应逻辑交给 Purgatory map（管理延迟操作的代理）。此映射等待其他代理确认写入 (ISR)。这个映射是用 ConcurrentHashMap 和 ConcurrentLinkedQueue 实现的。
复制消息后，响应将被放入响应队列。
网络线程从队列中拉取响应并将其放入套接字发送缓冲区。