09 · 工程定位：Kafka 在真实系统中的角色与取舍

目标：理解 Kafka 适合什么、不适合什么，以及它在真实系统架构中的位置

一、Kafka 的本质定位

高吞吐、持久化、可重放的异步数据管道。

所有设计都围绕这个定位展开：append-only log 保证高吞吐和可重放，partition 保证水平扩展，Consumer Group 保证并行消费，offset 由消费者自己管理保证解耦。

传统任务队列（如 RabbitMQ）的工作方式：

Kafka 做不到这些：

请求-响应需要低延迟的点对点通信：A 发请求，B 快速回应给 A。

Kafka 是异步解耦的：

Kafka 只保证 单个 partition 内消息有序，跨 partition 没有顺序保证。

并行消费意味着多个消费者同时从不同 partition 读取，哪个先处理完是不确定的。这就是 key 路由的核心价值：

这是 Kafka 在吞吐量和顺序保证之间的根本取舍：想要更高吞吐就增加 partition 数量和消费者数量，但跨 partition 的全局顺序就无法保证。

取舍维度	Kafka 的选择	代价
吞吐 vs 延迟	批量发送、批量压缩换高吞吐	引入少量延迟（linger.ms）
可靠性 vs 可用性	acks=all + min.insync.replicas 保数据不丢	副本不足时拒绝写入
顺序 vs 并行	单 partition 内有序，跨 partition 无序	全局有序需要单 partition，牺牲并行度
解耦 vs 实时	异步解耦，消费者自主控制进度	不适合低延迟请求-响应
简单性 vs 灵活性	offset 由消费者管理	不支持单条消息级别的 ack/nack
存储效率 vs 随机访问	顺序写入 + Page Cache + 零拷贝	不支持高效随机读写

Kafka 设计文档 — Use Cases：https://kafka.apache.org/42/getting-started/use-cases/
Kafka 设计文档 — Design：https://kafka.apache.org/42/design/design/