1、 分区
分区的设计使得Kafka消息的读写性能可以突破单台broker的I/O性能瓶颈
2、日志分段存储
为了防止日志(Log)过大,Kafka引入了日志分段(LogSegment)的概念,将日志切分成多个日志分段。
消息是按照什么形式或怎么方式存储到segment段呢?
实际中有config/server.properties文件的配置如下:
##日志滚动的周期时间,到达指定周期时间时,强制生成一个新的segment
log.roll.hours=72
##segment的索引文件最大尺寸限制,即时log.segment.bytes没达到,也会生成一个新的segment
log.index.size.max.bytes=10*1024*1024
##控制日志segment文件的大小,超出该大小则追加到一个新的日志segment文件中(-1表示没有限制)
log.segment.bytes=1014*1024*1024
3、消息顺序追加写磁盘
Kafka是通过文件追加的方式来写入消息的,只能在日志文件的最后追加新的消息,并且不允许修改已经写入的消息,这种方式就是顺序写磁盘
4、零拷贝
5、页缓存(page cache)