一、顺序读写
kafka不基于内存,而是硬盘存储,因此消息堆积能力更强
顺序写利用磁盘的顺序访问速度可以接近内存, kafka的消息都是append操作,partition是有序的, 节省了磁盘的寻道时间,同时通过批量操作、节省写入次数,partition物理 上分为多个segment存储,方便删除
二、传统的缺陷:
●读取磁盘文件数据到内核缓冲区
●将内核缓冲区的数据copy到用户缓冲区
●将用户缓冲区的数据copy到socket的发送缓冲区
●将socket发送缓冲区中的数据发送到网卡、进行传输
三、零拷贝:
●直接将内核缓冲区的数据发送到网卡传输
●使用的是操作系统的指令支持
kafka不太依赖jvm,主要理由操作系统的pageCache,如果生产消费速率相当,则直接用pageCache交换数据,不需要经过磁盘I0
评论