基于zero copy的高效数据传输

2017-04-16 本文已影响0人 ic_bbc

简介

在学习kafka如何实现高吞吐量的时候遇到一个技术zero copy，追随kafka文档中的链接深入了解了一下zero copy，在这里mark一下，原文链接https://www.ibm.com/developerworks/linux/library/j-zerocopy/

假设这样一个场景：从文件中读取数据然后通过网络将数据发送出去，实现的核心部分一般是这样的

File.read(fileDesc, buf, len);
Socket.send(socket, buf, len);

尽管实现非常简单，需要4次用户态和内核态的上线文切换，数据需要拷贝4次，整个流程如下图

Paste_Image.png

read()从用户态切换到内核态，调用sys_read()从文件中读取数据，数据从disk拷贝到内核地址空间
数据从内核地址空间拷贝到用户地址空间，read函数返回
send函数从用户态切换到内核态，将数据从用户地址空间拷贝到内核地址空间
数据从内核地址空间拷贝到协议引擎，send函数返回
使用内核对数据缓存相比于用户直接读取数据好像是低效的，在某些情况下内核态的数据缓存确实会提高效率，但是当数据大小超过内核缓存的大小时，这个操作是低效的。

其实对于这种场景下，数据没有必要从内核态拷贝到用户态，可以直接从read buffer拷贝到socket buffer，transferTo()函数就是实现这样的操作，但是transferTo函数需要操作系统的支持，在linux下sendfile实现了这样的操作，刚才的实现可以改成下面的：

transferTo(position, count, writableChannel);

这样数据就不需要从内核空间拷贝到用户空间了

Paste_Image.png

如果内核支持gather operations的话还可以进一步优化，在用户实现层面没有发生变化，优化都是在内核实现中的，首先数据从disk拷贝到内核buffer，然后并不需要把数据再次拷贝到socket buffer，只需要把数据位置和长度告诉socket buffer即可，优化之后的数据流如下：

Paste_Image.png

Paste_Image.png