第一届POLARDB数据库性能大赛初赛总结

2018-11-20 本文已影响287人张张张大炮

之前六月份的时候有参加过阿里举办的第四届中间件性能大赛，学到了不少东西，所以之后经常会关注一下天池那边阿里举办的程序设计大赛，九月底的时候注意到了这一届的POLARDB数据库性能大赛，很早就报了名。预热赛10月25日开始了~，初赛11月5日正式开始，11月19日结束，我这篇文章发布的时候初赛就已经结束了。因为11月之前一直在找实习，所以一直没有做什么准备，11月10号左右开始编写第一版的代码，到11月18号晚上放弃继续尝试。最后初赛成绩是42名，时间是240.69秒，和大佬们比起来还是有很大差距的。写这篇博客，主要还是想分享一下这段时间参赛的思路，和一点一点慢慢提升的经历。
GitHub: https://github.com/AlexZFX/engine 当前只️更新了初赛代码，复赛结束后会继续更新。

题目介绍

PolarDB作为软硬件结合的代表, 充分使用新硬件, 榨干硬件的红利来为用户获取极致的数据性能, 其中在PolarDB 的设计中, 我们使用 Optane SSD作为所有热数据的写入缓冲区, 通过kernel bypass的方式, 实现了极致的性能。所以本次比赛就以Optane SSD盘为背景，参赛者在其基础之上探索实现一种高效的kv存储引擎

以上是阿里云官方给的比赛背景，具体的题目内容如下
初赛赛题(完整请点击查看)：实现一个简化、高效的kv存储引擎，支持Write、Read接口。

程序评测逻辑评测程序分为2个阶段：
1）Recover正确性评测此阶段评测程序会并发写入特定数据（key 8B、value
4KB）同时进行任意次kill
-9来模拟进程意外退出（参赛引擎需要保证进程意外退出时数据持久化不丢失），接着重新打开DB，调用Read接口来进行正确性校验

2）性能评测

随机写入：64个线程并发随机写入，每个线程使用Write各写100万次随机数据（key 8B、value 4KB）

随机读取：64个线程并发随机读取，每个线程各使用Read读取100万次随机数据注：2.2阶段会对所有读取的kv校验是否匹配，如不通过则终止，评测失败

总体说来我们能得到的要求和信息为以下几点：

实现一个KV型数据库的核心逻辑，主要为open、read、write三个接口。
支持多线程并发读写。
保证在方法成功返回的情况下数据不丢失（kill保证不丢失的前提是已经正确返回了，如果没有的话是不算做丢失的）。
key和value的长度是确定的 key为8B，value为4KB。
可以使用Java语言或者C++，Java内存限制3G，C++限制2G。
磁盘占用不超过 320G

编写过程

完整的参赛过程大概是一周时间，这一周进行了非常多的尝试，成绩也从第一次跑通时的900多s到最后稳定在240s，接下来会细细的说一说每一版的思路和进阶过程。（下面的标题写的key value分别表示采用的文件数）

大体思路

先做一些简单的计算，
key + offset = ( 8 + 8 ) * 64000000 / 1024 / 1024 = 977M
value = 4096 * 64000000 / 1024 / 1024 / 1024 = 245G
可见磁盘和内存的限制相对来说不会造成很大的影响，对合理的设计来说还是充足的。

因为key是一个8B的byte数组，故转化成一个long型的数字很简单并且非常有利于接下来计算的事情。所以下文讨论的key都是建立在long型的基础上的。
初始主体的思路是这样的

用HashMap在内存中维护所有的key-offset对，数据库open时完成文件中的key和offset的加载工作，read时只需要找到对应key的offset，然后在相应value文件中进行读取即可。这里的hashmap选取是一个很重要的事情，因为Java自带的hashmap是对对象的存储，故一个Long型的KV对要占用约40B的内存，这样的话3G的内存会爆掉，最后选择的是HPPC开源的基础类型的HashMap，选择的原因主要参考了群里大佬的文章《应用JMH测试大型HashMap的性能》，他也写了一些关于本次比赛的总结与分析，推荐大家关注并学习，我和大佬的差距还是很大的。
因为value共有250G左右的内容，必然要进行分片，初始打算是对key进行hash，然后将key的hash结果相同的value存储在同一个文件中，key和该value对应的offset存在同一个文件中。
所有的key和value不论是否重复，都直接在文件尾利用追加写，这样在加载的时候，后面出现的key必然会覆盖掉出现过的key，可以不用考虑key的重复问题。
因为要考虑到在进程被kill的时候能保证数据不丢失，故不能对key或者value进行缓存或者异步写入，否则可能会导致校验阶段的失败，则write接口被调用的时候都会直接对数据进行落盘操作。

第一版 FileChannel读写 1 key + 128 value 381.79s

首先想的是要跑出成绩，把所有的key都写在了一个文件里，一开始忽略了一个小点，把key和offset分开写入了文件，导致出现了一些key和value不匹配的问题。很显然的问题是写key和写offset会出现线程问题，可能导致本来应该是KeyValueKeyValue形式的数据，被写成KeyKeyValueValue的形式，所以出错之后直接加了个synchronized关键字，得出第一次的成绩968s，很快修改了这个简单的小问题，得到一个明显有大幅提升的成绩381.79s，这时的代码主要是这样的。

    @Override
    public void open(String path) throws EngineException {
        File file = new File(path);
        // 创建目录
        if (!file.exists()) {
            if (!file.mkdir()) {
                throw new EngineException(RetCodeEnum.IO_ERROR, "创建文件目录失败：" + path);
            } else {
                logger.info("创建文件目录成功：" + path);
            }
        }

        //创建 FILE_COUNT个FileChannel 顺序写入
        RandomAccessFile randomAccessFile;
        if (file.isDirectory()) {
            for (int i = 0; i < FILE_COUNT; i++) {
                try {
                    randomAccessFile = new RandomAccessFile(path + File.separator + i + ".data", "rw");

                    FileChannel channel = randomAccessFile.getChannel();
                    fileChannels[i] = channel;
                    // 从 length处直接写入
                    offsets[i] = new AtomicLong(randomAccessFile.length());
                } catch (IOException e) {
                    e.printStackTrace();
                }
            }
        } else {
            throw new EngineException(RetCodeEnum.IO_ERROR, "path不是一个目录");
        }
        File keyFile = new File(path + File.separator + "key");
        if (!keyFile.exists()) {
            try {
                keyFile.createNewFile();
            } catch (IOException e) {
                e.printStackTrace();
            }
        }
        // 从 index 文件建立 hashmap
        try {
            randomAccessFile = new RandomAccessFile(keyFile, "rw");
            keyFileChannel = randomAccessFile.getChannel();

            ByteBuffer keyBuffer = ByteBuffer.allocate(KEY_LEN);
            ByteBuffer offBuffer = ByteBuffer.allocate(KEY_LEN);
            keyFileOffset = new AtomicLong(randomAccessFile.length());
            long temp = 0, maxOff = keyFileOffset.get();
            while (temp < maxOff) {
                keyBuffer.position(0);
                keyFileChannel.read(keyBuffer, temp);
                temp += KEY_LEN;
                offBuffer.position(0);
                keyFileChannel.read(offBuffer, temp);
                temp += KEY_LEN;
                keyBuffer.position(0);
                offBuffer.position(0);
                keyMap.put(keyBuffer.getLong(), offBuffer.getLong());
            }
        } catch (IOException e) {
            e.printStackTrace();
        }
    }

    @Override
    public void write(byte[] key, byte[] value) throws EngineException {
        long numkey = Util.bytes2long(key);
        int hash = hash(numkey);
        long off = offsets[hash].getAndAdd(VALUE_LEN);
        keyMap.put(numkey, off + 1);
        try {
            //key和offset写入文件
            localKey.get().putLong(0, numkey).putLong(8, off + 1);
            localKey.get().position(0);
            keyFileChannel.write(localKey.get(), keyFileOffset.getAndAdd(KEY_AND_OFF_LEN));
            //将value写入buffer
            localBufferValue.get().position(0);
            localBufferValue.get().put(value, 0, VALUE_LEN);
            //buffer写入文件
            localBufferValue.get().position(0);
            fileChannels[hash].write(localBufferValue.get(), off);
        } catch (IOException e) {
            throw new EngineException(RetCodeEnum.IO_ERROR, "写入数据出错");
        }
    }


    @Override
    public byte[] read(byte[] key) throws EngineException {
        long numkey = Util.bytes2long(key);
        int hash = hash(numkey);
        // key 不存在会返回0，避免跟位置0混淆，off写加一，读减一
        long off = keyMap.get(numkey);
        if (off == 0) {
            throw new EngineException(RetCodeEnum.NOT_FOUND, numkey + "不存在");
        }
        try {
            localBufferValue.get().position(0);
            fileChannels[hash].read(localBufferValue.get(), off - 1);
        } catch (IOException e) {
            throw new EngineException(RetCodeEnum.IO_ERROR, "读取数据出错");
        }
        localBufferValue.get().position(0);
        localBufferValue.get().get(localByteValue.get(), 0, VALUE_LEN);
        return localByteValue.get();
    }

这里的localKey 和 localBufferValue 都是 ThreadLocal 的 DirectByteBuffer（关于HeapByteBuffer和Direct的的一些差别后面会提到一些），用于作为 FileChannel（FileChannel参数都是在open的时候进行的初始化）写入的参数，避免了每次写入都要allocate一块新内存的消耗。
这里的Hash采用的方法是与 0x7F 进行求 & ，得到的结果划分为128个value文件（这种hash的很简单且高效，带来的隐患是在key的分布不均匀情况下可能导致某个文件非常大之类的现象，在后面也会提及）。

这个时候open的时间将近90s，很显然是一个超出可承受范围的结果。所以接下来很快对这一部分进行了优化。

第二版 FileChannel 64线程open 64 key 128 value 260.96s

open时间过长，所以这成了我们关注的一个重点，这段时间我们做了很多改动，改动的过程主要是这样的。

单key文件，单个map，将完整的offset分为64份读取无成绩
这一做法其实还没跑出成绩就被我们过渡掉了，因为本地进行的测试一直过不去，我们第一时间想到的原因是因为，单个key文件并发初始化的时候，后面出现的相等的key不一定会把前面的key覆盖掉，所以会出现值不对的状况。所以解决方案只能是所有相同的key必须要严格有序的读取。
64个key文件，单个map 301.49s
因为上面所述的原因，所以选择对key也进行一次hash，按照hash的结果将key划分在了64个不同的key文件中，这样的结果是相同的key一定会在相同文件中按照先后顺序被写入，故读取的时候一定是严格有序的。
这个版本本地的小量测试也通过了，以为没有问题，但线上失败，这时我们才开始关注hppc的map本身的线程安全性，给map的put加锁后提交，果然通过了，得分301.49s。
简单看了一下源码，显然是线程不安全的，所以促使我们接下来的一次分map改动。
64个key文件，64个map 260.96s
于是我们进行了一次map的拆分，根据key的文件个数直接拆为了64个hashmap，差别是这样拆分让我们的map容量无法确定，简单线上用log测试了一下之后完成了64map的版本。并发问题解决好之后，这一版本的分数又有了不少提升，260.96s。这时候的open已经被压到了10s以内，但其实还是有提升的空间。

这版的主要改动在open地方，下面贴出了这版的open方法。

    @Override
    public void open(String path) throws EngineException {
        File file = new File(path);
        // 创建目录
        if (!file.exists()) {
            if (!file.mkdir()) {
                throw new EngineException(RetCodeEnum.IO_ERROR, "创建文件目录失败：" + path);
            } else {
                logger.info("创建文件目录成功：" + path);
            }
        }
        RandomAccessFile randomAccessFile;
        // file是一个目录时进行接下来的操作
        if (file.isDirectory()) {
            try {
                //先构建keyFileChannel 和 初始化 map
                for (int i = 0; i < THREAD_NUM; i++) {
                    randomAccessFile = new RandomAccessFile(path + File.separator + i + ".key", "rw");
                    FileChannel channel = randomAccessFile.getChannel();
                    keyFileChannels[i] = channel;
                    keyOffsets[i] = new AtomicInteger((int) randomAccessFile.length());
                }
                ExecutorService executor = Executors.newFixedThreadPool(THREAD_NUM);
                CountDownLatch countDownLatch = new CountDownLatch(THREAD_NUM);
                for (int i = 0; i < THREAD_NUM; i++) {
                    if (!(keyOffsets[i].get() == 0)) {
                        final long off = keyOffsets[i].get();
                        final int finalI = i;
                        executor.execute(() -> {
                            int start = 0;
                            long key;
                            int keyHash;
                            while (start < off) {
                                try {
                                    localKey.get().position(0);
                                    keyFileChannels[finalI].read(localKey.get(), start);
                                    start += KEY_AND_OFF_LEN;
                                    localKey.get().position(0);
                                    key = localKey.get().getLong();
                                    keyHash = keyFileHash(key);
                                    keyMap[keyHash].put(key, localKey.get().getInt());
                                } catch (IOException e) {
                                    e.printStackTrace();
                                }
                            }
                            countDownLatch.countDown();
                        });
                    } else {
                        countDownLatch.countDown();
                    }
                }
                countDownLatch.await();
                executor.shutdownNow();
            } catch (IOException | InterruptedException e) {
                e.printStackTrace();
            }
            //创建 FILE_COUNT个FileChannel 供write顺序写入
            for (int i = 0; i < FILE_COUNT; i++) {
                try {
                    randomAccessFile = new RandomAccessFile(path + File.separator + i + ".data", "rw");
                    FileChannel channel = randomAccessFile.getChannel();
                    fileChannels[i] = channel;
                    // 从 length处直接写入
                    valueOffsets[i] = new AtomicInteger((int) (randomAccessFile.length() >>> SHIFT_NUM));
                } catch (IOException e) {
                    e.printStackTrace();
                }
            }
        } else {
            throw new EngineException(RetCodeEnum.IO_ERROR, "path不是一个目录");
        }
    }

这一部分里我们还做了一些小事

通过在close方法中添加log，统计了一些线上key和value的数量，发现key和value都非常均匀，每个key和value文件的大小都很相近（其实这里有个让我们后面踩到的小坑，偷偷的感受到了测评程序的一些阴险）。
将offset替换为了int型的数值，每次读取的时候进行一次12位的移位操作之后再从value文件中读取，这样的好处是节约了一些内存，可以用来做一些其他的事情。

第三版用mmap读open，64key 64value 245.18s

之前一直考虑着用mmap，在java里面对应的就是MappedByteBuffer，因为我不确定mmap能不能在kill -9 被杀进程的情况保证数据的完整性，同时，如果都用mmap写入的话，会让我无法确定文件的大小（mmap映射时要预先指定文件大小），无法在kill之后能从指定的位置追加写入。所以打算一步一步，最后再考虑使用这个。

但是open的时候使用mmap读一定是没有风险的，所以又进行了一次对open的改动，这时还是64个key文件和128个value文件，得到的跑分是248.58，open过程被压缩在了1s以内，大约600ms左右，这个open速度我们就基本已经满足了。

后来改成了64个value文件，每次只进行一次hash就可以确定key和value文件的位置，并且读写速度似乎都有略微进步，达到了245.18s。

这时的open代码如下

@Override
    public void open(String path) throws EngineException {
        File file = new File(path);
        // 创建目录
        if (!file.exists()) {
            if (!file.mkdir()) {
                throw new EngineException(RetCodeEnum.IO_ERROR, "创建文件目录失败：" + path);
            } else {
                logger.info("创建文件目录成功：" + path);
            }
        }
        RandomAccessFile randomAccessFile;
        // file是一个目录时进行接下来的操作
        if (file.isDirectory()) {
            try {
                //先构建keyFileChannel 和 初始化 map
                for (int i = 0; i < THREAD_NUM; i++) {
                    randomAccessFile = new RandomAccessFile(path + File.separator + i + ".key", "rw");
                    FileChannel channel = randomAccessFile.getChannel();
                    keyFileChannels[i] = channel;
                    keyOffsets[i] = new AtomicInteger((int) randomAccessFile.length());
                }
                ExecutorService executor = Executors.newFixedThreadPool(THREAD_NUM);
                CountDownLatch countDownLatch = new CountDownLatch(THREAD_NUM);
                for (int i = 0; i < THREAD_NUM; i++) {
                    if (!(keyOffsets[i].get() == 0)) {
                        final long off = keyOffsets[i].get();
                        final int finalI = i;
                        executor.execute(() -> {
                            int start = 0;
                            try {
                                MappedByteBuffer mappedByteBuffer = keyFileChannels[finalI].map(FileChannel.MapMode.READ_ONLY, 0, off);
                                while (start < off) {
                                    start += KEY_AND_OFF_LEN;
                                    keyMap[finalI].put(mappedByteBuffer.getLong(), mappedByteBuffer.getInt());
                                }
                                unmap(mappedByteBuffer);
                                countDownLatch.countDown();
                            } catch (IOException e) {
                                e.printStackTrace();
                            }
                        });
                    } else {
                        countDownLatch.countDown();
                    }
                }
                countDownLatch.await();
                executor.shutdownNow();
            } catch (IOException | InterruptedException e) {
                e.printStackTrace();
            }
            //创建 FILE_COUNT个FileChannel 供write顺序写入
            for (int i = 0; i < FILE_COUNT; i++) {
                try {
                    randomAccessFile = new RandomAccessFile(path + File.separator + i + ".data", "rw");
                    FileChannel channel = randomAccessFile.getChannel();
                    fileChannels[i] = channel;
                    // 从 length处直接写入
                    valueOffsets[i] = new AtomicInteger((int) (randomAccessFile.length() >>> SHIFT_NUM));
                } catch (IOException e) {
                    e.printStackTrace();
                }
            }
        } else {
            throw new EngineException(RetCodeEnum.IO_ERROR, "path不是一个目录");
        }
    }

这一版当中我们也发现了一些问题，阅读了许多文章，总结主要如下：

在open过程中遇到过一次OOM，但是按照我的JVM参数和预计是不会出现这一现象，同时在这期间我有测试过使用mmap读256个文件的value，但是却出现了MappedByteBuffer爆掉的情况（Java的MappedByteBuffer有限制一次映射不能超过2G内存）。通过线上的log测试，发现测评时最开始的一部分是写入了大量的hash值相同的key，value也超过了2G的大小。但这一部分的测评其实没有体现在官方的log中，这个发现也为最后的改动提供了一点帮助。
阅读了千里码赛码会的总结分享，学到了一些mmap的内容，知道了在程序异常退出的时候，哪怕mmap的内存数据并没有落盘，kernel也会在你的进程被kill之后，回写到磁盘。这里就已经是内核态的操作了，只要服务器不真正的断电，数据的安全性是有保证的，这还是非常有帮助的。

第四版 mmap读写key，FileChannel读写value，64 + 64 240.69s

有第三版最后发现的内容，我们打算再对key的写入做一些改动，也就是将fileChannel写入key的方式改动为mmap写入。而mmap映射的文件大小选择一个稍大的值，open之后的写入offset通过value文件的大小来确定（valuelen / 4096 * 12），这一优化带来的大约2～3s的提升。

除此之外，还进行了简单的jvm调优工作，将新生代和老年代的比例进行了调整，将原来1:1的比例调整为了6:1，这部分优化带来了大约2s的性能提升。

最后完整的代码这一块我就直接贴在下面，对整个过程有兴趣的也可以去我的github上clone下来查看。

package com.alibabacloud.polar_race.engine.common;

import com.alibabacloud.polar_race.engine.common.exceptions.EngineException;
import com.alibabacloud.polar_race.engine.common.exceptions.RetCodeEnum;
import com.carrotsearch.hppc.LongIntHashMap;
import io.netty.util.concurrent.FastThreadLocal;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;

import java.io.File;
import java.io.IOException;
import java.io.RandomAccessFile;
import java.nio.ByteBuffer;
import java.nio.MappedByteBuffer;
import java.nio.channels.FileChannel;
import java.util.concurrent.CountDownLatch;
import java.util.concurrent.atomic.AtomicInteger;

public class EngineRace extends AbstractEngine {

    private static Logger logger = LoggerFactory.getLogger(EngineRace.class);
    // key+offset 长度 16B
    private static final int KEY_AND_OFF_LEN = 12;
    // 线程数量
    private static final int THREAD_NUM = 64;
    // value 长度 4K
    private static final int VALUE_LEN = 4096;
    //每个map存储的key数量
    private static final int PER_MAP_COUNT = 1024000;

    private static final int SHIFT_NUM = 12;
    //    存放 value 的文件数量 128
    private static final int FILE_COUNT = 64;

    private static final int HASH_VALUE = 0x3F;

    private static final LongIntHashMap[] keyMap = new LongIntHashMap[THREAD_NUM];

    static {
        for (int i = 0; i < THREAD_NUM; i++) {
            keyMap[i] = new LongIntHashMap(PER_MAP_COUNT, 0.98);
        }
    }

    //key 文件的fileChannel
    private static FileChannel[] keyFileChannels = new FileChannel[THREAD_NUM];

    private static AtomicInteger[] keyOffsets = new AtomicInteger[THREAD_NUM];

    private static MappedByteBuffer[] keyMappedByteBuffers = new MappedByteBuffer[THREAD_NUM];

    //value 文件的fileChannel
    private static FileChannel[] fileChannels = new FileChannel[FILE_COUNT];

    private static AtomicInteger[] valueOffsets = new AtomicInteger[FILE_COUNT];

    private static FastThreadLocal<ByteBuffer> localBufferValue = new FastThreadLocal<ByteBuffer>() {
        @Override
        protected ByteBuffer initialValue() throws Exception {
            return ByteBuffer.allocate(VALUE_LEN);
        }
    };

    @Override
    public void open(String path) throws EngineException {
        File file = new File(path);
        // 创建目录
        if (!file.exists()) {
            if (!file.mkdir()) {
                throw new EngineException(RetCodeEnum.IO_ERROR, "创建文件目录失败：" + path);
            } else {
                logger.info("创建文件目录成功：" + path);
            }
        }
        RandomAccessFile randomAccessFile;
        // file是一个目录时进行接下来的操作
        if (file.isDirectory()) {
            try {
                //先 创建 FILE_COUNT个FileChannel 供write顺序写入，并由此文件获取value文件的大小
                for (int i = 0; i < FILE_COUNT; i++) {
                    try {
                        randomAccessFile = new RandomAccessFile(path + File.separator + i + ".data", "rw");
                        FileChannel channel = randomAccessFile.getChannel();
                        fileChannels[i] = channel;
                        // 从 length处直接写入
                        valueOffsets[i] = new AtomicInteger((int) (randomAccessFile.length() >>> SHIFT_NUM));
                        keyOffsets[i] = new AtomicInteger(valueOffsets[i].get() * KEY_AND_OFF_LEN);
                    } catch (IOException e) {
                        e.printStackTrace();
                    }
                }
                //先构建keyFileChannel 和 初始化 map
                for (int i = 0; i < THREAD_NUM; i++) {
                    randomAccessFile = new RandomAccessFile(path + File.separator + i + ".key", "rw");
                    FileChannel channel = randomAccessFile.getChannel();
                    keyFileChannels[i] = channel;
                    keyMappedByteBuffers[i] = channel.map(FileChannel.MapMode.READ_WRITE, 0, PER_MAP_COUNT * 20);
                }
                CountDownLatch countDownLatch = new CountDownLatch(THREAD_NUM);
                for (int i = 0; i < THREAD_NUM; i++) {
                    if (!(keyOffsets[i].get() == 0)) {
                        final long off = keyOffsets[i].get();
                        final int finalI = i;
                        final MappedByteBuffer buffer = keyMappedByteBuffers[i];
                        new Thread(() -> {
                            int start = 0;
                            while (start < off) {
                                start += KEY_AND_OFF_LEN;
                                keyMap[finalI].put(buffer.getLong(), buffer.getInt());
                            }
                            countDownLatch.countDown();
                        }).start();
                    } else {
                        countDownLatch.countDown();
                    }
                }
                countDownLatch.await();
            } catch (IOException | InterruptedException e) {
                e.printStackTrace();
            }
        } else {
            throw new EngineException(RetCodeEnum.IO_ERROR, "path不是一个目录");
        }
    }

    @Override
    public void write(byte[] key, byte[] value) throws EngineException {
        long numkey = Util.bytes2long(key);
        int hash = valueFileHash(numkey);
        int off = valueOffsets[hash].getAndIncrement();
        try {
            ByteBuffer keyBuffer = keyMappedByteBuffers[hash].slice();
            keyBuffer.position(keyOffsets[hash].getAndAdd(KEY_AND_OFF_LEN));
            keyBuffer.putLong(numkey).putInt(off);
            //将value写入buffer
            ByteBuffer valueBuffer = localBufferValue.get();
            valueBuffer.clear();
            valueBuffer.put(value);
            valueBuffer.flip();
            fileChannels[hash].write(valueBuffer, ((long) off) << SHIFT_NUM);
        } catch (IOException e) {
            throw new EngineException(RetCodeEnum.IO_ERROR, "写入数据出错");
        }
    }


    @Override
    public byte[] read(byte[] key) throws EngineException {
        long numkey = Util.bytes2long(key);
        int hash = valueFileHash(numkey);
        long off = keyMap[hash].getOrDefault(numkey, -1);
        ByteBuffer buffer = localBufferValue.get();
        if (off == -1) {
            throw new EngineException(RetCodeEnum.NOT_FOUND, numkey + "不存在");
        }
        try {
            buffer.clear();
            fileChannels[hash].read(buffer, off << SHIFT_NUM);
        } catch (IOException e) {
            throw new EngineException(RetCodeEnum.IO_ERROR, "读取数据出错");
        }
        return buffer.array();
    }

    @Override
    public void range(byte[] lower, byte[] upper, AbstractVisitor visitor) throws EngineException {
    }

    @Override
    public void close() {
        for (int i = 0; i < FILE_COUNT; i++) {
            try {
                keyFileChannels[i].close();
                fileChannels[i].close();
            } catch (IOException e) {
                logger.error("close error");
            }
        }
    }

    private static int valueFileHash(long key) {
        return (int) (key & HASH_VALUE);
    }
}

这一版写的代码和之前有点不同如下：

这里value读写的时候用的ByteBuffer是HeapByteBuffer，本来用DirectByteBuffer是想着对外内存相对来说写入会更快，但实际上将byte[] value写入buffer的时候避免不了将其从堆内拷贝到堆外的过程。而查看了FileChannel的write方法源码时，发现其对文件的写入都是基于DirectByteBuffer进行的，其本身会维护一个堆外内存的缓存，测试之后发现两者的性能相差无几，所以也没有再关注这个
mmap写入key的时候调用了slice方法，目的是获取MappedByteBuffer的一个切片，因为其写入是非线程安全的，实质上内部是通过调用unsafe的putByte实现的。

总结

初赛刚写的时候有一点中间件性能大赛复赛类似的地方，不过相比来说还是多学会了许多知识。我其实也尝试了利用unsafe来实现内存拷贝的一部分，但是似乎并没有起到一个好的效果，感觉主要还是我的使用姿势有些不正确，我把这一部分的有关代码放在了github的unsafe分支中，有兴趣也可以简单查看一下。

正在进行的是复赛，相比初赛来说增加了一个全量顺序遍历的需求，难度更大，也更有意思了，感觉复赛更考的是一部分设计方面的东西了，接下来还是会使用Java继续参加，如果有所收获的话，还会再写一篇博客进行相应的总结。

第一届POLARDB数据库性能大赛初赛总结

题目介绍

编写过程

大体思路

第一版 FileChannel读写 1 key + 128 value 381.79s

第二版 FileChannel 64线程open 64 key 128 value 260.96s

第三版用mmap读open，64key 64value 245.18s

第四版 mmap读写key，FileChannel读写value，64 + 64 240.69s

总结

猜你喜欢

热点阅读

第一届POLARDB数据库性能大赛初赛总结

题目介绍

编写过程

大体思路

第一版 FileChannel读写 1 key + 128 value 381.79s

第二版 FileChannel 64线程open 64 key 128 value 260.96s

第三版 用mmap读open，64key 64value 245.18s

第四版 mmap读写key，FileChannel读写value，64 + 64 240.69s

总结

猜你喜欢

热点阅读

第三版用mmap读open，64key 64value 245.18s