视频图像处理中的错帧同步是怎么实现的？

2020-04-22 本文已影响0人字节流动

该原创文章首发于微信公众号：字节流动

为什么会用到错帧同步？

一般 Android 系统相机的最高帧率在 30 FPS 左右，当帧率低于 20 FPS 时，用户可以明显感觉到相机画面卡顿和延迟。

我们在做相机预览和视频流处理时，对每帧图像处理时间过长（超过 30 ms）就很容易造成画面卡顿，这个场景就需要用到错帧同步方法去提升画面的流畅度。

错帧同步，简单来说就是把当前的几帧缓冲到子线程中处理，主线程直接返回子线程之前的处理结果，属于典型的以空间换时间策略。

错帧同步策略也有不足之处，它不能在子线程中缓冲太多的帧，否则造成画面延迟。另外，每个子线程分配的任务也要均衡（即每帧在子线程中的处理时间大致相同），不然会因为 CPU 线程调度的时间消耗适得其反。

错帧同步的原理

错帧同步的原理如上图所示，我们开启三个线程：一个主线程，两个工作线程，每一帧图像的处理任务分为 2 步，第一个工作线程完成第一步处理，第二个工作线程完成第二步处理，每一帧都要经过这两步的处理。

当主线程输入第 n + 1 帧到第一个工作线程后，主线程会等待第二个工作线程中第 n 帧的处理结果然后返回，这种情况下你肯定会问第 0 帧怎么办？第 0 帧就直接返回就行了。

这些步骤下来，可以看成第 n+1 帧和第 n 帧在 2 个工作线程中同时处理，若忽略 CPU 线程调度时间，2 线程错帧可以提升一倍的性能（性能提升情况，下面会给出实测数据）。

错帧同步的简单实现

错帧同步在实现上类似于“生产者-消费者”模式，我们借助于 C 语言信号量 #include <semaphore.h> 可以很方便的实现错帧同步模型。

C 的信号量常用的几个 API ：

--------------------------------------------------------------------
int sem_init(sem_t *sem, int pshared, unsigned int value);
    功能：初始化信号量
    参数：
        sem：指定要初始化的信号量
        pshared：0：应用于多线程
                非 0：多进程
        value：指定了信号量的初始值
    返回值：0 成功
          -1 失败

----------------------------------------------------------------------
int sem_destroy(sem_t *sem);
    功能：销毁信号量
    参数：sem：指定要销毁的信号量
    返回值：0 成功
          -1 错误 

----------------------------------------------------------------------
int sem_post(sem_t *sem);

    功能：信号量的值加 1 操作
    参数：
        sem：指定的信号量，就是这个信号量加 1 
    返回值：0 成功
          -1 错误 

-----------------------------------------------------------------------

int sem_wait(sem_t *sem);
    功能：信号量的值减 1 , 如果信号量的值为 0 , 阻塞等待
    参数：
        sem：指定的信号量, 如果信号量的值为 0, 阻塞等待, 否则信号量的值减 1
    返回值：0 成功
          -1 错误

在这里为了简化代码逻辑，我们用字符串来表示视频帧，每个工作线程对输入的字符串进行标记，表示工作线程对视频帧做了处理，最后的输出（第 0 帧除外）都是经过工作线程标记过的字符串。

//初始化
void AsyncFramework::Init() {
    LOGCATE("AsyncFramework::Init");
    memset(work_buffers, 0, sizeof(work_buffers));
    work_thread_running = true;
    main_thread_running = true;

    index = 0;

    // 初始化 3 个信号量
    sem_init(&main_sem, 0, 0);
    sem_init(&first_thread_sem, 0, 0);
    sem_init(&second_thread_sem, 0, 0);

    // WORK_THREAD_NUM = 2 ，为 2 个工作线程申请 2 块 buffer
    for (int i = 0; i < WORK_THREAD_NUM; ++i) {
        work_buffers[i] = static_cast<char *>(malloc(WORK_BUFFER_SIZE));
    }

    // 启动三个线程
    main_thread = new thread(MainThreadProcess);
    first_thread = new thread(FirstStepProcess);
    second_thread = new thread(SecondStepProcess);

}

// 反初始化
void AsyncFramework::UnInit() {
    LOGCATE("AsyncFramework::UnInit");
    //等待三个线程结束
    main_thread_running = false;
    main_thread->join();
    delete main_thread;
    main_thread = nullptr;

    work_thread_running = false;
    sem_post(&first_thread_sem);
    sem_post(&second_thread_sem);
    first_thread->join();
    second_thread->join();

    delete first_thread;
    first_thread = nullptr;
    delete second_thread;
    second_thread = nullptr;

    //销毁信号量
    sem_destroy(&main_sem);
    sem_destroy(&first_thread_sem);
    sem_destroy(&second_thread_sem);

    //释放缓冲区
    for (int i = 0; i < WORK_THREAD_NUM; ++i) {
        if (work_buffers[i]) {
            free(work_buffers[i]);
            work_buffers[i] = nullptr;
        }
    }

}

主线程的逻辑就是不断地生成“视频帧”，将“视频帧”传给第一个工作线程进行第一步处理，然后等待第二个工作线程的处理结果。

void AsyncFramework::MainThreadProcess() {
    LOGCATE("AsyncFramework::MainThreadProcess start");
    while (main_thread_running) {
        memset(work_buffers[index % WORK_THREAD_NUM], 0, WORK_BUFFER_SIZE);
        sprintf(work_buffers[index % WORK_THREAD_NUM], "FrameIndex=%d ", index);
        //通知第一个工作线程处理
        sem_post(&first_thread_sem);
        if (index == 0) {
            //第 0 帧直接返回，不交给工作线程处理
            LOGCATE("AsyncFramework::MainThreadProcess %s", work_buffers[index % WORK_THREAD_NUM]);
            index++;
            continue;
        } else {
            //等待第二个工作线程的处理结果 
            sem_wait(&main_sem);
        }
        LOGCATE("AsyncFramework::MainThreadProcess %s", work_buffers[(index - 1) % WORK_THREAD_NUM]);
        index++;
        if (index == 100) break;//生成100帧
    }
    LOGCATE("AsyncFramework::MainThreadProcess end");

}

2个工作线程的处理逻辑类似，第一个工作线程收到主线程发来的信号，然后进行第一步处理，处理完成后通知第二个工作线程进行第二步处理，等到第二步处理完成后再通知主线程结束等待，取出处理结果。

void AsyncFramework::FirstStepProcess() {
    LOGCATE("AsyncFramework::FirstStepProcess start");
    int index = 0;
    while (true) {
        //等待主线程发来的信号
        sem_wait(&first_thread_sem);
        if(!work_thread_running) break;
        LOGCATE("AsyncFramework::FirstStepProcess index=%d", index);
        strcat(work_buffers[index % WORK_THREAD_NUM], "FirstStep ");
        //休眠模拟处理耗时
        this_thread::sleep_for(chrono::milliseconds(200));
        //处理完成后通知第二个工作线程进行第二步处理
        sem_post(&second_thread_sem);
        index++;
    }
    LOGCATE("AsyncFramework::FirstStepProcess end");

}

void AsyncFramework::SecondStepProcess() {
    LOGCATE("AsyncFramework::SecondStepProcess start");
    int index = 0;
    while (true) {
        //等待第一个工作线程发来的信号
        sem_wait(&second_thread_sem);
        if(!work_thread_running) break;
        LOGCATE("AsyncFramework::SecondStepProces index=%d", index);
        strcat(work_buffers[index % WORK_THREAD_NUM], "SecondStep");
        //休眠模拟处理耗时
        this_thread::sleep_for(chrono::milliseconds(200));
        //第二步处理完成后通知主线程结束等待
        sem_post(&main_sem);
        index++;
    }
    LOGCATE("AsyncFramework::SecondStepProcess end");
}

主线程打印的处理结果（第 0 帧直接返回，没被处理）：

主线程打印的处理结果

我们设定视频帧的 2 步处理一共耗时 400 ms (各休眠 200 ms)，由于采用错帧同步方式，主线程耗时只有 200 ms 左右，性能提升一倍。

main_thread_cost_time

联系与交流

技术交流可以添加我的微信：Byte-Flow

视频图像处理中的错帧同步是怎么实现的？

为什么会用到错帧同步？

错帧同步的简单实现

联系与交流

猜你喜欢

热点阅读