Java CPU亲和性

2018-09-12  本文已影响0人  wangdy12

最近在项目中碰到整个进程的CPU占用率极低,分析了很久,才排查到是CPU亲和性相关的问题,因为在项目启动配置过程中,调用了一个FPGA的初始化操作的native函数,FPGA初始化的C代码中进行了绑核操作(将当前线程绑定到CPU某个核上),导致此后运行过程中Java主线程创建的所有子线程的都会被调度到了该核上运行,所以特意进行了CPU亲和性和进程线程创建方面的学习

CPU亲和性

CPU Affinity 可以将进程或线程绑定到一个CPU核或一组CPU核上,这样进程或线程只能在指定的CPU核上执行。可以看做是对操作系统中的调度算法的进行了修改。

意义:线程在一个CPU上运行后,CPU的缓存中可能保存了一些信息,调度该线程在同一CPU上执行减少了缓存未命中,提高了性能,例如用于进行图形渲染的程序

Linux中使用位掩码cpu_set_t表示亲和性,它一共有1024位,每一位都可以对应一个cpu核心,默认所有比特位全为1,表示可以在任何CPU上运行、迁移,例如0x00000003,表示在#0和#1核上运行

相关API:

#include <sched.h>

/* Set the CPU affinity for a task */
int sched_setaffinity (__pid_t __pid, size_t __cpusetsize, const cpu_set_t *__cpuset);

/* Get the CPU affinity for a task */
int sched_getaffinity (__pid_t __pid, size_t __cpusetsize, cpu_set_t *__cpuset);
#include <pthread.h>
/* Limit specified thread TH to run only on the processors represented
   in CPUSET.  */
int pthread_setaffinity_np (pthread_t __th, size_t __cpusetsize, const cpu_set_t *__cpuset);

/* Get bit set in CPUSET representing the processors TH can run on.  */
int pthread_getaffinity_np (pthread_t __th, size_t __cpusetsize, cpu_set_t *__cpuset)

查询设定亲和性的命令 taskset

// 查询进程的亲和
taskset -p pid
// 设定亲和
taskset -p mask pid
// -c:用列表方式指定要绑定的cpu
taskset -pc 0,3,7-11 700

此外还有一个库,可以让Java线程实现亲和性Java-Thread-Affinity,它的实现原理是通过JNA调用底层的C函数,设置亲和性

线程和进程

Java使用的是一对一的线程模型,JVM中线程创建的源码如下

// myjdk8u/hotspot/src/os/linux/vm/os_linux.cpp
bool os::create_thread(Thread* thread, ThreadType thr_type, size_t stack_size) {

...
  // init thread attributes
  pthread_attr_t attr;
  pthread_attr_init(&attr);
  pthread_attr_setdetachstate(&attr, PTHREAD_CREATE_DETACHED);
...
  {
...
    pthread_t tid;
    int ret = pthread_create(&tid, &attr, (void* (*)(void*)) java_start, thread);

    pthread_attr_destroy(&attr);
...
  }
...
}

进程控制块PCB在Linux中对应的是一个结构体task_struct,内核并没有线程的概念. 每一个线程在内核中都存在一个进程描述符task_struct对应, 所以线程也叫作轻量级进程Light Weighted Process,CPU亲和性在内核中的设定也存储在task_struct中,结构体中对应的字段定义为

cpumask_t  cpus_allowed;

在创建进程的时候,会复制当前进程的部分task_struct信息,所以导致CPU亲和性的继承,线程也是类似

所以解决方案就是要么取消底层的绑核操作,要么再新建一个线程,在新建线程中调用native函数,或者如果程序容易改动的话,先创建各种多线程,最后调用涉及绑核的native函数

上一篇下一篇

猜你喜欢

热点阅读