k8s环境下应用句柄数过大的原因定位
背景
运维发现部署在k8s环境上的应用A比在环境E中的句柄数要多十倍. 让我协助排查下.
排查过程
初步分析
通过lsof 命令看了下进程打开的文件句柄,发现其中pipe出现了很多次,大概1300次, 而相对应的stable环境中的应用A打开的pipe为130次
问题:
为什么会有这么多pipe,是谁创建的,为什么要创建?
我并不是很熟悉java中涉及pipe的场景,所以根本就不知道谁会创建pipe,只能先找到所有会使用pipe的地方,然后在进一步分析.
如何找到所有使用pipe的地方?
想想貌似只能拦截下pipe的调用,一旦发现有进程调pipe,就记录下调用栈,通过这样的方式应该就可以收集到部分pipe的使用场景了.
由于不知道是哪些java的api会调用pipe操作,在java层面进行拦截是不可能的了,只能在系统层进行尝试了.
鉴于pipe是一个system call, 可以考虑通过strace -e trace=pipe 进行跟踪。
不过由于strace仅仅是负责跟踪,在我们拿到相应进程号之后再去查看调用栈的时候可能已经太迟了。 所以该方法没啥用.
可能的思路
能够拦截特定调用,在拦截到后又能够执行特定action的工具,听说过的有以下几种:
-
dtrace
不熟悉,看了下文档用起来很麻烦的样子
-
使用linux LD_PRELOAD机制增强pipe调用.
只是个思路,或许可行
-
gdb
相对熟悉一些,决定用这个.
gdb的排查步骤
-
使用gdb启动应用
gdb --args java /var/www/xxx/target/XXXX.jar
-
拦截pipe的断点
(gdb) catch syscall pipe
-
忽略SIGSEGV信号
(gdb) handle SIGSEGV nostop noprint pass
为什么要做这个?看这个 : https://neugens.wordpress.com/2015/02/26/debugging-the-jdk-with-gdb/
-
执行程序
(gdb) run 当java程序调用pipe时,程序就会暂停下来,等待用户指令.
-
等待捕获pipe调用事件
-
捕获pipe调用事件
Catchpoint 1 (returned from syscall 'pipe'), 0x00007fd22237ff07 in pipe () at ../sysdeps/unix/syscall-template.S:82 82 T_PSEUDO (SYSCALL_SYMBOL, SYSCALL_NAME, SYSCALL_NARGS)
-
执行info thread 查看下当前的线程如下:
3 Thread 0x7fd2203b7700 (LWP 1630) pthread_cond_wait@@GLIBC_2.3.2 () at ../nptl/sysdeps/unix/sysv/linux/x86_64/pthread_cond_wait.S:183 * 2 Thread 0x7fd222e81700 (LWP 1605) 0x00007fd22237ff07 in pipe () at ../sysdeps/unix/syscall-template.S:82 1 Thread 0x7fd222e83700 (LWP 1522) 0x00007fd222a5a2fd in pthread_join (threadid=140540505495296, thread_return=0x7ffeaef13e00) at pthread_join.c:89
可以看到线程2是活的。记住1605这个线程号.
-
执行gcore dump下当前的内存镜像
(gdb) gcore Saved corefile core.1522
为啥要gcore ,因为在默认的gdb环境下,看不到java的调用栈. 不过有人做了脚本支持在gdb下支持查看java的调用栈,详见http://mail.openjdk.java.net/pipermail/jdk9-dev/2016-May/004379.html
-
使用 jstack java core.1522 解析core文件中的调用栈.
Thread 1605: (state = IN_NATIVE) - sun.nio.ch.IOUtil.makePipe(boolean) @bci=0 (Interpreted frame) - sun.nio.ch.EPollSelectorImpl.<init>(java.nio.channels.spi.SelectorProvider) @bci=27, line=65 (Interpreted frame) - sun.nio.ch.EPollSelectorProvider.openSelector() @bci=5, line=36 (Interpreted frame) - io.netty.channel.nio.NioEventLoop.openSelector() @bci=4, line=174 (Interpreted frame) - io.netty.channel.nio.NioEventLoop.<init>(io.netty.channel.nio.NioEventLoopGroup, java.util.concurrent.ThreadFactory, java.nio.channels.spi.SelectorProvider, io.netty.channel.SelectStrategy, io.netty.util.concurrent.RejectedExecutionHandler) @bci=88, line=150 (Interpreted frame) - io.netty.channel.nio.NioEventLoopGroup.newChild(java.util.concurrent.ThreadFactory, java.lang.Object[]) @bci=29, line=103 (Interpreted frame) - io.netty.util.concurrent.MultithreadEventExecutorGroup.<init>(int, java.util.concurrent.ThreadFactory, java.lang.Object[]) @bci=146, line=64 (Interpreted frame) - io.netty.channel.MultithreadEventLoopGroup.<init>(int, java.util.concurrent.ThreadFactory, java.lang.Object[]) @bci=14, line=50 (Interpreted frame) - io.netty.channel.nio.NioEventLoopGroup.<init>(int, java.util.concurrent.ThreadFactory, java.nio.channels.spi.SelectorProvider, io.netty.channel.SelectStrategyFactory) @bci=22, line=70 (Interpreted frame) - io.netty.channel.nio.NioEventLoopGroup.<init>(int, java.util.concurrent.ThreadFactory, java.nio.channels.spi.SelectorProvider) @bci=7, line=65 (Interpreted frame) - io.netty.channel.nio.NioEventLoopGroup.<init>(int, java.util.concurrent.ThreadFactory) @bci=6, line=56 (Interpreted frame) - org.asynchttpclient.netty.channel.ChannelManager.<init>(org.asynchttpclient.AsyncHttpClientConfig, io.netty.util.Timer) @bci=394, line=173 (Interpreted frame) - org.asynchttpclient.DefaultAsyncHttpClient.<init>(org.asynchttpclient.AsyncHttpClientConfig) @bci=73, line=85 (Interpreted frame) ...
可以看到1605线程的调用栈如上. (此时看到了java层面调用pipe的地方,也许是java中唯一与pipe发生交互的地方,也许不是,继续采集几个样本看看...).
-
执行cont,不一会又会捕捉到pipe调用事件, 重复8,9 步几次.
观察到几乎所有的pipe操作都是sun.nio.ch.IOUtil.makePipe 触发的,而上游都由Netty的NioEventLoopGroup触发.
NioEventLoopGroup代码分析
翻了下NioEventLoopGroup的代码,有如下一段:
MultithreadEventLoopGroup.java
protected MultithreadEventExecutorGroup(int nThreads, ThreadFactory threadFactory, Object... args) {
...
for (int i = 0; i < nThreads; i ++) {
boolean success = false;
try {
children[i] = newChild(threadFactory, args);// 这里每次调用创建一个pipe。 如果循环很大的话,是可能创建很多pipe的.
success = true;
}
}
...
}
查看下nThreads的赋值逻辑如下:
如果调用方有指定,则使用指定值,否则为cpu数*2. 代码如下
MultithreadEventLoopGroup.java
static {
DEFAULT_EVENT_LOOP_THREADS = Math.max(1, SystemPropertyUtil.getInt(
"io.netty.eventLoopThreads", NettyRuntime.availableProcessors() * 2));
if (logger.isDebugEnabled()) {
logger.debug("-Dio.netty.eventLoopThreads: {}", DEFAULT_EVENT_LOOP_THREADS);
}
}
结论
从代码的分析结果来看,怀疑是k8s环境中cpu核数过多导致。
查看k8s环境中应用所在容器的cpu数,为20是环境E中cpu数的10倍。
至此, k8s环境中句柄数过大的原因算是清楚啦.
遗留问题
- 为什么用epoll的时候会触发pipe的创建?
Java 中的Selector 同时定义了select和wakeup两个方法.
当线程阻塞在select()方法时,可以通过wakeup方法进行唤醒.
在Linux下, 系统底层是没有提供任何唤醒机制的. java在实现时使用了一个技巧,即创建一个管道,将管道的读事件注册到epoll中, wakeup方法中向管道写入一字节的数据来触发epoll的返回.
相关代码:
EPollSelectorImpl.java
参考资料
https://openresty.org/posts/dynamic-tracing/](https://openresty.org/posts/dynamic-tracing
https://www-zeuthen.desy.de/unix/unixguide/infohtml/gdb/Set-Catchpoints.html#Set-Catchpoints