JNIJNI

JNI 技巧

2017-06-11  本文已影响189人  hanpfei

JNI 是指 Java 本地层接口(Java Native Interface)。它为用 Java 语言编写的受控代码定义了一种与本地层代码(用 C/C++ 编写)交互的方式。它是厂商无关的,其支持从动态共享库加载代码,尽管有时笨重,但它仍是有效的。

如果你对它还不熟悉,可以阅读 JNI规范(Java Native Interface Specification) 来获得对它的更多了解,了解 JNI 如何工作以及它有哪些功能。规范中有些地方的说明,并不是特别的清晰简洁明了,因而接下来的一些内容也许有点用。

JavaVM 和 JNIEnv

JNI 定义了两个关键的数据结构,JavaVMJNIEnv。它们都是指向函数表的指针。(在 C++ 版本中,它们是类,其中包含一个指向函数表的指针,及每个 JNI 函数对应一个的成员函数,这些成员函数则简单地调用函数表中的对应函数。) JavaVM 提供了“调用接口”函数,通过这些函数,可以创建和销毁一个 JavaVM。看一下 JavaVM 结构的定义就一目了然了:

#if defined(__cplusplus)
typedef _JavaVM JavaVM;
#else
typedef const struct JNIInvokeInterface* JavaVM;
#endif

/*
 * JNI invocation interface.
 */
struct JNIInvokeInterface {
    void*       reserved0;
    void*       reserved1;
    void*       reserved2;

    jint        (*DestroyJavaVM)(JavaVM*);
    jint        (*AttachCurrentThread)(JavaVM*, JNIEnv**, void*);
    jint        (*DetachCurrentThread)(JavaVM*);
    jint        (*GetEnv)(JavaVM*, void**, jint);
    jint        (*AttachCurrentThreadAsDaemon)(JavaVM*, JNIEnv**, void*);
};

/*
 * C++ version.
 */
struct _JavaVM {
    const struct JNIInvokeInterface* functions;

#if defined(__cplusplus)
    jint DestroyJavaVM()
    { return functions->DestroyJavaVM(this); }
    jint AttachCurrentThread(JNIEnv** p_env, void* thr_args)
    { return functions->AttachCurrentThread(this, p_env, thr_args); }
    jint DetachCurrentThread()
    { return functions->DetachCurrentThread(this); }
    jint GetEnv(void** env, jint version)
    { return functions->GetEnv(this, env, version); }
    jint AttachCurrentThreadAsDaemon(JNIEnv** p_env, void* thr_args)
    { return functions->AttachCurrentThreadAsDaemon(this, p_env, thr_args); }
#endif /*__cplusplus*/
};

理论上,每个进程可以有多个 JavaVM 实例,但 Android 只允许有一个。

JNIEnv 则提供了大多数的 JNI 函数。你的本地层函数都接受 JNIEnv 作为其第一个参数。

JNIEnv 用于线程局部存储。因此,你不能在线程之间共享同一个 JNIEnv。如果一段代码没有其它方法获取它的 JNIEnv,你应该共享 JavaVM,并使用 JavaVM 结构的 GetEnv 函数找到线程的 JNIEnv。(假设它有一个;参见下面的 AttachCurrentThread。)

JNIEnvJavaVM 的 C 声明与它们的 C++ 声明不同。依赖于是被 include 进 C 还是 C++ 源文件中,"jni.h" 头文件提供了不同的类型定义。因此,在两个语言都会包含的头文件中,包含 JNIEnv 参数并不是个好主意。(换句话说:如果你的头文件需要#ifdef __cplusplus,且该头文件中有任何内容引用了 JNIEnv,那么你可能需要做一些额外的工作。)

比如定义了一个函数,其接受一个 JNIEnv 指针作为参数。这个函数在 C 源文件和在 C++ 源文件中实现时,这个参数的类型实际上是不一样的。对这个函数的调用,也要区分是在 C 代码中调用还是在 C++ 代码中调用,并做不同的处理。

线程

所有线程都是 Linux 线程,由内核调度。它们通常由 Java 代码启动 (使用 Thread.start 方法 ),但它们也可以在其它地方创建,然后附到 JavaVM 上。比如,一个由 pthread_create 启动的线程,可以通过 JNI,即 JavaVM 实例的 AttachCurrentThreadAttachCurrentThreadAsDaemon 函数附到 JavaVM。在一个线程被附到 JavaVM 之前,它没有 JNIEnv,因而也 不能执行 JNI 调用

把一个本底层创建的线程附接到 JavaVM 会创建一个 java.lang.Thread 对象,并添加到“main” ThreadGroup,使它对于调试器可见。对一个已经附接到 JavaVM 的线程调用 AttachCurrentThread 是一个空操作。

通过把本地层创建的线程附接到 JavaVM 中之后,也就可以在该线程中方便地调用 JNI 函数,访问 Java 对象和结构了。

Android 不会挂起正在执行本地层代码的线程。如果正在进行垃圾回收,或者调试器发出了一个挂起请求,Android 将在线程下一次执行 JNI 调用时暂停它。

通过 JNI 函数附接的线程在它们退出前必须调用 DetachCurrentThread。如果直接这样写代码不方便,则在 Android 2.0 (Eclair) 或更高版本上,你可以使用pthread_key_create 定义一个将会在线程退出前被调用的析构函数,并在那儿调用 DetachCurrentThread。(以该 key 调用 pthread_setspecific 来将 JNIEnv 保存在线程局部存储中;以此,它将会作为参数被传进你的析构函数。)

jclass,jmethodID,和 jfieldID

如果你想在本地层代码中访问 Java 对象的成员,你将需要执行以下操作:

类似地,要调用一个方法,你首先要获取类对象的引用,然后获得方法 ID 对象引用。IDs 经常只是指向内部运行时数据结构的指针。查找它们可能需要一些字符串比较,然而一旦有了它们,获取成员或者调用方法的实际调用是非常快的。

如果性能很重要,在你的本底层代码中,进行一次查找操作并将结果缓存起来会很有用。由于有着每个进程一个 JavaVM 实例的限制,把这些数据保存在一个静态本地结构中是合理的。

在类被卸载之前,类引用,成员 IDs,和方法 IDs 会保证是有效的。只有当与一个 ClassLoader 相关联的所有类都可以被垃圾回收时,类才会被卸载,这很罕见,但在 Android 中也不是不可能。然而,注意 jclass 是一个类引用,且 必须通过调用 NewGlobalRef 来保护 (参见下一节)。

如果你想在类被加载时缓存 IDs,并在类被卸载且重新加载时自动地重新缓存它们,初始化 IDs 的正确方法是,在适当的类中添加一段像下面这样的代码:

    /*
     * We use a class initializer to allow the native code to cache some
     * field offsets. This native function looks up and caches interesting
     * class/field/method IDs. Throws on failure.
     */
    private static native void nativeInit();

    static {
        nativeInit();
    }

在你的 C/C++ 代码中创建一个 nativeClassInit 方法执行 ID 查找。代码将会在类初始化时执行一次。如果类被卸载并重新加载,它将会再次执行。

局部和全局引用

传递给本地层方法的每个参数,和由 JNI 函数返回的几乎每个对象均是一个 “局部引用”。这意味着它在当前线程的当前本地层方法运行期间是有效的。即使对象本身在本地层方法返回之后继续存活,引用依然不是有效的

这适用于所有的 jobject 子类,包括 jclassjstring,和 jarray。(当启用扩展 JNI 检查时,运行时将为大多数引用的错误使用发出警告。)

获得非局部引用的仅有的方法是通过函数 NewGlobalRefNewWeakGlobalRef

如果你想更长期地持有引用,你必须使用一个“全局的”引用。NewGlobalRef 函数接收局部引用作为参数,并返回一个全局引用。全局引用保证是有效的,直到你调用 DeleteGlobalRef

这一模式常被用于缓存 FindClass 返回的 jclass,如:

jclass localClass = env->FindClass("MyClass");
jclass globalClass = reinterpret_cast<jclass>(env->NewGlobalRef(localClass));

如果这样说的话,那 jmethodID 和 jfieldID 呢?

所有的 JNI 方法都接收局部和全局的引用作为参数。可能引用同一个对象的引用具有不同的值。比如,连续地对相同对象调用 NewGlobalRef 获得的返回值可能不同。要查看两个引用是否指向相同对象,你必须使用 IsSameObject 函数。千万不要在本地层代码中用 == 比较引用。

这样的结果是在本地层代码中你 一定不能假设对象引用是常量或唯一的。在对一个方法的一次调用和下一次调用之间表示对象的 32 位值可能不同, 在连续调用中两个不同的对象可能具有相同的 32 位值。不要使用 jobject 值作为键。

程序员需要 “不过分地分配”局部引用。实际上,这意味着如果你正在创建大量的局部引用,也许在遍历一个对象数组,你应该使用 DeleteLocalRef 手动释放它们,而不是让 JNI 为你执行。实现只被要求为局部引用保留 16 个槽,因此如果你需要更多,你应该或者在运行过程中删除一些,或者使用 EnsureLocalCapacity / PushLocalFrame 保留更多。

注意 jfieldIDjmethodID 是不透明类型,而不是对象引用,且不应该被传给 NewGlobalRef。像 GetStringUTFCharsGetByteArrayElements 这样的函数返回的原始数据指针也不是对象。(它们可以在线程间传递,且直到对应的 Release 被调用都是有效的。)

一种不常见的情况应该另外提一下。如果你通过 AttachCurrentThread 附了一个本地层线程,你执行的代码将从不会自动地释放局部引用,直到线程分离。你创建的任何局部引用将不得不手动删除。通常,在循环中创建局部引用的任何本地层代码可能需要执行一些手动删除。

UTF-8 和 UTF-16 字符串

Java 编程语言使用 UTF-16。为了方便,JNI 也提供方法使用 改进的 UTF-8。改进的编码对 C 代码很有用,因为它把 \u0000 编码为 0xc0 0x80 而不是 0x00。关于这一点的好处是,您可以依靠具有 C 风格的以零为终止字符的字符串,适合与标准 libc 的字符串函数一起使用。

缺点是你不能传递任意的 UTF-8 数据给 JNI 并期待它能正确工作。

如果可能,操作 UTF-16 字符串通常更快。当前 Android 在 GetStringChars 中不需要拷贝,然而 GetStringUTFChars 需要分配并转换为 UTF-8。注意 UTF-16 字符串不是以 0 结尾的,且允许 \u0000 ,所以你需要根据字符串的长度来访问 jchar 指针。

不要忘记 ReleaseGet 的字符串。字符串函数返回 jchar*jbyte*,它们都是指向原始数据类型数据的 C 风格指针,而不是局部引用。它们保证有效,直到调用 Release,这意味着当本地层方法返回时它们不会释放。

传递给 NewStringUTF 的数据必须是改进的 UTF-8 格式。一个常见的错误是,从文件或网络流读取字符数据并在无过滤的情况下交给 NewStringUTF 处理。除非你知道数据是 7 位的 ASCII,你需要删除高 ASCII 字符或将其转换为正确的改进 UTF-8 格式。如果你没有,UTF-16 转换可能不是你期待的那样。扩展的 JNI 检查将扫描字符串,并就无效数据向你提出警告,但它们不会捕获所有东西。

原始数据类型的数组

JNI 提供了访问数组对象内容的函数。尽管每次只能访问一个数组对象的项,但原始数据类型的数组可以直接读或写,就像它们在 C 中声明的一样。

为了使接口尽可能高效且,Get<PrimitiveType>ArrayElements 族调用允许运行时返回指向实际元素的指针,或分配一些内存并拷贝一份。无论哪种方式,返回的原始指针保证有效,直到对应的 Release 被调用(这表明,如果数据没有拷贝,则数组对象将被固定,并且不能作为压缩堆的一部分重新定位)。你必须 ReleaseGet 的每个数组。此外,如果 Get 调用失败,你必须确保你的代码没有在后面试图 Release 一个 NULL 指针。

你可以通过传递一个非空指针作为 isCopy 参数决定是否拷贝数据。这很少用到。

Release 调用接收一个 mode 参数,其可以是三个值中的一个。运行时执行的行为依赖于它是返回一个指向实际数据的指针还是实际数据拷贝的指针:

检查 isCopy 的一个原因是了解在对数组做了修改后你是否需要以 JNI_COMMIT 调用 Release—— 如果你在改变数组内容和执行使用数组内容的代码之间进行交替,你可能可以跳过无操作提交。另一个检查标记的可能原因是高效的处理 JNI_ABORT。比如,你也许想要获得一个数组,修改它,传递一部分给其它函数,然后丢弃修改。如果你知道 JNI 为你创建了一份拷贝,则无需创建另一份“可编辑的”拷贝。如果 JNI 向你传递了原始的,则你确实需要创建你自己的拷贝。

一个常见的错误是(在示例代码中重现)假设你可以在 * isCopy 为 false 时跳过调用 Release。这不是实际的情况。如果没有分配拷贝缓冲区,则原始的内存必须被固定下来,且不能由垃圾收集器移动。

还要注意 JNI_COMMIT 标记 释放数组,在最后你将需要以一个不同的标记再次调用 Release

区域调用

当你想做的就只是拷入拷出数据,有另外一些像 Get<Type>ArrayElementsGetStringChars 的调用可能非常有用。考虑下面的代码:

    jbyte* data = env->GetByteArrayElements(array, NULL);
    if (data != NULL) {
        memcpy(buffer, data, len);
        env->ReleaseByteArrayElements(array, data, JNI_ABORT);
    }

获取数组,拷贝前面的 len 字节的元素,然后释放数组。Get 调用是固定还是拷贝数组的内容依赖于实现。代码拷贝数据(也许是第二次),然后调用 Release;在这种情况下 JNI_ABORT 确保没有第三个副本的机会。

可以完成相同事情的更简单的代码如下:

    env->GetByteArrayRegion(array, 0, len, buffer);

这有几个优势:

类似地,你可以使用 Set<Type>ArrayRegion 调用把数据复制到一个数组,及 GetStringRegionGetStringUTFRegion 把字符拷出一个 String

异常

你一定不能在异常挂起时调用大多数 JNI 函数。你的代码需要注意到异常(通过函数的返回值,ExceptionCheck,或 ExceptionOccurred)并返回,或清除异常并处理它。

在异常挂起时你能调用的 JNI 函数只有下面这些:

许多 JNI 调用可能抛出异常,但也常提供简单的方式用于失败检查。比如,如果 NewString 返回非空值,你不需要检查失败。然而,如果你调用了一个方法(使用像 CallObjectMethod 这样的函数),你必须总是检查异常,因为如果抛出了异常,返回值将不是有效的。

注意,由解释器代码抛出的异常无法展开本地层栈帧,且 Android 还不支持 C++ 异常。JNI ThrowThrowNew 指令只是在当前线程中设置一个异常指针。一旦从本地层代码返回受控代码,异常将被注意到并被适当地处理。

本地层代码可以通过调用 ExceptionCheckExceptionOccurred “捕获”异常,并通过 ExceptionClear 清除它。通常,丢弃异常而不处理它们可能产生一些问题。

没有内置的函数管理 Throwable 对象本身,因此如果你想获取异常字符串,你将需要找到 Throwable 类,查找 getMessage "()Ljava/lang/String;" 的方法 ID,调用它,如果结果非空,则使用 GetStringUTFChars 获得一些你可以交给 printf(3) 或等价的函数的东西。

扩展检查

JNI 执行非常少的错误检查。错误通常导致崩溃。Android 还提供了一个称为 CheckJNI 的模式,其中 JavaVM 和 JNIEnv 函数表指针被切换为,在调用标准实现前执行一系列扩展检查的函数的表。

额外的检查包括:

(方法和字段的可访问性依然没有检查:访问限制不适用于本地层代码。)

有多种方法启用 CheckJNI。

如果你正在使用模拟器,CheckJNI 是默认开启的。

如果你有一个经过 root 的设备,你可以使用下面的命令启用 CheckJNI 模式重启运行时:

adb shell stop
adb shell setprop dalvik.vm.checkjni true
adb shell start

在所有这些情况中,你将在 logcat 输出中运行时启动时看到像这样的东西:

D AndroidRuntime: CheckJNI is ON

如果你有一个普通的设备,你可以使用下面的命令:

adb shell setprop debug.checkjni 1

这不影响已经运行的应用,但自那之后启动的应用都将开启 CheckJNI。(将属性修改为其它值或简单地重启将再次禁用 CheckJNI。)在这种情况下,你将在你的 logcat 输出中下次启动一个应用时看到像这样的东西:

D Late-enabling CheckJNI

你还可以在你的应用的 manifest 中设置 android:debuggable 属性来只为你的应用开启 CheckJNI。注意 Android 构建工具将自动地为某一构建类型做这些。

本地库

你可以通过标准的 System.loadLibrary 调用从共享库加载本地层代码。获取你本地层代码的首选方法是:

如果用 C++ 写的话,JNI_OnLoad 函数看起来应该像下面这样:

jint JNI_OnLoad(JavaVM* vm, void* reserved)
{
    JNIEnv* env;
    if (vm->GetEnv(reinterpret_cast<void**>(&env), JNI_VERSION_1_6) != JNI_OK) {
        return -1;
    }

    // Get jclass with env->FindClass.
    // Register methods with env->RegisterNatives.

    return JNI_VERSION_1_6;
}

你也可以用共享库的完整路径名调用 System.load。对于Android 应用,你也许会发现从 context 对象获取应用程序私有数据存储区的完整路径的方法非常有用。

这是建议采用的方法,但不是唯一的方法。无需显式的注册,你也不是必须提供 JNI_OnLoad 函数。你可以使用以特殊的方式命名本地层方法的“发现机制”来代替 (详情参看 JNI spec),尽管这种方法更不尽如人意。如果方法签名错了的话,在方法第一次被实际调用之前,你都将无法获知这种情况。

关于 JNI_OnLoad 另一点需要注意的是:你所作出的任何对于 FindClass 的调用发生在用于加载共享库的类加载器的上下文。通常,FindClass 使用与解释栈顶端的方法相关联的加载器,或者如果没有(由于线程只是被附接的)它使用“system”类加载器。这使得 JNI_OnLoad 成为查找和缓存类对象引用的适当场所。

64 位注意事项

Android 当前主要运行于 32 位平台。理论上,可以为 64 位系统构建它,但那不是目前的目标。对于大多数部分来说,这不是你在与本地层代码交互时需要担忧的,但如果你计划将指向本地层结构的指针保存在对象的 integer 字段中,它就变得非常重要了。要支持使用 64 位指针的架构,你需要在 long 字段中保存你的本地层指针而不是 int

不支持的功能/向后兼容性

所有的 JNI 1.6 功能都支持,以下这些例外:

为了与老版本 Android 保持向后兼容性,你可能需要意识到如下这些:

FAQ:为什么我遇到了 UnsatisfiedLinkError

当你使用本地层代码时,像下面这样的失败比较常见:

java.lang.UnsatisfiedLinkError: Library foo not found

在某些情况下它的含义就像它说的那样 - 库找不到。在其它情况中,库存在但是无法被 dlopen(3)打开,失败的详情可以在异常的细节消息中找到。

你可能遇到 "library not found" 异常的常见原因如下:

另一种类的 UnsatisfiedLinkError 失败看上去像这样:

java.lang.UnsatisfiedLinkError: myfunc
       at Foo.myfunc(Native Method)
       at Foo.main(Foo.java:10)

在 logcat 中,你将看到:

W/dalvikvm(  880): No implementation found for native LFoo;.myfunc ()V

这意味着运行时试图找到一个匹配的方法,但未成功。这种情况一些常见的原因如下:

使用 javah 自动地生成 JNI 头部也许对避免一些错误有帮助。

为什么 FindClass 找不到我的类?

(这个建议的大部分等价地适用于通过 GetMethodIDGetStaticMethodID 查找方法,或通过 GetFieldIDGetStaticFieldID 查找字段的失败。)

确保类名字符串具有正确的格式。JNI 类名以包名开始,且有斜线分割,比如 java/lang/String。如果你在查找一个数组类,你需要以适当数量的方括号开始,且还必须以 'L' 和 ';' 包裹类,因此一维的 String 数组将是 [Ljava/lang/String;。如果你在查找一个内部类,使用 '$' 而不是 ','。通常,在 .class 文件上使用 javap 是找到你的类的内部名字的一种好方法。

如果你在使用 ProGuard,请确保 ProGuard 没有剥去你的类。这可能在你的类/方法/字段只有 JNI 使用时发生。

如果类名称正确,则可能遇到了类加载器问题。FindClass 想要在与你的代码关联的类加载器中开始类搜索。如果检查调用栈,它将看起来像这样:

    Foo.myfunc(Native Method)
    Foo.main(Foo.java:10)

最上面的方法是 Foo.myfuncFindClass 查找与 Foo 类关联的 ClassLoader 对象并使用它。

这通常执行了你想要的。如果您自己创建一个线程(可能通过调用pthread_create,然后使用 AttachCurrentThread 连接),您可能会遇到麻烦。现在没有你的应用的栈帧。如果你在这个线程中调用 FindClass,JavaVM 将在 "system" 类加载器中启动而不是与你的应用关联的那个,因此尝试查找应用特有的类将失败。

有一些方法绕过这个问题:

FAQ:我如何与本地层代码共享原始数据

你可能发现你自己需要同时在 Java 代码和本地层代码中访问一个巨大的原始数据缓冲区。常见的例子包括管理 bitmaps 和声音采样。有两个基本的方法。

你可以把数据存储在 byte[] 中。这允许在 Java 代码中非常快速的访问。在本地层代码中,然而,无法保证在不复制数据的情况下能够访问数据。在一些实现中, GetByteArrayElementsGetPrimitiveArrayCritical 将返回指向 Java 堆中的原始数据的实际指针,但在其它实现中,它将在本地层堆上分配一块缓冲区并复制数据。

另一种方法是把数据存储进直接字节缓冲区。这些可以用 java.nio.ByteBuffer.allocateDirect ,或JNI NewDirectByteBuffer 函数创建。不像普通的字节缓冲区,不在 Java 堆上分配存储,且总是可以在本地层代码中直接访问(通过 GetDirectBufferAddress 获得地址)。依赖于直接字节缓冲区访问如何实现,在 Java 代码中访问可能非常慢。

选择使用哪种依赖于两个因素:

如果没有清晰的赢家,使用直接字节缓冲区。对它们的支持是直接内建在 JNI 中的,且在未来的版本中性能应该有提升。

原文

上一篇 下一篇

猜你喜欢

热点阅读