NDK开发-ReleaseStringUTFChars调用的坑

468 查看

在开发中部分关键代码是在 NDK 中处理的,但是前段时间我们在线上日志中发现有少量的日志报错。通过排查我们发现问题出现在 NDK 的 ReleaseStringUTFChars 函数上。虽然找到了解决办法,但是我还是没有分析出具体的问题在哪。

传送门:NDK开发-ReleaseStringUTFChars调用的坑

0x00 问题描述

出于安全考虑我们会把部分关键的代码用 NKD 开发,加大被逆向的难度。但是可能是自己水平还不够,实际开发中会发现其实 NDK 开发还是有很多坑。
出现问题的函数处理流程其实很简单,接收 JAVA String 变量,对其进行简单的处理,然后返回。
示例代码:

NIEXPORT jstring JNICALL Java_cn_sdk_NativeEncode_getHello
        (JNIEnv *env, jclass object, jstring j_data, jstring j_key) {

     //提取data key
    const char *c_data = env->GetStringUTFChars(j_data, 0);
    const char *c_key = env->GetStringUTFChars(j_key, 0);

    //计算长度
    int len_data = strlen(c_data);
    int len_key = strlen(c_key);
    //拷贝到cc_data cc_key
    char cc_data[len_data];
    char cc_key[len_key];
    strcpy(cc_data, c_data);
    strcpy(cc_key, c_key);

     //是否字符串
    env->ReleaseStringUTFChars(j_data, c_data);
    env->ReleaseStringUTFChars(j_key, c_key);

    char result[1024];
    //数据处理

    return env->NewStringUTF(result);
}

其中很诡异的一点是:相同的data, 当我修改 key 时,有时候正常了。有时候 data 的一个字符的 ASCII 码是 0,这个就是导致失败的原因。

0x01 代码分析

一开始我以为是数据处理部分代码有问题,但是经过多次的排查可以证实该部分代码没有问题。后来想是不是自己的代码在内存处理上有问题,导致了内存溢出或者野指针的情况。所以就找了一份 google的 NDK 开发 example。发现一般都是在 return 之前调用 ReleaseStringUTF 方法,而我在 copy 后就直接释放了。

那么就有必要分析一下 ReleaseStringUTF 这个函数了,先看一下该函数的解释:

在调用 GetStringUTFChars 函数从 JVM 内部获取一个字符串之后,JVM 内部会分配一块新的内存,用于存储源字符串的拷贝,以便本地代码访问和修改。即然有内存分配,用完之后马上释放是一个编程的好习惯。通过调用ReleaseStringUTFChars 函数通知 JVM 这块内存已经不使用了,你可以清除了。注意:这两个函数是配对使用的,用了 GetXXX 就必须调用 ReleaseXXX,而且这两个函数的命名也有规律,除了前面的 Get 和 Release 之外,后面的都一样。

再看另一个相关的函数 strcpy(src, dest) 的解释:

C语言标准库函数strcpy,把从src地址开始且含有'0'结束符的字符串复制到以dest开始的地址空间。

所以代码运行的时候应该是先分配了一块新的内存地址保存 JAVA 变量的值,然后 strcopy 拷贝新内存的值 而不是地址,这时候释放新分配的内存,实际上不应该影响到 strcopy(str, dest) 中的 dest 的值。但是不幸,就是不行。

0x02 解决方法

后来我就把ReleaseStringUTF放到数据处理结束后 return 前调用。卧槽还真就好了,也幸好线上拉下的错误日志可以复现 BUG 情况,所以就特么的修复了。

JNIEXPORT jstring JNICALL Java_cn_sdk_NativeEncode_getHello
        (JNIEnv *env, jclass object, jstring j_data) {

    const char *c_data = env->GetStringUTFChars(j_data, 0);
    const char *c_key = env->GetStringUTFChars(j_key, 0);

    int len_data = strlen(c_data);
    int len_key = strlen(c_key);
    char cc_data[len_data];
    char cc_key[len_key];

    char result[1024];
    //数据处理

    env->ReleaseStringUTFChars(j_data, c_data);
    return env->NewStringUTF(result);
}

0x03 总结

其实我还是很懵逼,为什么我一开始写的会出现 bug 并且不是必现的,只有在极少数情况下才出现。希望有大神给我解释一下,解决我这一脸懵逼。