使用O-LLVM和NDK对Android应用进行混淆

1646 查看

混淆是一种用来隐藏程序意图的技术，具体的实现技术可能差别比较大，最有效的技术可以增加逆向工程和破解的难度，防止知识产权被窃取。已经有很多第三方的软件可以用来混淆我们的Android应用，常见的有：

Proguard
DashO
Dexguard
DexProtector
ApkProtect
Shield4j
Stringer
Allitori

这些混淆器在代码中起作用的层次是不一样的。Android编译的大致流程如下：

1	Java Code(.java) -> Java Bytecode(.class) -> Dalvik Bytecode(classes.dex)

有的混淆器是在编译之前直接作用于java源代码，有的作用于java字节码，有的作用于Dalvik字节码。

Android NDK使得开发者可以绕过虚拟机从而进一步提高程序性能，或者更直接的与内核和硬件交互。Google对NDK的描述是：“NDK是允许开发者使用原生C/C++语言开发app的一套工具集。这样有利于某些类型的app复用C/C++编写的已有代码库，当然大部分app不需要使用Android NDK”。

相对于Dalvik虚拟机层次的混淆而言，原生语言（C/C++）组件的代码混淆选择并不多，Obfuscator-LLVM工程是一个值得关注的例外。这个项目专注于LLVM编译器，这一点使得它可移植性很高，兼容LLVM支持的所有语言（C,C++, Objective-C, Ada and Fortran）和平台(x86, x86-64, PowerPC, PowerPC-64,ARM, Thumb, SPARC, Alpha, CellSPU, MIPS, MSP430, SystemZ,and XCore)。0vercl0k在o-llvm发布之前发表了一篇论文，解释了使用LLVM编译器的优点以及简单的代码转换。

我使用O-LLVM和NDK已经有一段时间了。在了解到TowelRoot也在使用O-LLVM时，我决定写一篇文章来介绍它。TowelRoot是一款Android一键Root工具，关于它是如何利用Linux内核bug来达到root目的的可以参见这篇文章。TowelRoot使用O-LLVM主要用来防止其他人拷贝并利用它来实现非法目的，同时防止被重打包后并出售。

下面我们就来讲解如何开始使用O-LLVM来混淆原生代码，实现类似TowelRoot的目的。

使用NDK O-LLVM二进制叠加包

我已经在OSX和Linux平台上把混淆器基于NDK打包成二进制叠加包，你也可以参照本文最后一节的步骤自己从源码进行编译。混淆器的二进制叠加包下载地址：

下载正确的二进制叠加包，将它解压到你电脑的NDK目录中。

配置O-LLVM NDK工程

现在让我们对NDK工程进行配置，使其支持O-LLVM混淆器。我们工程目录结构如下所示：

➜ AndroidObfuscation-NDK git:(master) tree .

├── jni

│ ├── Android.mk

│ ├── Application.mk

│ └── obfuscationTest.c

工程的Application.mk内容如下：

LOCAL_PATH := $(call my-dir)

include $(CLEAR_VARS)

APP_ABI := armeabi

NDK_TOOLCHAIN_VERSION := clang3.4-obfuscator

include $(BUILD_EXECUTABLE)

混淆器的各种代码转换可以参见Obfuscator Wiki。可以通过LOCAL_CFLAGS标签把这些转换标记设置给混淆器。记住混淆器的转换标记需要以-mllvm开头，这样clang编译器可以传递它。

Android.mk的配置示例如下：

LOCAL_PATH := $(call my-dir)

include $(CLEAR_VARS)

LOCAL_MODULE := obfuscated

LOCAL_SRC_FILES := obfuscationTest.c

LOCAL_LDLIBS := -static

LOCAL_CFLAGS := -mllvm -sub -mllvm -fla -mllvm -bcf

include $(BUILD_EXECUTABLE)

现在可以编译我们的工程了：

➜ AndroidObfuscation-NDK git:(master) ndk-build

[armeabi] Compile thumb : obfuscated <= obfuscationTest.c

[armeabi] Executable : obfuscated

[armeabi] Install : obfuscated => libs/armeabi/obfuscated

使用了上面的配置和脚本结构的例子工程可以参见AndroidObfuscation-NDK。

上面我预先构建的二进制叠加包包含了由yag00贡献的试验性的字符串混淆技术。你可以通过给LOCAL_CFLAGS传递“-mllvm -xse”标记来使能字符串混淆功能。

➜ AndroidObfuscation-NDK git:(master) cat jni/obfuscationTest.c

#include <stdio.h>

int main(void){

printf("Hello, world\n");

return 0;

}

这个例子中，在使用字符串混淆功能之前效果如下：

1 2	➜ AndroidObfuscation-NDK git:(master) strings libs/armeabi/obfuscated \| grep Hello Hello, world

使用字符串混淆功能之后：

1	➜ AndroidObfuscation-NDK git:(master) strings libs/armeabi/obfuscated \| grep Hello

从源码构建适用于NDK的O-LLVM

git clone -b llvm-3.4 https://github.com/obfuscator-llvm/obfuscator.git

cd obfuscator

mkdir build

cd build

cmake -DCMAKE_BUILD_TYPE:String=Release ../obfuscator/

make -j5

构建o-llvm的完整指南参见这里，不过上面的说明应该足够了。

1	cp -r $NDK_PATH/toolchains/arm-linux-androideabi-clang3.4 $NDK_PATH/toolchains/arm-linux-androideabi-clang3.4-obfuscator

打开文件

1	$NDK_PATH/toolchains/arm-linux-androideabi-clang3.4-obfuscator/setup.mk

将文件里面的：

1 2	TARGET_CC := $(LLVM_TOOLCHAIN_PREFIX)clang$(HOST_EXEEXT) TARGET_CXX := $(LLVM_TOOLCHAIN_PREFIX)clang++$(HOST_EXEEXT)

修改为（记得修改o-llvm为你自己电脑上面的路径）

LLVM_TOOLCHAIN_PATH := <PATH_TO_OBFUSCATOR_REPO>/build/bin/

TARGET_CC := $(LLVM_TOOLCHAIN_PATH)clang$(HOST_EXEEXT)

TARGET_CXX := $(LLVM_TOOLCHAIN_PATH)clang++$(HOST_EXEEXT)