Android 逆向学习详解及实例

程序员文章站 2024-03-05 17:28:07

断断续续的总算的把android开发和逆向的这两本书看完了，虽然没有jav...

断断续续的总算的把android开发和逆向的这两本书看完了，虽然没有java，和android开发的基础，但总体感觉起来还是比较能接收的，毕竟都是触类旁通的。当然要深入的话还需要对这门语言的细节特性和奇技淫巧进行挖掘。

　　这里推荐2本书，个人觉得对android开发入门和android逆向入门比较好的教材：

　　《google android 开发入门与实战》

　　《android 软件安全与逆向分析》

　　1. 我对android逆向的认识

　　因为之前有一些windows逆向的基础，在看android逆向的时候感觉很多东西都是能共通的。但因为android程序本身的特性，还是有很多不同的地方。

　　1.1 反编译

　　android程序使用java语言编写，从java到android虚拟机(dalvik)的dex代码(可以看成是android虚拟机的机器码)需要一个中间语言的转换过程。类似.net的il中间虚拟指令。而我们知道，.net的il中间代码之所以能很容易的"反编译"回c#源代码，是因为除了il中间语言，还包含了大量的meta元数据，这些元数据使我们可以很容易的一一对应的反编译回c#的源代码。java的中间语言.class文件也是类似的道理，我们可以使用工具直接从dex机器码反编译回java源代码。

　　1.2 逆向分析手段

　　windows的逆向分析中，我们可以使用od或者c32asm来分析汇编指令(当然od还可以动态调试)，或者使用ida + f5(hex ray反编译插件)来静态的分析源代码(c/c++)

　　在android逆向分析过程中:

　　1) 我们可以使用apktool(本质上是baksmali反汇编引擎)对apk文件进行反汇编，得到各个类、方法、资源、布局文件...的smali代码，我们可以直接通过阅读smali代码来分析程序的代码流，进行关键点的修改或者代码注入。

　　2) 我们可以从apk中提取.dex文件，使用dex2jar工具对dex进行反汇编，得到jar包(java虚拟指令)，然后使用jd-gui等工具再次反编译，得到java源代码，从源码级的高度来审计代码，更快的找到关键点函数或者判断，然后再回到smali层面，对代码进行修改。这种方法更倾向于辅助性的，最终的步骤我们都要回到smali层面来修改代码。

　　3) 使用ida pro直接分析apk包中的.dex文件，找到关键点代码的位置，记下文件偏移量，然后直接对.dex文件进行修改。修改完之后把.dex文件重新导入apk中。这个时候要注意修改dex文件头中dexheader中的checksum字段。将这个值修复后，重新导入apk中，并删除apk中的meta-inf文件夹，重新签名即可完成破解。

　　1.3 android与c的结合

　　在学习android逆向的时候感觉遇到的最难的问题就是分析原生代码，即jni代码。开发者使用android ndk编写c/c++代码供android的java代码调用(通过java的代码转接层来完成接口的转换)。

　　使用android ndk编写的c/c++代码最终会生成基于arm的arm elf可执行文件，我们想要分析软件的功能就必须掌握另一项技能，arm汇编，arm汇编个人感觉虽然和x86汇编类似，不过由于ida pro对arm汇编没有反编译功能以及貌似没有工具能动态调试arm代码(我网上没找到)，导致我们只能直接硬看arm代码，加上往往伴随着复杂的密码学算法等等，导致对native code的逆向相对来说比较困难，对基本功的要求比较高。

　　1.4 关于分析android程序

　　1) 了解程序的androidmanifest.xml。在程序中使用的所有activity(交互组件)都需要在androidmanifest.xml文件中手动声明。包括程序启动时默认启动的主activity，通过研究这个androidmanifest.xml文件，我们可以知道该程序使用了多少的activity，主activity是谁，使用了哪些权限，使用了哪些服务，做到心中有数。

　　2) 重点关注application类

　　这本来和1) androidmanifest.xml是一起的，但是分出来说是因为这个思路和windows下的逆向思路有相通之处。

　　在windows exe的数据目录表中如果存在tls项，那程序在加载后会首先执行这个tls中的代码，执行完之后才进行main主程序入口。

　　在android 中application类比程序中其他的类启动的都要早。

　　3) 定位关键代码

　　3.1) 信息反馈法(关键字查找法)

　　通过运行程序，查找程序ui中出现的提示消息或标题等关键字，到string.xmlzhong中查找指定字符串的di，然后到程序中查找指定的id即可。

　　3.2) 特征函数法

　　这种做法的原理和信息反馈法类似，因为不管你提示什么消息，就必然会调用相应的api函数来显示这个字符串，例如toast.maketext().show()

　　例如在程序中搜索toast就有可能很快地定位到调用代码

　　3.3) 代码注入法

　　代码注入法属于动态调试的方法，我们可以手动修改smali反汇编代码，加入log输入，配合logcat来查看程序执行到特定点时的状态数据。

　　3.4) 栈跟踪法

　　栈跟踪法属于动态调试方法，从原理上和我们用od调试时查看call stack的思想类似。我们可以在smali代码中注入输出运行时的栈跟踪信息，然后查看栈上的函数调用序列来理解方法的执行流程(因为每个函数的执行都会在栈上留下记录)

　　3.5) method profiling

　　method profiling,方法剖析(这是书上的叫法，我更愿意叫benchmark测试法)，它属于一种动态调试方法，它主要用于热点分析和性能优化。在ddms中有提供这个功能，它除了可记录每个函数所占用的cpu时间外，还能够跟踪所有的函数调用关系。

　　1.5 关于android的代码混淆和加壳

　　java语言编写的代码本身就很容易被反编译，google为此在android 2.3的sdk中正式加入了proguard代码混淆工具，只要正确的配置好project.properties与proguard.cfg两个文件即可使用proguard混淆软件。

　　java语言由于语言自身的特殊性，没有外壳保护这个概念，只能通过混淆方式对其进行保护。对android ndk编写的native code倒是可以进行加壳，但目前貌似只能进行ups的压缩壳保护

　　2. crackme_1 分析学习

　　2.1 运行一下程序，收集一些基本信息

Android 逆向学习详解及实例

　　只有一个输入框，那说明这个验证码的输入来自别的地方，因为我们知道，不管你的加密算法是啥，总是要有一个函数输入源的，我们在ui界面上输入的相当于是结果，而输入源应该来自于别的地方，计算完之后和我们在ui上输入的结果进行对比，大致是这个思路。

　　2.2 分析

　　使用apktool反编译apk文件。查看androidmanifest.xml文件。了解到主activity为:main。

　　接着我们从apk中提取.dex文件。用dex2jar->jd-gui来查看java源代码。

Android 逆向学习详解及实例

　　看到里面很多的a,b,c方法，基本上可以判定是配proguard混淆了，不过问题也不大，虽然显示的是无意义的函数名但是不影响我们分析代码流程。

　　2.2.1 类b的分析

Android 逆向学习详解及实例

　　从oncreate()的代码来看，我们首先从类b开始分析:

　　类 b 提供了一个公共的构造函数 public b(context paramcontext), 一个私有的成员函数private string b(), 以及一个公有成员函数 public final void a()。

　　b(): 通过telephonymanager获取设备相关的一些信息，然后通过packagemanager获取到自身的签名。然后把这些字符串拼接起来返回给调用者。

telephonymanager localtelephonymanager = (telephonymanager)this.a.getsystemservice("phone"); 
  string str1 = localtelephonymanager.getdeviceid(); 
  string str2 = localtelephonymanager.getline1number(); 
  string str3 = localtelephonymanager.getdevicesoftwareversion(); 
  string str4 = localtelephonymanager.getsimserialnumber(); 
  string str5 = localtelephonymanager.getsubscriberid(); 
  object localobject = ""; 
  packagemanager localpackagemanager = this.a.getpackagemanager(); 
  try 
  { 
   string str6 = localpackagemanager.getpackageinfo("com.lohan.crackme1", 64).signatures[0].tocharsstring(); 
   localobject = str6; 
   return str1 + str2 + str3 + str4 + str5 + (string)localobject; 
  } 
 
  
 
a(): 
 
 sharedpreferences localsharedpreferences = preferencemanager.getdefaultsharedpreferences(this.a); 
  sharedpreferences.editor localeditor; 
  if (!localsharedpreferences.contains("machine_id")) 
   localeditor = localsharedpreferences.edit(); 
  try 
  { 
   localeditor.putstring("machine_id", b()); 
   localeditor.commit(); 
   return; 
  }

　　a()调用方法b()获取字符串，然后通过sharedpreferences.editor将这个字符串值存储到键machine_id，可以理解为机器码。也就是说，这个加密函数的输入是本机的机器码。

　　经过上面的分析，类b对外提供方法a，功能就是生成"机器码"并存储到系统中，对应的键为machine_id。

　　2.2.2 类c的分析

　　类c提供的方法较多，我们逐个分析。

　　1) 构造函数

java代码

public c(context paramcontext) 
{ 
  a = paramcontext; 
  b = "f0d412b5530e1f9841aab434d989cc77"; 
  c = "4ec407446b872351e613111339daae9"; 
}

　　把参数环境上下文context本地化，并声明了两个字符串。

　　2) public static boolean b()

java代码

messagedigest localmessagedigest = messagedigest.getinstance("md5"); 
localmessagedigest.update(paramstring.getbytes(), 0, paramstring.length()); 
return new biginteger(1, localmessagedigest.digest()).tostring(16);

　　通过messagedigest计算paramstring 的md5值。

　　3) public static boolean b()

java代码

packagemanager localpackagemanager = a.getpackagemanager(); 
  try 
  { 
   string str = b(new string(localpackagemanager.getpackageinfo("com.lohan.crackme1", 64).signatures[0].tochars())); 
   if (!str.equals(b)) 
   { 
    boolean bool = str.equals(c); 
    if (!bool); 
   } 
   else 
   { 
    return false; 
   } 
  }

　　通过 getpackagemanager 获取自身的签名，如果签名与构造函数中的两个字符串b(f0d412b5530e1f9841aab434d989cc77)或者c(4ec407446b872351e613111339daae9)任意一个相等，那么返回false，否则返回true。

　　4) public static int a(string paramstring)

java代码

try 
{ 
 if (b()) 
  return 0; 
 sharedpreferences localsharedpreferences = preferencemanager.getdefaultsharedpreferences(a); 
 if (b(localsharedpreferences.getstring("machine_id", "")).equals(paramstring)) 
 { 
  if (b()) 
   return 0; 
  sharedpreferences.editor localeditor = localsharedpreferences.edit(); 
  localeditor.putstring("serial", paramstring); 
  localeditor.commit(); 
  return 1; 
 } 
}

　　可以看出这段代码的功能为计算机器码的 md5，如果与传入的参数paramstring一致，那么通过sharedpreferences存入到serial(机器码的md5值paramstring)字段中。当然还有调用b方法进行一些判断，自身的签名不能是已知的两个。

　　5) public static boolean a()

java代码

sharedpreferences localsharedpreferences = preferencemanager.getdefaultsharedpreferences(a); 
if (!localsharedpreferences.contains("serial")) 
 return false; 
string str = localsharedpreferences.getstring("serial", ""); 
if (str.equals("")) 
 return false; 
return a(str) >= 0;

　　这个其实就是上面的 int a(string paramstring)的包装函数，通过sharedpreferences获取serial字段(机器码的md5值)，并传给这个方法，返回相应的返回值(判断结果)。

　　2.2.3 类a分析

　　可以看到，类a是一个countdowntimer:

　　schedule a countdown until a time in the future, with regular notifications on intervals along the way. example of showing a 30 second countdown in a text field:(android developer)

Android 逆向学习详解及实例

　　从onfinish函数我们看出这个类的功能是倒计时6秒，然后调用c.a()，也就是判断我们输入的serial是否等于"机器码"的md5值。如果不能通过，就设置textview内容提示注册。

　　2.2.4 类main分析

　　1) 在oncreate()，先初始化b和c的类。然后调用b.a()生成并存储"机器码"，然后调用c.a()，也就是判断是否已经存储了serial，并判断是否能通过算法校验。如果不能通过，则什么都不做，这就是启动时检测注册状态的做法，即如果你之前已经注册了，那在之后的登录后就会自动识别出来，但是我们如果是第一次启动且没有注册，那这里就什么也不做。

　　如果能通过，则调用自身的方法a()。而自身的方法a()又调用了c.b()方法，即检查我们输入的serial和机器码的md5值是否相同，如果相同则什么也不做，如果不同就把下面的按钮和textview等ui控件给隐藏了。并启动倒计时类a.start()。即二次验证。

　　ps：

　　这里要注意的是，由于程序使用了proguard来混淆代码，所以用jd-gui翻译出来的代码全都是从a,b,c开始计数，而且经常是变量、类、方法的命名混合了起来。我们在看java代码的时候遇到难懂的地方要结合smali代码一起看，这样才能获取比较准确的对程序代码流的把握。

　　2) public void onclick(view paramview)

java代码

if (c.a(((edittext)findviewbyid(2131034114)).gettext().tostring()) == 0) 
{ 
 toast.maketext(this, 2130968577, 0).show(); 
 return; 
} 
toast.maketext(this, 2130968578, 0).show();

　　判断我们通过ui输入的serial是否和"机器码"的md5值相同，如果不相同则弹出提示invalid serial!(可以通过id值反查出对应的字符串)，如果相同则弹出thanks for purchasing!

　　通过以上分析，我们来综合一下思路:

　　程序启动时会做一些初始化的工作，然后生成本地对应的机器码并保存在sharedpreferences中。

　　检查当前的sharedpreferences中是否已经保存了serial键值对，并检查正确性，即检查是否上一次已经注册了。如果没有这个键值对，说明还没注册，如果存在这个键值对且正确性也符合，代码接下来会继续检查apk自身的签名是否为代码中定义的那两个，如果相等则什么都不做(即依然不通过检查)，如果不等则代码继续执行倒计时6秒的类a, 6秒后再次检查一次serial键值对。

　　对于那个按钮点击事件，onclick()，它获取用户通过ui输入的serial，并检测是否和"机器码"的md5值相等，如果相等则存进sharedpreferences中的键值对中。

　　以上基本就是这个程序的代码思路了。我们可以看到，作者这里使用了双重保护的思路，即不仅要你输入的serial相同，而且对你的apk的签名也有限制。

　　3. 破解思路

　　3.1 单纯的破解，用代码注入的方法得到注册码。

　　经过分析，我们知道应该在b.smali的155行:

Android 逆向学习详解及实例

　　move-result-object v2 这里代码注入，因为这个b()的作用就是获取当前"机器码"(注意，这里获取的是没有md5之前的"机器码"，因为程序中的md5都是临时算出来的)

　　我们在这里加入：

　　const-string v3, "sn"

　　invoke-static {v3, v2}, landroid/util/log;->v(ljava/lang/string;ljava/lang/string;)i

　　重新回编译smalli代码。

　　在命令行中执行 adb logcat -s sn:v ，然后再启动程序

　　会在命令行中看到一大串字符串，这些字符串就是我们要的机器码

Android 逆向学习详解及实例

　　将这些字符串计算md5值之后，就可以完成破解了。

　　3.2 读取程序对应的文件

　　我们知道，所谓的sharedpreferences本质上是保存在当前程序空间下的/data/data/<package name>/shared_prefs/<package name>_preferences.xml文件中的。

　　我们可以通过adb连接上去，直接读取这个文件的内容。

Android 逆向学习详解及实例

　　可以看到，和我们通过代码注入的方式得到的机器码是相同的。

　　3.3 编写注册机

　　这种方法是最好的，编写注册机要求我们对目标程序的代码有全盘的认识，然后模拟原本的算法或者逆向原本的算法写出注册机

　　我们用eclipse重新生成一个新的工程 com.lohan.crackme。注意，工程的报名必须和目标程序的包名一致，这样我们的注册机运行后得到的apk签名才会是一样的。

　　核心算法如下：

java代码

@override 
protected void oncreate(bundle savedinstancestate)  
{ 
  super.oncreate(savedinstancestate); 
  setcontentview(r.layout.activity_main); 
  settitle("crackme1_keygen"); 
  final context context = getapplicationcontext(); 
   
  //获取ui控件 
  txt_machinecode = (textview) findviewbyid(r.id.machinecode); 
  txt_apksig = (textview) findviewbyid(r.id.apksig); 
  txt_serial = (textview) findviewbyid(r.id.serial); 
  btn_go = (button) findviewbyid(r.id.ok); 
   
  //设置监听事件 
  btn_go.setonclicklistener(new onclicklistener(){ 
    public void onclick(view v) 
    { 
      //计算机器码 
      telephonymanager localtelephonymanager = (telephonymanager) context.getsystemservice("phone"); 
      string str1 = localtelephonymanager.getdeviceid(); 
      string str2 = localtelephonymanager.getline1number(); 
      string str3 = localtelephonymanager.getdevicesoftwareversion(); 
      string str4 = localtelephonymanager.getsimserialnumber(); 
      string str5 = localtelephonymanager.getsubscriberid(); 
      object localobject = ""; 
      packagemanager localpackagemanager = context.getpackagemanager(); 
      try 
      { 
       string str6 = localpackagemanager.getpackageinfo("com.lohan.crackme1", 64).signatures[0].tocharsstring(); 
       localobject = str6; 
       string str_result = str1 + str2 + str3 + str4 + str5 + (string)localobject; 
       //得出机器码 
       txt_machinecode.settext(str_result); 
        
       //计算当前apk的签名 
       txt_apksig.settext(str6); 
        
       //计算注册码 
       messagedigest localmessagedigest = null;  
        try { 
          localmessagedigest = messagedigest.getinstance("md5"); 
        } catch (nosuchalgorithmexception e) { 
          // todo auto-generated catch block 
          e.printstacktrace(); 
        }  
       localmessagedigest.update(str_result.getbytes(), 0, str_result.length()); 
       string str_serial = new biginteger(1, localmessagedigest.digest()).tostring(16); 
       txt_serial.settext(str_serial); 
      } 
      catch (packagemanager.namenotfoundexception localnamenotfoundexception) 
      { 
       while (true) 
        localnamenotfoundexception.printstacktrace(); 
      }  
    } 
 
  });

Android 逆向学习详解及实例