smali框架源码主要是对于baksmali的一个逆向过程,也就是其编译过程。本身包的文件很少,也就是13个java文件
但是里面有几个有antlr3 和 jflex生成的词法分析器和解释器文件
smaliParser.java
smaliTreeWalker.java
这两个文件时由 antlr3 生成的
smaliFlexLexer.java
这个文件是由 jflex生成的
对于这两部分的生成,以及这两个工具的使用,笔者未做深入研究。而smali本身最核心的地方就是利用这几个词法分析器 来生成不同的label,instruction,field,method,class等对象,最后组装成dex文件,这几个语义解析的文件主要还是为smali提供弹药,而真正组装成最后我们看到的dex文件,其实是dexlib2做的事情。
下一步我们需要好好看看dexlib2的源码框架。
其实前面描述了那么多,不管是baksmali还是smali工具,多是涉及到一些对于dex文件的外围io操作,而真正解析dex,解析dex各种指令,各种索引的操作是放在dexlib2这个目录下面的,下面就让我们走进dexlib2这个目录,好好分析一下这个库是如何解析android dex文件的吧。
还是老规矩,先介绍源码的目录结构已经关键代码文件的作用,给大家有个整体上的认识再逐步细化。见下图 dexlib2代码目录
这个是dexlib2的目录,明显看出来比baksmali和smali代码量要多很多,这里先将核心目录给大家做一下介绍
analysis 这个暂时不知道具体作用
base 这个文件夹下面全部都是抽象类,主要是对于一些dex文件的一些基础数据结构的一些表示
这里面重点要注意的是这个目录下面的 reference这个文件夹,里面分别有 field索引,
method索引,string索引,以及type索引,这些都是跟dex文件本身组织结构息息相关的,
这里如果不是太清楚的话,建议看一下dex文件的文件组织结构。里面有表示string type
proto class的这些段的。
value 目录下面的这些类都是跟类成员变量初始值相关的操作,比如 在某个类中的成员变量
String m_s = "hello world" 这个时候就要用到 BaseStringEncodedValue 这个类的操作
了
base 主目录下的这几个文件,
BaseAnnotation.java BaseAnnotationElement.java 跟注释相关
BaseExceptionHandler.java try catch后的exceptionhandler相关
BaseMethodParameter.java 函数参数相关
BaseTryBlock try catch块相关
builder 这个是为生成dex文件的一些组件文件,
build/debug 下面是对于 dex文件中debug信息保存的类,为最后生成dex做准备
build/instruction 对于dalvik虚拟机支持的所有指令的支持的类,格式很鲜明,基本上
每种类型的dalvik虚拟机指令用一个类来表示
build/ 这下面就放了一些对于debug信息,异常句柄,指令,swith case块,
trycatch 块,函数builder的一些实现
总之这个文件夹下是支撑将smali文件写回为dex文件的类库
dexbacked 这个目录其实是将输入的dex进行解析后接受的类库
dexbacked/instruction 解析后的dex的所有指令存放的类,也是以某类指令建立类来接收的
dexbacked/raw
对于dex文件结构的各个组件接收的类。比如typeid,stringid,classdef,protoid,mapitem,headeritem,这些对比dex文件的结构就能和这些类一一对应起来
dexbacked/reference dex文件中的成员变量索引,方法索引,字符串索引,类型索引的类
dexbacked/util 一些小的工具的类集合
dexbacked/value 还是跟初始值相关的类
dexbacked 一些更加上层抽象的类,表示的信息量更多,比如DexBackedClassDef.java
就表示一个类,但是这个类又是由n个成员变量,n个方法来表示的,对于
成员变量又涉及到了初始值,权限,访问属性,本身定义等,
对于成员方法就更复杂了,除了指令还有try catch信息 debug信息,注释信息等等
总之, dexbacked这个类库,有java语言完整表达了整个dex文件的文件结构,细化到dex文件的每个细节,就是说这个文件夹下的类已经能够涵盖dex文件所有的东西,里面的每个类,每个方法,每条指令都能从这个文件夹下找到相应的类来表示。
iface 这个就是一个接口定义类,前面提到的base抽象类都是继承与这个文件夹下面的类,主要是为了 利用java多态的特点,减少代码的编写量,让代码看起来更加专业。
immutable
这个文件夹提供了为类,方法,成员变量,指令,各种索引的不可更改的常量定义,但是这些类本身是可以new出来的,当你要为dex文件添加类,方法,成员变量或者指令的 时候,这个文件夹下面的类就很有作用了,可以用这个文件夹下面的类轻松构造出来各种索引,达到更改dex文件的目的,一般要配合builder下的各种方法来使用
rewriter 这个文件夹下面提供了对于写回dex文件各种函数的hook,包括写回类的hook,
写回方法的hook,甚至到写回每条指令的hook,这个文件夹其实起到的作用也是为了能够
通过hook方便的修改dex文件。
writer 写回dex文件启动的文件夹,前面的builder这些都是为其提供弹药的,这里整体的dex文件的生成
,所有组织都是通过这个文件夹下面的不同的类协同完成的。
. 直接根目录下的是更基础的访问权限,指令格式,操作格式,索引,值类型的一些基础类了