JS破解&&Android逆向

编译器知识杂记-javac

2021-02-25  本文已影响0人  珍惜Any

简介:

先看一张Javc编译成class文件的时候流程图

image.png

至于什么是token流,语法树相关可以参考我之前的两篇帖子。

https://www.jianshu.com/p/7a9476c65672

https://www.jianshu.com/p/49ca10345080

如何下载JavaC源码?

直接使用openJdk进行下载,下载地址为 https://hg.openjdk.java.net/jdk8/jdk8/langtools/

也可以直接在我的在我的项目库内部进行下载,地址见下文。

Javac主要有四个模块,分别是词法分析器,语法分析器,语义分析器和代码生成器。

JavaC JavaParser

用途:

把Java源码转换成 JavaParser定义的Statement对象,

也就是将java源码解析成一颗语法树,然后基于这棵树对java代码进行分析和修改的工具。

在javac 编译时候使用到

重点类介绍

语法树简介:

在学习之前需要知道什么是语法树,很简单的代码如下,在解析的时候主要分为两步

“1 + 2 * 3”

第一步: +, 1,(2 * 3)

第二步: +, 1,(*, 2, 3)

语法树

com.sun.tools.java.tree.JCTree

用于表示最终的语法树,结构,里面有很多内部类。

比如com.sun.tools.java.tree.JCTree$JCCompilationUnit,在AST中,你可以把这个类看成是AST的根节点

插入式注解器简介

Jdk1.5后引入注解功能,注解是一种应用字节码 属性中类的元数据进行操作的一种编程机制。

处理表形成后 会自动检测是否有注解器需要执行,若有则执行注解处理器。注解处理器实现了在可插入式的编译期改变编译过程的功能。

其本质就是 再次修改 处理表中的语法树。 一旦语法树被修改,则将再次进行 词法,语法分析并填充符号表的过程,直到所有插件对语法树进行修改完为止。

初始化过程入口是 initPorcessAnnotations()

执行过程入口是 processAnnotations()

该方法判断是否有新的注解处理器需要执行,若有的,则通过com.sun.tools.方法生成新的JavaCompiler对象对编译的后续步骤进行处理

JavaC 词法分析

词法分析主要是将代码转换成token

词法分析过程主要是在的JavacParser.parseCompilationUnit()中完成的

入口是parseFiles()

词法分析实现类是com.sun.tools.javac.parser.Scanner类

语法分析实现类是com.sun.tools.javac.parser.Parser

出口由com.sun.tools.javac.tree.JCTree类表示

重点介绍下面几个类,是构成词法分析的关键

先介绍词法分析“大管家”

com.sun.tools.javac.parser.ParserFactory

存放着很多的解析器比如token,源文件,名字注解之类的。

通过静态方法单例进行初始化

//获取实类的单例方法
public static ParserFactory instance(Context context) {
    ParserFactory instance = context.get(parserFactoryKey);
    if (instance == null) {
        instance = new ParserFactory(context);
    }
    return instance;
}

//创建的时候在构造方法内部,将词法分析需要的一些类进行初始化
//在编译的时候全部的解析器包括,生成器,各种工具类,都是全局唯一的单例模式
protected ParserFactory(Context context) {
        super();
        context.put(parserFactoryKey, this);
        this.F = TreeMaker.instance(context);
        this.docTreeMaker = DocTreeMaker.instance(context);
        this.log = Log.instance(context);
        this.names = Names.instance(context);
        this.tokens = Tokens.instance(context);
        this.source = Source.instance(context);
        this.options = Options.instance(context);
        this.scannerFactory = ScannerFactory.instance(context);
        this.locale = context.get(Locale.class);
}


com.sun.tools.javac.parser.JavacParser

规定哪些词符合Java语言规范,具体读取和归类不同词法的操作由scanner完成

/**
 *  Skip forward until a suitable stop token is found.
 *  核心方法,判断是否是我们需要的token
 */
private void skip(boolean stopAtImport, boolean stopAtMemberDecl, boolean stopAtIdentifier, boolean stopAtStatement) {

com.sun.tools.javac.parser.Scanner

负责逐个读取源代码的单个字符,然后解析符合Java语言规范的Token序列,调用一次nextToken()都构造一个Token

内部有个List 储存读取到的token信息

  /**
     *  Buffer of saved tokens (used during lookahead)
     *  token的一个缓冲区  
     */
    private List<Token> savedTokens = new ArrayList<Token>();

com.sun.tools.javac.parser.Tokens$TokenKind

里面包含了所有token的类型,譬如BOOLEAN,BREAK,BYTE,CASE。用的是枚举的方式进行保存

类似如下:

public enum TokenKind implements Formattable, Filter<TokenKind> {
        EOF(),
        ERROR(),
        IDENTIFIER(Tag.NAMED),
        ABSTRACT("abstract"),
        ASSERT("assert", Tag.NAMED),
        BOOLEAN("boolean", Tag.NAMED),
        BREAK("break"),
        BYTE("byte", Tag.NAMED),
        CASE("case"),
        CATCH("catch"),
        CHAR("char", Tag.NAMED),
        CLASS("class"),
        CONST("const"),
        ...

com.sun.tools.javac.parser.Tokens

存放全部的定义token

/**
 * The names of all tokens.
 * 存放全部token的数组 
 */
private Name[] tokenName = new Name[TokenKind.values().length];

com.sun.tools.javac.util.Names

用来存储和表示解析后的词法,每个字符集合都会是一个Name对象,所有的对象都存储在Name.Table这个内部类中。

com.sun.tools.javac.parser.KeyWords

负责将字符集合对应到token集合中,如,package zxy.demo.com; Token.PACKAGE = package, Token.IDENTIFIER = zxy.demo.com,(这部分又分为读取第一个token,为zxy,判断下一个token是否为“.”,是的话接着读取下一个Token.IDENTIFIER类型的token,反复直至下一个token不是”.”,也就是说下一个不是Token.IDENIFIER类型的token,Token.SEMI = ;即这个TIDENTIFIER类型的token的Name读完),KeyWords类负责此任务。

package compile;
public class Cifa {
    int a;
    int c = a + 1;
}

转换的token流如下

《转载自https://www.cnblogs.com/wade-luffy/p/5925728.html》

JavaC 语法分析

将token流转换成句子

com.sun.tools.javac.tree.TreeMaker

所有语法节点都是由它生成的,根据Name对象构建一个语法节点

com.sun.tools.javac.tree.JCTree$JCIf

所有的节点都会继承jctree和实现**tree,譬如 JCIf extends JCTree.JCStatement implements IfTree

com.sun.tools.javac.tree.JCTree

重点介绍的三个属性

例子:

package compile;
public class Yufa {
    int a;
    private int c = a + 1;
    //getter
    public int getC() {
        return c;
    }
    //setter
    public void setC(int c) {
        this.c = c;
    }
}
《转载自https://www.cnblogs.com/wade-luffy/p/5925728.html》

说明:

JavaC语义分析器

流程:

入口是attribute()

实现类是com.sun.tools.javac.comp.Attr类和com.sun.tools.javac.comp.Check类

源码关键:

com.sun.tools.javac.comp.Enter

将java类中的符号输入到符号表中,主要是两个步骤:

com.sun.tools.javac.processing.JavacProcessingEnvironment

处理注解

com.sun.tools.javac.comp.Attr

检查语义的合理性并进行逻辑判断,类型是否匹配,是否初始化,泛型是否可推导,字符串常量合并

com.sun.tools.javac.comp.Check

协助attr,变量类型是否正确

com.sun.tools.javac.comp.Resolve

协助attr,变量方法类的访问是否合法,是否是静态变量

com.sun.tools.javac.comp.ConstFold

协助attr,常量折叠

com.sun.tools.javac.comp.Infer

协助attr,推导泛型

com.sun.tools.javac.comp.Flow

数据流分析和替换等价源代码的分析(即上面的进一步语义分析)

字节码生成:

进行了少量的代码添加和转换工作

把生成的信息(语法树、符号表)转化成字节码写到磁盘

“写到磁盘”由com.sun.tools.输出字节码,生成最终Class文件

入口generate()

实现类com.sun.tools.javac.jvm.Gen类

项目地址:

https://github.com/w296488320/OllJavaC

参考:

https://zhuanlan.zhihu.com/p/93939780

https://www.cnblogs.com/wade-luffy/p/5925728.html

https://blog.csdn.net/crabstew/article/details/89547472

https://www.sohu.com/a/212579385_100063030

http://blog.sina.com.cn/s/blog_17c534c120102xwv9.html


安卓逆向百级教程+全网最新js逆向视频+永久小蜜圈+永久售后群=1299

视频下载网盘
http://nas.alienhe.cn:5008/home.html
下载视频账号密码:
账号guest 密码world

Js试看:
http://oss.alienhe.cn/JS%E9%80%86%E5%90%91%E5%85%A5%E9%97%A8-%E5%B8%A6%E6%B0%B4%E5%8D%B0.mp4

上一篇 下一篇

猜你喜欢

热点阅读