iOS llvm-2

2022-06-21  本文已影响0人  f8d1cf28626a

本文主要是理解LLVM的编译流程以及clang插件的开发

LLVM

传统编译器设计

ios的编译器架构

模块说明

LLVM的设计

LLVM设计的最重要方面是,使用通用的代码表示形式(IR),它是用来在编译器中表示代码的形式,所有LLVM可以为任何编程语言独立编写前端,并且可以为任意硬件架构独立编写后端,如下所示

LLVM的设计

通俗的一句话理解就是:LLVM的设计是前后端分离的,无论前端还是后端发生变化,都不会影响另一个

Clang简介

clang是LLVM项目中的一个子项目,它是基于LLVM架构图的轻量级编译器,诞生之初是为了替代GCC,提供更快的编译速度,它是负责C、C++、OC语言的编译器,属于整个LLVM架构中的 编译器前端,对于开发者来说,研究Clang可以给我们带来很多好处

LLVM编译流程
int test(int a,int b){
    return a + b + 3;
}


int main(int argc, const char * argv[]) {
    int a = test(1, 2);
    printf("%d",a);
    return 0;
}

//************命令************
 clang -ccc-print-phases main.m
 
 //************编译流程************
 //0 - 输入文件:找到源文件
+- 0: input, "main.m", objective-c

//1 - 预处理阶段:这个过程处理包括宏的替换,头文件的导入
+- 1: preprocessor, {0}, objective-c-cpp-output

//2 - 编译阶段:进行词法分析、语法分析、检测语法是否正确,最终生成IR
+- 2: compiler, {1}, ir

//3 - 后端:这里LLVM会通过一个一个的pass去优化,每个pass做一些事情,最终生成汇编代码
+- 3: backend, {2}, assembler

//4 - 汇编代码生成目标文件
+- 4: assembler, {3}, object

//5 - 链接:链接需要的动态库和静态库,生成可执行文件
+- 5: linker, {4}, image(镜像文件)

//6 - 绑定:通过不同的架构,生成对应的可执行文件
6: bind-arch, "x86_64", {5}, image

下面分别针对上述流程来解释,其中0主要是输入文件,即找到源文件。这里不做过多说明

一、预处理编译阶段

//在终端直接查看替换结果
clang -E main.m

//生成对应的文件查看替换后的源码
clang -E main.m >> main2.m

需要注意的是:

二、编译阶段

编译阶段主要是进行词法、语法等的分析和检查,然后生成中间代码IR

1、词法分析

预处理完成后就会进行词法分析,这里会把代码切成一个个token,比如大小括号、等于号还有字符串等

clang -fmodules -fsyntax-only -Xclang -dump-tokens main.m
clang -isysroot (自己SDK路径) -fmodules -fsyntax-only -Xclang -dump-tokens main.m

 clang -isysroot /Applications/Xcode.app/Contents/Developer/Platforms/iPhoneSimulator.platform/Developer/SDKs/iPhoneSimulator14.1.sdk/ -fmodules -fsyntax-only -Xclang -dump-tokens main.m

以下是代码的词法分析结果


2、语法分析

词法分析完成后就是语法分析,它的任务是验证语法是否正确,在词法分析的基础上将单词序列组合成各类此法短语,如程序、语句、表达式 等等,然后将所有节点组成抽象语法树(Abstract Syntax Tree AST),语法分析程序判断程序在结构上是否正确

clang -fmodules -fsyntax-only -Xclang -ast-dump main.m
 clang -isysroot (自己SDK路径) -fmodules -fsyntax-only -Xclang -ast-dump main.m

 clang -isysroot /Applications/Xcode.app/Contents/Developer/Platforms/iPhoneSimulator.platform/Developer/SDKs/iPhoneSimulator14.1.sdk/ -fmodules -fsyntax-only -Xclang -ast-dump main.m

下面是语法分析的结果


其中,主要说明几个关键字的含义
-F unctionDecl 函数

3、生成中间代码IR

完成以上步骤后,就开始生成中间代码IR了,代码生成器(Code Generation)会将语法树自顶向下遍历逐步翻译成LLVM IR,

clang -S -fobjc-arc -emit-llvm main.m

//以下是IR基本语法
@ 全局标识
% 局部标识
alloca 开辟空间
align 内存对齐
i32 32bit,4个字节
store 写入内存
load 读取数据
call 调用函数
ret 返回

下面是生成的中间代码.ll文件

clang -Os -S -fobjc-arc -emit-llvm main.m -o main.ll

这是优化后的中间代码

clang -emit-llvm -c main.ll -o main.bc

三、后端

LLVM在后端主要是会通过一个个的Pass去优化,每个Pass做一些事情,最终生成汇编代码

生成汇编代码
 clang -S -fobjc-arc main.ll -o main.s 
 或
 clang -S -fobjc-arc main.bc -o main.s
clang -Os -S -fobjc-arc main.m -o main.s

四、生成目标文件

clang -fmodules -c main.s -o main.o

可以通过nm命令,查看下main.o中的符号

$xcrun nm -nm main.o

五、链接

链接主要是链接需要的动态库和静态库,生成可执行文件,其中

连接器把编译生成的.o文件和 .dyld .a文件链接,生成一个mach-o文件

clang main.o -o main

查看链接之后的符号

xcrun nm -nm main

结果如下所示,其中的undefined表示会在运行时进行动态绑定

file main 
// 打印结果:main:Mach-O 64-bit executable x86_64

./main
// 打印结果 :6%

六、绑定

绑定主要是通过不同的架构,生成对应的mach-o格式执行文件

总结

综上,所述,LLVM的编译流程如下图所示

Clang插件开发

1、准备工作

由于国内网络限制,需要借助镜像下载llvm的源码,此处为镜像链接

git clone https://mirrors.tuna.tsinghua.edu.cn/git/llvm/llvm.git
cd ../projects

git clone https://mirrors.tuna.tsinghua.edu.cn/git/llvm/compiler-rt.git

git clone https://mirrors.tuna.tsinghua.edu.cn/git/llvm/libcxx.git 

git clone https://mirrors.tuna.tsinghua.edu.cn/git/llvm/libcxxabi.git
cd ../tools/clang/tools

git clone https://mirrors.tuna.tsinghua.edu.cn/git/llvm/clang-tools-extra.git

2、LLVM编译

由于最新的LLVM只支持cmake来编译,所以需要安装cmake

安装cmake
brew list
brew install cmake
编译LLVM

有两种编译方式:

通过xcode编译LLVM(方式一)

mkdir build_xcode

cd build_xcode

cmake -G Xcode ../llvm

使用xcode编译Clang

替代方案:选择手动创建Schemes,然后编译编译Clang + ClangTooling即可

通过ninja编译LLVM(方式二)

brew install ninja
cd llvm_build

//注意DCMAKE_INSTALL_PREFIX后面不能有空格
cmake -G Ninja ../llvm -DCMAKE_INSTALL_PREFIX= 安装路径(本机为/ Users/xxx/xxx/LLVM/llvm_release)
ninja

ninja install

3、创建插件

在HKPlugin目录下新建两个文件,分别是HKPlugi.cpp 和CMakeLists.txt,并在CMakeLists.txt中加上以下代码


//1、通过终端在HKPlugin目录下的创建
touch HKPlugin.cpp

touch CMakeLists.txt

//2、CMakeLists.txt中添加以下代码
add_llvm_library( HKPlugin MODULE BUILDTREE_ONLY 
    HKPlugin.cpp
)
cmake -G Xcode ../llvm
编写插件代码

在HKPlugin目录下的HKPlugin.cpp文件中,加入以下代码


#include <iostream>
#include "clang/AST/AST.h"
#include "clang/AST/DeclObjC.h"
#include "clang/AST/ASTConsumer.h"
#include "clang/ASTMatchers/ASTMatchers.h"
#include "clang/Frontend/CompilerInstance.h"
#include "clang/ASTMatchers/ASTMatchFinder.h"
#include "clang/Frontend/FrontendPluginRegistry.h"

using namespace clang;
using namespace std;
using namespace llvm;
using namespace clang::ast_matchers;

//命名空间,和插件同名
namespace HKPlugin {

//第三步:扫描完毕的回调函数
//4、自定义回调类,继承自MatchCallback
class HKMatchCallback: public MatchFinder::MatchCallback {
    
private:
    //CI传递路径:HKASTAction类中的CreateASTConsumer方法参数 - HKConsumer的构造函数 - HKMatchCallback的私有属性,通过构造函数从CJLASTConsumer构造函数中获取

    CompilerInstance &CI;
    
    //判断是否是用户源文件
    bool isUserSourceCode(const string filename) {
        //文件名不为空
        if (filename.empty()) return  false;
        //非xcode中的源码都认为是用户的
        if (filename.find("/Applications/Xcode.app/") == 0) return false;
        return  true;
    }

    //判断是否应该用copy修饰
    bool isShouldUseCopy(const string typeStr) {
        //判断类型是否是NSString | NSArray | NSDictionary
        if (typeStr.find("NSString") != string::npos ||
            typeStr.find("NSArray") != string::npos ||
            typeStr.find("NSDictionary") != string::npos/*...*/)
        {
            return true;
        }
        
        return false;
    }
    
public:
    HKMatchCallback(CompilerInstance &CI) :CI(CI) {}
    
    //重写run方法
    void run(const MatchFinder::MatchResult &Result) {
        //通过result获取到相关节点 -- 根据节点标记获取(标记需要与CJLASTConsumer构造方法中一致)
        const ObjCPropertyDecl *propertyDecl = Result.Nodes.getNodeAs<ObjCPropertyDecl>("objcPropertyDecl");
        //判断节点有值,并且是用户文件
        if (propertyDecl && isUserSourceCode(CI.getSourceManager().getFilename(propertyDecl->getSourceRange().getBegin()).str()) ) {
            //15、获取节点的描述信息
            ObjCPropertyDecl::PropertyAttributeKind attrKind = propertyDecl->getPropertyAttributes();
            //获取节点的类型,并转成字符串
            string typeStr = propertyDecl->getType().getAsString();
//            cout<<"---------拿到了:"<<typeStr<<"---------"<<endl;
            
            //判断应该使用copy,但是没有使用copy
            if (propertyDecl->getTypeSourceInfo() && isShouldUseCopy(typeStr) && !(attrKind & ObjCPropertyDecl::OBJC_PR_copy)) {

                //使用CI发警告信息
                //通过CI获取诊断引擎
                DiagnosticsEngine &diag = CI.getDiagnostics();

                //通过诊断引擎 report报告 错误,即抛出异常
                /*
                错误位置:getBeginLoc 节点开始位置
                错误:getCustomDiagID(等级,提示)
                 */
                diag.Report(propertyDecl->getBeginLoc(), diag.getCustomDiagID(DiagnosticsEngine::Warning, "%0 - 这个地方推荐使用copy!!"))<< typeStr;
            }
        }
    }
};


//第二步:扫描配置完毕
//3、自定义HKASTConsumer,继承自ASTConsumer,用于监听AST节点的信息 -- 过滤器
class HKASTConsumer: public ASTConsumer {
private:
    //AST节点的查找过滤器
    MatchFinder matcher;
    //定义回调类对象
    HKMatchCallback callback;
    
public:
    //构造方法中创建matcherFinder对象
    HKASTConsumer(CompilerInstance &CI) : callback(CI) {
        //添加一个MatchFinder,每个objcPropertyDecl节点绑定一个objcPropertyDecl标识(去匹配objcPropertyDecl节点)
        //回调callback,其实是在HKMatchCallback里面重写run方法(真正回调的是回调run方法)
        matcher.addMatcher(objcPropertyDecl().bind("objcPropertyDecl"), &callback);
    }
    
    //实现两个回调方法 HandleTopLevelDecl 和 HandleTranslationUnit
    //解析完一个顶级的声明,就回调一次(顶级节点,相当于一个全局变量、函数声明)
    bool HandleTopLevelDecl(DeclGroupRef D){
//        cout<<"正在解析..."<<endl;
        return  true;
    }
    
    //整个文件都解析完成的回调
    void HandleTranslationUnit(ASTContext &context) {
//        cout<<"文件解析完毕!"<<endl;
        //将文件解析完毕后的上下文context(即AST语法树) 给 matcher
        matcher.matchAST(context);
    }
};

//2、继承PluginASTAction,实现我们自定义的Action,即自定义AST语法树行为
class HKASTAction: public PluginASTAction {
    
public:
    //重载ParseArgs 和 CreateASTConsumer方法
    bool ParseArgs(const CompilerInstance &ci, const std::vector<std::string> &args) {
        return true;
    }
    
    //返回ASTConsumer类型对象,其中ASTConsumer是一个抽象类,即基类
    /*
     解析给定的插件命令行参数。
     - param CI 编译器实例,用于报告诊断。
     - return 如果解析成功,则为true;否则,插件将被销毁,并且不执行任何操作。该插件负责使用CompilerInstance的Diagnostic对象报告错误。
     */
    unique_ptr<ASTConsumer> CreateASTConsumer(CompilerInstance &CI, StringRef iFile) {
        //返回自定义的CJLASTConsumer,即ASTConsumer的子类对象
        /*
         CI用于:
         - 判断文件是否使用户的
         - 抛出警告
         */
        return unique_ptr<HKASTConsumer> (new HKASTConsumer(CI));
    }
    
};

}

//第一步:注册插件,并自定义AST语法树Action类
//1、注册插件
static FrontendPluginRegistry::Add<HKPlugin::HKASTAction> HK("HKPlugin", "This is HKPlugin");

其原理主要分为三步

然后在终端中测试插件

//命令格式
自己编译的clang文件路径  -isysroot /Applications/Xcode.app/Contents/Developer/Platforms/iPhoneSimulator.platform/Developer/SDKs/iPhoneSimulator14.1.sdk/ -Xclang -load -Xclang 插件(.dyld)路径 -Xclang -add-plugin -Xclang 插件名 -c 源码路径

//例子
/Users/XXX/Desktop/build_xcode/Debug/bin/clang -isysroot /Applications/Xcode.app/Contents/Developer/Platforms/iPhoneSimulator.platform/Developer/SDKs/iPhoneSimulator14.1.sdk/ -Xclang -load -Xclang /Users/XXXX/Desktop/build_xcode/Debug/lib/CJLPlugin.dylib -Xclang -add-plugin -Xclang CJLPlugin -c /Users/XXXX/Desktop/XXX/XXXX/测试demo/testClang/testClang/ViewController.m
测试插件

4、Xcode集成插件

加载插件

 -Xclang -load -Xclang (.dylib)动态库路径 -Xclang -add-plugin -Xclang HKPlugin

设置编译器

编译错误
上一篇下一篇

猜你喜欢

热点阅读