6.MachO

2019-11-12  本文已影响0人  JoyChenSeven


MachO文件

MachO文件

MachO文件结构

DYLD

Mach-O其实是Mach Object文件格式的缩写,是mac以及iOS上可执行文件的格式,类似于windows上的PE格式 (Portable Executable ), linux上的elf格式 (Executable and Linking Format)

Mach-O文件格式

1、Mach-O为Mach object文件格式的缩写,它是一种用于可执行文件、目标代码、动态库的文件格式。作为a.out格式的替代,Mach-O提供了更强的扩展性。

2、属于MachO格式的常见文件

•目标文件.o

•库文件

•.a

•.dylib

•Framework

•可执行文件

•dyld

•.dsym

3、File指令

•通过$file 文件路径

查看文件类型

例子:

$ vim test.c

$ clang -c test.c  (生成 .o文件)

$ file test.o  ( test.o: Mach-O 64-bit object x86_64 ,可以看到test.o 的类型)

$ clang test.o

那么a.out 与 test.o 有什么区别呢?

如果有多个文件的话,每一个源文件都会编译出对应的.o文件,多个.o文件链接成一个可执行文件。

XCode debug模式编译调试到真机上的app是单一架构,比如iPhone X 是arm 64架构的。release 模式编译的话,如果支持的低版本的系统的话,会有多个架构。

arm v7 、 arm v7s (5s) 都是32位的, arm 64 、arm 64e 都是64 位的。

标红部分为当前架构,是个环境变量

是否值编译当前架构,debug时只编译当前架构,release 时编译所有架构。

这里的架构会比我们编译出来的架构多,那是因为编译会选择 valid 和 architectures的焦交集,如果想编译出更多的架构,可以手动添加,比如添加armv7s

通用二进制文件(Universal binary)

- 苹果公司提出的一种程序代码。能同时适用多种架构的二进制文件

- 同一个程序包中同时为多种架构提供最理想的性能。

- 因为需要储存多种代码,通用二进制应用程序通常比单一平台二进制的程序要大。

- 但是 由于两种架构有共通的非执行资源,所以并不会达到单一版本的两倍之多。

- 而且由于执行中只调用一部分代码,运行起来也不需要额外的内存。

通用二进制文件、胖二进制文件(fat binary)

lipo命令

1、使用lifo-info 可以查看MachO文件包含的架构

 $ lipo-info MachO文件

2、使用lifo–thin拆分某种架构

 $ lipoMachO文件 –thin 架构 –output输出文件路径

3、使用lipo-create  合并多种架构

$ lipo-create MachO1   MachO2  -output 输出文件路径

1、拆分

2、合并

拆分和合并的源machO 是一样的。md5是一样的。

拆分出来的单一架构的machO 文件大小之和与合并后的machO文件大小之和是不一样的,有可能合并后的大于单一的总和,代码是不共用的,资源是公用的。

MachO文件结构

Mach-O 的组成结构如图所示包括了

•Header 包含该二进制文件的一般信息

     •字节顺序、架构类型、加载指令的数量等。

     •使得可以快速确认一些信息,比如当前文件用于32位还是64位,对应的处理器是什么、文件类型是什么

•Load commands 一张包含很多内容的表

      •内容包括区域的位置、符号表、动态符号表等。

•Data 通常是对象文件中最大的部分

      •包含Segement的具体数据

如果是fat binary 胖二进制文件的话,是一个fat header,然后是不同的架构的executable叠在一起,打开每一个executable将是Mach Header、Load commands 和 Data 数据。

也可以通过otool 工具查看二进制文件, $ otool 查看指令

$ otool -f MachO  (查看header信息)

Data段中包含:符号表、类名称、方法名称、属性、常量、

Load commands段: 代码段、数据段size、link、需要的三方库

手机加载过程中只会加载对应架构的machO文件,file offset是相当于当前的machO的地址的偏移。

从下面两张图可以看出,cpu读整个文件从push {r7,lr} 开始的。

Header的数据结构

查看 command + shift + o  搜索 loader 

file type 类型有以下文件类型

mach header 后面的4个字节就是load commands开始了

weak binding 弱绑定的数据,lazy binding 懒绑定的数据

比如调用 NSLog 函数, dyld 实现 函数与符号之间的绑定

如果定义的静态字符串,是在运行的时候确定地址的。每个mach-o创建的静态区在运行时不在mach-o中,在静态区。

符号表中的符号是存在于数据段,可以共用。比如objc_msgSend 只有在使用的时候进行符号绑定。

PIC技术,位置代码独立。

总结:

- machO是一种文件格式

    -包含:可执行文件、动态库、静态库、目标文件、dyld等 

          - 可执行文件

          -查看某个文件:file

         -通用二进制文件,多种架构,可以在多种架构上运行

    - lipo命令

           - thin 可以拆分架构

          - creat 合并架构

-  machO结构

    - Header 

         - 用于快速确认文件:cpu类型、文件类型

 - LoadCommands

        - 用于指示加载器如何加载我们的二进制文件,依赖那些三方、系统的库

  - Data

      - 存放数据:代码、字符串常量、类、方法等

header 紧紧链接着 LoadCommands ,但是 LoadCommands 与Data 之间有很大一段空间。

上一篇下一篇

猜你喜欢

热点阅读