6.MachO
MachO文件
MachO文件
MachO文件结构
DYLD
Mach-O其实是Mach Object文件格式的缩写,是mac以及iOS上可执行文件的格式,类似于windows上的PE格式 (Portable Executable ), linux上的elf格式 (Executable and Linking Format)
Mach-O文件格式
1、Mach-O为Mach object文件格式的缩写,它是一种用于可执行文件、目标代码、动态库的文件格式。作为a.out格式的替代,Mach-O提供了更强的扩展性。
2、属于MachO格式的常见文件
•目标文件.o
•库文件
•.a
•.dylib
•Framework
•可执行文件
•dyld
•.dsym
3、File指令
•通过$file 文件路径
查看文件类型
例子:
$ vim test.c
$ clang -c test.c (生成 .o文件)
$ file test.o ( test.o: Mach-O 64-bit object x86_64 ,可以看到test.o 的类型)
$ clang test.o
那么a.out 与 test.o 有什么区别呢?
如果有多个文件的话,每一个源文件都会编译出对应的.o文件,多个.o文件链接成一个可执行文件。
XCode debug模式编译调试到真机上的app是单一架构,比如iPhone X 是arm 64架构的。release 模式编译的话,如果支持的低版本的系统的话,会有多个架构。
arm v7 、 arm v7s (5s) 都是32位的, arm 64 、arm 64e 都是64 位的。
标红部分为当前架构,是个环境变量
是否值编译当前架构,debug时只编译当前架构,release 时编译所有架构。
这里的架构会比我们编译出来的架构多,那是因为编译会选择 valid 和 architectures的焦交集,如果想编译出更多的架构,可以手动添加,比如添加armv7s
通用二进制文件(Universal binary)
- 苹果公司提出的一种程序代码。能同时适用多种架构的二进制文件
- 同一个程序包中同时为多种架构提供最理想的性能。
- 因为需要储存多种代码,通用二进制应用程序通常比单一平台二进制的程序要大。
- 但是 由于两种架构有共通的非执行资源,所以并不会达到单一版本的两倍之多。
- 而且由于执行中只调用一部分代码,运行起来也不需要额外的内存。
通用二进制文件、胖二进制文件(fat binary)
lipo命令
1、使用lifo-info 可以查看MachO文件包含的架构
$ lipo-info MachO文件
2、使用lifo–thin拆分某种架构
$ lipoMachO文件 –thin 架构 –output输出文件路径
3、使用lipo-create 合并多种架构
$ lipo-create MachO1 MachO2 -output 输出文件路径
1、拆分
2、合并
拆分和合并的源machO 是一样的。md5是一样的。
拆分出来的单一架构的machO 文件大小之和与合并后的machO文件大小之和是不一样的,有可能合并后的大于单一的总和,代码是不共用的,资源是公用的。
MachO文件结构
Mach-O 的组成结构如图所示包括了
•Header 包含该二进制文件的一般信息
•字节顺序、架构类型、加载指令的数量等。
•使得可以快速确认一些信息,比如当前文件用于32位还是64位,对应的处理器是什么、文件类型是什么
•Load commands 一张包含很多内容的表
•内容包括区域的位置、符号表、动态符号表等。
•Data 通常是对象文件中最大的部分
•包含Segement的具体数据
如果是fat binary 胖二进制文件的话,是一个fat header,然后是不同的架构的executable叠在一起,打开每一个executable将是Mach Header、Load commands 和 Data 数据。
也可以通过otool 工具查看二进制文件, $ otool 查看指令
$ otool -f MachO (查看header信息)
Data段中包含:符号表、类名称、方法名称、属性、常量、
Load commands段: 代码段、数据段size、link、需要的三方库
手机加载过程中只会加载对应架构的machO文件,file offset是相当于当前的machO的地址的偏移。
从下面两张图可以看出,cpu读整个文件从push {r7,lr} 开始的。
Header的数据结构
查看 command + shift + o 搜索 loader
file type 类型有以下文件类型
mach header 后面的4个字节就是load commands开始了
weak binding 弱绑定的数据,lazy binding 懒绑定的数据
比如调用 NSLog 函数, dyld 实现 函数与符号之间的绑定
如果定义的静态字符串,是在运行的时候确定地址的。每个mach-o创建的静态区在运行时不在mach-o中,在静态区。
符号表中的符号是存在于数据段,可以共用。比如objc_msgSend 只有在使用的时候进行符号绑定。
PIC技术,位置代码独立。
总结:
- machO是一种文件格式
-包含:可执行文件、动态库、静态库、目标文件、dyld等
- 可执行文件
-查看某个文件:file
-通用二进制文件,多种架构,可以在多种架构上运行
- lipo命令
- thin 可以拆分架构
- creat 合并架构
- machO结构
- Header
- 用于快速确认文件:cpu类型、文件类型
- LoadCommands
- 用于指示加载器如何加载我们的二进制文件,依赖那些三方、系统的库
- Data
- 存放数据:代码、字符串常量、类、方法等
header 紧紧链接着 LoadCommands ,但是 LoadCommands 与Data 之间有很大一段空间。