详解 Mach-O 文件结构

2021-06-09  本文已影响0人  云霄_云霄

前言

在学习iOS逆向的过程中,发现在解密可执行文件 dumpdecrypted 砸壳原理时需要用到 Mach-O 相关知识,在动态库注入过程中也需要理解 Mach-O 可执行文件的文件结构,那么有必要系统学习记录 Mach-O 文件的组成结构。

什么是 Mach-O

Mach-O,是 Mach object 文件格式的缩写,是一种可执行文件、目标代码、共享程序库、动态加载代码和核心 dump 。是 a.out 格式的一种替代。 Mach-O 提供更多的可扩展性和更快的符号表信息存取。Mach-O 应用在基于 Mach 核心的系统上,目前 NeXTSTEP、Darwin、Mac OS X(iPhone)都是使用这种可执行文件格式。熟悉 Mach-O 文件格式,有助于了解苹果底层软件运行机制,更好的掌握 dyld 加载 Mach-O 的步骤,为自己动手开发 Mach-O 相关的加解密工具注入工具打下基础。

属于 MachO 格式的常见文件

通用二进制文件(Universal binary)

lipo 命令的使用

Mach-O 文件结构

image.png

Mach-O 的组成结构如图所示

1、Header 的数据结构

header.png
header_info.png

2、Load Commands 的部分信息

Load Commands.png LoadCommands2.png

3、Data 数据区

数据段 segment

存放数据:代码、字符常量、类、方法等, 可以拥有多个 segment ,每个 segment 可以有零到多个 section 。每个段都有一段虚拟地址映射到进程的地址空间,先来看下数据结构, LC_SEGMENT_64 定义了一个 64 位的 segment,其定义如下:

Data.png

dyldfileoff (基于当前架构的文件偏移量)处 fileSize 大小的内容加载到虚拟内存的 vmaddr 处,其大小为 vmsizesegment 的权限由 initprot 进行初始化。
LC_SEGMENT_64 包括了一下 4 种:

Section 段
在 Segment 里面会包含不同的 section ,其结构如下图:
Section.png
__TEXT SegmentSection:
__TEXT.png
__DATA SegmentSection:
__DATA.png
Symbol Table 符号表,这个是重点中的重点,符号表是将地址和符号联系起来的桥梁。符号表并不能直接存储符号,而是存储符号位于字符串表的位置。
String Table.png
String Table 字符串表所有的变量名、函数名等,都以字符串的形式存储在字符串表中。
String Table.png
Dynamic Symbol Table 动态符号表,动态符号表并不存储符号信息,而是存储其位于符号表的偏移信息。Fishhook 源码看起来比较复杂主要是因为 hook 的是动态链接的函数,索引和链接关系比较绕。但是我们自己编写的C函数不是动态链接的,而是在编译链接后代码指令就存储在文件内部的函数,因此不会用到动态符号表。接下来我们以 static 函数为例,看看如何动态的查找自己编写的函数地址。
Dynamic Symbol Table.png

关于 Mach-O 更具体的扔然需要我们去探究,只有知道了底层我们才能有更多的方法去解决问题,并且优化问题。

上一篇下一篇

猜你喜欢

热点阅读