汇编

2021-04-01 本文已影响0人爱笑的眼睛super

一、编译过程

程序的本质：执行过程

程序在硬盘(010101)->双击->装载进内存

编译

寄存器与内存：

通常，CPU会先将内存中的数据存储到寄存器中，然后再对寄存器中的数据进行运算
假设内存中有块红色内存空间的值是3，现在想把它的值加1，并将结果存储到黄色内存空间
CPU首先会将红色内存空间的值放到rax寄存器中:
movq 红色内存空间, %rax
然后让rax寄存器与1相加:
addq $0x1, %rax
最后将值赋值给内存空间:
movq %rax, 黄色内存空间

寄存器与内存

编程语言的发展：

发展

汇编语言和机器语言一一对应，每一条机器指令都有与之对应的汇编指令
汇编可以通过编译得到机器语言，机器语言可以通过反汇编得到汇编语言
高级语言可以通过编译得到汇编语言\机器语言，但汇编语言\机器语言机会不可能还原成高级语言

二、汇编基本语法

汇编的种类

8086汇编（16bit）
x86汇编（32bit）
x64汇编 (64bit)
ARM汇编（嵌入式、移动设备）
...

x86、x64汇编根据编译器的不同，有2种书写格式

Intel: Windows派系
AT&T :Unix派系

作为iOS开发工程师，最主要的汇编语言是

AT&T汇编 -> iOS模拟器
ARM汇编 -> iOS真机设备

常见的汇编指令

项目	AT&T	说明
寄存器命名	%rax	AT&T寄存器前加%
操作数顺序	movq %rax, %rdx	将rax的值赋值给rdx
常数\立即数	movq $3, %rax	将3赋值给rax
常数\立即数	movq $0x10, %rax	将0x10赋值给rax
内存赋值	movq $0xa, 0x1ff7(%rip)	将0xa赋值给地址为rip + 0x1ff7的内存空间
取内存地址	leaq -0x18(%rbp), %rax	将rbp – 0x18这个地址值赋值给rax
jmp指令	jmp *%rdx	call和jmp写法类似
	jmp 0x4001002
	jmp *(%rax)
操作数长度	movl %eax, %edx	l = long (32-bit integer or 64-bit floating point)
操作数长度	movb $0x10, %al	b = byte (8-bit)
操作数长度	leaw 0x10(%dx), %ax	w = word (16-bit)
		s = short (16-bit integer or 32-bit floating point)
		q = quad (64 bit)

JMP 无条件转移指令
CALL 过程调用常常伴随着retq 返回

寄存器

有16个常用寄存器

rax、rbx、rcx 、rdx、rsi、rdi、rbp、rsp
r8、r9、r10、r11、r12、r13、r14、r15

寄存器的具体用途

rax、rdx常作为函数返回值使用
rdi、rsi、rdx、rcx、r8、r9等寄存器常用于存放函数参数
rsp、rbp用于栈操作
rip作为指令指针
：存储着CPU下一条要执行的指令的地址
：一旦CPU读取一条指令，rip会自动指向下一条指令(存储下一条指令的地址)

寄存器的发展过程

64位x86处理器的寄存器.png

64和32位的差异是：
64位有16个寄存器，32位只有8个。但是32位前8个都有不同的命名，分别是e开头，而64位前8个使用了r代替e。e开头的寄存器命名依然可以直接运用于相应寄存器的低32位。而剩下的寄存器名则是从r8 - r15，其低位分别用d,w,b指定长度。
32位使用栈帧来作为传递的参数的保存位置，而64位使用寄存器，分别用rdi,rsi,rdx,rcx,r8,r9作为第1-6个参数。rax作为返回值

三、lldb常用指令

读取寄存器的值

修改寄存器的值

读取内存中的值

x/数量-格式-字节大小内存地址
x/3xw 0x0000010

修改内存中的值

memory write 内存地址数值
memory write 0x0000010 10

格式

x是16进制，f是浮点，d是十进制

字节大小

b – byte 1字节
h – half word 2字节
w – word 4字节
g – giant word 8字节

expression 表达式

可以简写:expr 表达式
expression $rax
expression $rax = 1

po 表达式

print 表达式
po/x $rax
po (int)$rax

lldb常用调试指令

thread step-over、next、n
单步运⾏行行，把子函数当做整体⼀一步执⾏行行(源码级别)
thread step-in、step、s
单步运⾏行行，遇到子函数会进⼊入子函数(源码级别)
thread step-inst-over、nexti、ni
单步运⾏行行，把子函数当做整体⼀一步执⾏行行(汇编级别)
thread step-inst、stepi、si
单步运⾏行行，遇到子函数会进⼊入子函数(汇编级别)
thread step-out、finish
直接执⾏行行完当前函数的所有代码，返回到上一个函数(遇到断点会卡住)

四、规律

内存地址格式为:0x4bdc(%rip)，一般是全局变量，全局区(数据段)
内存地址格式为:-0x78(%rbp)，一般是局部变量，栈空间
内存地址格式为:0x10(%rax)，一般是堆空间

五、汇编看闭包的本质

step1:证明堆空间里存放着num的值

先看一下没有捕获外部变量这段代码

代码1.png

对应的汇编代码.png

这两个指令的区别：
leaq rip+0x15 rax : 将rip+0x15这个地址给rax
movq rip+0x15 rax ：将rip+0x15这个地址里内容的前8个字节给rax

再看一下这个闭包的代码

代码2.png

对应的汇编代码.png

0x100001b81 <+33>: callq 0x10000724e ; symbol stub for: swift_allocObject

libswiftCore.dylib`swift_allocObject:
0x7fff7241dd22 <+34>: callq 0x7fff7241dc90 ; swift_slowAlloc

libswiftCore.dylib`swift_slowAlloc:

0x7fff7241dca4 <+20>: callq 0x7fff7249a28c ; symbol stub for: malloc
libsystem_malloc.dylib`malloc:
0x7fff72cb7cf0 <+16>: callq 0x7fff72cb7d12 ; malloc_zone_malloc

(lldb) register read rax
rax = 0x000000010062ab90

(lldb) x/5xg 0x000000010062ab90
0x10062ab90: 0x0000000100008150 0x0000000000000002
0x10062aba0: 0x0000000000000000 0x0000000100000000
0x10062abb0: 0x0000000000000000

(lldb) x/5xg 0x000000010062ab90
0x10062ab90: 0x0000000100008150 0x0000000200000002
0x10062aba0: 0x0000000000000001 0x0000000100000000
0x10062abb0: 0x0000000000000000

(lldb) x/5xg 0x000000010062ab90
0x10062ab90: 0x0000000100008150 0x0000000200000002
0x10062aba0: 0x0000000000000009 0x0000000100000000
0x10062abb0: 0x0000000000000000

先看一个例子
猜测swift_allocObject（size_t : size）至少要接收一个参数size,所以找参数，前面也有说过，一般rdi、rsi、rdx、rcx、r8、r9等寄存器常用语存放函数参数
目测这个代码最像，这个参数是告诉堆空间我需要24个字节，但是堆空间的规则分配内存是16的倍数