第三章(3)
数组分配和访问
T A[N]
T代表数组存放的元素类型,在内存中分配连续的L*N字节的空间,其中L是指类型T的大小。A作为指向数组开头的指针。
访问数组的汇编指令:
例如:int E[N],E的地址存放在%rdx中,i存放在%rcx中
E[i]的访问可以表示为 movl (%rdx,%rcx,4),%eax
数组的嵌套
声明数组 T D[R][C],则D[i][j]可以表示为 D地址 + L( i * C + j )
汇编表示:
int A[5][3]
则访问A[i][j]的汇编代码为:
假设: A in %rdi , i in %rsi , j in %rdx
leaq (%rsi,%rsi, 2) ,%rax # compute 3i
leaq (%rdi,%rax, 4) , %rax # compute A地址 + 12i
movl (%rax,%rdx,4), %eax # M[A地址 + 12i + 4j] 即 A地址 + 4* (i*3 + j)
结构体
struct
里面的元素是按照声明顺序排列在内存中的,数组也会展开。
如:
image.png数据对齐:
必须保证数据的偏移地址是对应的倍数:
image.png如
struct person{
int i;
int j;
char c;
};
struct person p;
sizeof(p)结果是12字节。考虑 struct person p[10]。如果c占一个字节,那么访问p[1].i的地址就不是4的倍数了,变成了9。所以要将c的尾部进行补齐操作,所以大小是12字节。
struct person{
int i;
int j;
char *c;
};
上述结构体大小为16。因为c刚好是位于8的倍数。
考虑:
struct person{
int i;
char *c;
int j;
};
大小则是24字节,i必须要进行补齐操作,让c位于8的倍数位置,又因为在数组里面,c必须也是8的大小,所以j也必须进行补齐。
缓冲区溢出操作
由于栈帧保存了返回地址,调用函数前,某些寄存器的值等等。所以如果通过c函数gets(buff)去读取输入到buff中,由于buff也是保存在栈顶,所以写入的时候如果超过了分配的空间,而c语言又不会对边界进行检查,所以是可以写入的,那么长度超过分配的大小后,就会将栈中的值覆盖掉,可能覆盖掉寄存器的值,甚至是返回地址的值,使函数返回后调到另外一个地方继续执行。攻击者利用这个可以访问无法直接调用的函数,导致各种意外发生。
防止方法:
1. 随机栈的起始位置
2. 栈保护。在分配的栈空间上保存一个哨兵值(从某个只读内存区域读取过来的),在返回之前,看看哨兵值是否和只读区域的相同,相同才返回,不然就发生异常,进入错误处理程序。
3. 限制可执行代码区域。
上面的方法都是由编译器或操作系统完成的,无需程序员主动关心。
浮点指令
浮点数有另外一组寄存器,每个寄存器大小为256位,低128位在汇编里面表示为xmm,其中单精度浮点数用xmm的低32位表示,双精度用xmm的低64位表示。
不改变二进制数据,进行浮点数移动操作,指令如下:
image.png将浮点数与整数互相转化的指令:
image.png浮点数转化成整数时,会把值向0进行舍入。
注意,double *a是一个指针,不是浮点数,所以放在通用寄存器里面,不用放在xmm里面。