逆向安全

初识汇编

2022-07-06  本文已影响0人  晨曦的简书

在逆向开发中,非常重要的一个环节就是静态分析,这里以 iOS 系统为例,首先我们是逆向 iOS 系统上面的 APP,那么我们知道,一个 APP 安装在手机上面的可执行文件本质上是二进制文件,因为 iPhone 手机本质上执行的指令是二进制,是由手机上的 CPU 执行的,所以静态分析是建立在分析二进制文件上面,所以我们要从基础的汇编开始了解。

汇编语言的发展

机器语言

由 0 和 1 组成的机器指令。

汇编语言(assembly language)

使用助记符代替机器语言,如:

高级语言(High-level programming language)

C\C++\Java\OC\Swift,更加接近人类的自然语言,比如 C 语言:

我们的代码在终端设备上是这样的过程:

汇编语言的特点

汇编的用途

越底层越单纯!真正的程序员都需要了解的一门非常重要的语言,汇编!

汇编语言的种类

架构 设备
armv6 iPhone, iPhone2, iPhone3G, 第一代、第二代 iPod Touch
armv7 iPhone3GS, iPhone4, iPhone4S,iPad, iPad2, iPad3(The New iPad), iPad mini, iPod Touch 3G, iPod Touch4
armv7s iPhone5, iPhone5C, iPad4(iPad with Retina Display)
arm64 iPhone5S 以后 iPhoneX , iPad Air, iPad mini2以后

几个必要的常识

总线

举个例子:

内存



进制

学习进制的障碍:

很多人学不好进制,原因是总以十进制为依托去考虑其他进制,需要运算的时候也总是先转换成十进制,这种学习方法是错误的。
我们为什么一定要转换十进制呢?仅仅是因为我们对十进制最熟悉,所以才转换。
每一种进制都是完美的,想学好进制首先要忘掉十进制,也要忘掉进制间的转换!

进制的定义

进制的运算

八进制加法表

 0  1  2  3  4  5  6  7 
10 11 12 13 14 15 16 17
20 21 22 23 24 25 26 27
...

1+1 = 2                     
1+2 = 3   2+2 = 4               
1+3 = 4   2+3 = 5   3+3 = 6
1+4 = 5   2+4 = 6   3+4 = 7   4+4 = 10  
1+5 = 6   2+5 = 7   3+5 = 10  4+5 = 11  5+5 = 12
1+6 = 7   2+6 = 10  3+6 = 11  4+6 = 12  5+6 = 13  6+6 = 14
1+7 = 10  2+7 = 11  3+7 = 12  4+7 = 13  5+7 = 14  6+7 = 15  7+7 = 16

八进制乘法表

0 1 2 3 4 5 6 7 10 11 12 13 14 15 16 17 20 21 22 23 24 25 26 27...
1*1 = 1                     
1*2 = 2   2*2 = 4               
1*3 = 3   2*3 = 6   3*3 = 11    
1*4 = 4   2*4 = 10  3*4 = 14  4*4 = 20
1*5 = 5   2*5 = 12  3*5 = 17  4*5 = 24  5*5 = 31
1*6 = 6   2*6 = 14  3*6 = 22  4*6 = 30  5*6 = 36  6*6 = 44
1*7 = 7   2*7 = 16  3*7 = 25  4*7 = 34  5*7 = 43  6*7 = 52  7*7 = 61

二进制的简写形式

       二进制: 1 0 1 1 1 0 1 1 1 1 0 0
三个二进制一组: 101 110 111 100
       八进制:   5   6   7   4
四个二进制一组: 1011 1011 1100
     十六进制:    b    b    c

二进制:从0 写到 1111
0000 0001 0010 0011 0100 0101 0110 0111 1000 1001 1010 1011 1100 1101 1110 1111
这种二进制使用起来太麻烦,改成更简单一点的符号:
0 1 2 3 4 5 6 7 8 9 A B C D E F 这就是十六进制了

数据的宽度

数学上的数字,是没有大小限制的,可以无限的大。但在计算机中,由于受硬件的制约,数据都是有长度限制的(我们称为数据宽度),超过最多宽度的数据会被丢弃。

#import <UIKit/UIKit.h>
#import "AppDelegate.h"

int test(){
    int cTemp = 0x1FFFFFFFF;
    return cTemp;
}

int main(int argc, char * argv[]) {
    printf("%x\n",test());
    @autoreleasepool {
        return UIApplicationMain(argc, argv, nil, NSStringFromClass([AppDelegate class]));
    }
}

计算机中常见的数据宽度

那么计算机存储数据它会分为有符号数和无符号数,那么关于这个看图就理解了!

无符号数,直接换算!
有符号数:
正数:  0    1    2    3    4    5    6    7 
负数:  F    E    D    B    C    A    9    8
      -1   -2   -3   -4   -5   -6   -7   -8

CPU&寄存器

内部部件之间由总线连接:


CPU 除了有控制器、运算器还有寄存器。其中寄存器的作用就是进行数据的临时存储。

CPU 的运算速度是非常快的,为了性能 CPU 在内部开辟一小块临时存储区域,并在进行运算时先将数据从内存复制到这一小块临时存储区域中,运算时就在这一小快临时存储区域内进行。我们称这一小块临时存储区域为寄存器。

对于 arm64CPU 来说, 如果寄存器以 x 开头则表明的是一个 64 位的寄存器,如果以 w 开头则表明是一个 32 位的寄存器,在系统中没有提供 16 位和 8 位的寄存器供访问和使用。其中 32 位的寄存器是 64 位寄存器的低 32 位部分并不是独立存在的。

浮点和向量寄存器

因为浮点数的存储以及其运算的特殊性,CPU 中专门提供浮点数寄存器来处理浮点数

现在的 CPU 支持向量运算,(向量运算在图形处理相关的领域用得非常的多)为了支持向量计算系统了也提供了众多的向量寄存器。

通用寄存器

注意:
了解过 8086 汇编的同学知道,有一种特殊的寄存器段寄存器:CS,DS,SS,ES 四个寄存器来保存这些段的基地址,这个属于 Intel 架构 CPU 中,在 ARM 中并没有

pc寄存器(program counter)

高速缓存

iPhoneX 上搭载的 ARM 处理器 A11 它的 1 级缓存的容量是 64KB,2级缓存的容量 8M

CPU 每执行一条指令前都需要从内存中将指令读取到 CPU 内并执行。而寄存器的运行速度相比内存读写要快很多,为了性能,CPU 还集成了一个高速缓存存储区域,当程序在运行时,先将要执行的指令代码以及数据复制到高速缓存中去(由操作系统完成),CPU 直接从高速缓存依次读取指令来执行。

bl指令

上一篇下一篇

猜你喜欢

热点阅读