8086汇编笔记
汇编指令:机器码的助记符,有对应的机器码
伪指令:没有对应的机器码,由编译器执行,计算机并不执行
其它符号:+-*/等由编译器识别,没有对应的机器码
每一种CPU都有自己的汇编指令集
CPU可以直接使用的信息在存储器中存放
在存储器中指令和数据没有任何区别,都是二进制信息
存储单元从零开始顺序编号
一个存储单元可以存储8个bit,即8位二进制数
计算机最小信息单位是bit,1bit= 1个二进制位,8bit = 1Byte(字节)
1KB = 1024B,1MB = 1024KB,1GB = 1024MB,1TB = 1024GB
地址总线的宽度决定了CPU的寻址能力
数据总线的宽度决定了CPU与其它器件间一次数据传送量
控制总线的宽度决定了CPU对其它器件的控制能力
数据总线
一个CPU有多少根数据总线,就可以说它是多少位的CPU,
比如32位CPU有32根数据总线
每根总线每次可以传递1个bit
所以32位的CPU一次最多可以传送4个字节的数据量
1比特 = 1个二进制位
1字节 = 8比特 (1Byte = 8bit)
1KB = 1024Byte,1MB = 1024KB,1GB = 1024MB,1TB = 1024GB
1Byte = 8bit,1Btye等于8个二进制位,那么可以表示的最大数据为1111 1111,
也就是十进制的255,也等于16进制的0xFF。
所以得到:2个十六进制数表示1个字节,1个16进制位表示4bit
数据寄存器 指针和变址寄存器 段寄存器 控制寄存器
AX:AH, AL SP 堆栈指针 CS 代码段 IP 指令指针
BX:BH, BL BP 基数指针 DS 数据段 FLAG 状态标志
CX:CH, CL SI 源变址 SS 堆栈段
DX:DH, DL DI 目的变址 ES 附加段
8086CPU地址总线20根,数据总线16根,16根数据总线最大可以描述0xFFFF,也就是16位64KB的数据,
所以最多可以寻址64KB的内存地址,然而20根地址总线支持1M的寻址范围,为了解决该问题,8086CPU
的解决办法是: 物理地址 = 段地址 * 16 + 偏移地址
例子: CS:IP
0xCFFA7 = 0xCFFA * 16 + 0x0007 0xCFFA:0x0007
0xCFFA7 = 0xCFF0 * 16 + 0x00A7 0xCFF0:0x00A7
0xCFFA7 = 0xCF00 * 16 + 0x0FA7 0xCF00:0x0FA7
0xCFFA7 = 0xC000 * 16 + 0xFFA7 0xC000:0xFFA7
8086CPU不支持直接对段地址和指针赋值,若想修改CS:IP的值,
可以使用 jmp 段地址:偏移地址 来实现,其作用为:
jmp.段地址修改CS
jmp.偏移地址修改IP
当我们仅需要修改IP的值,此时的jmp一个合法的寄存器即可,比如修改IP的值为3H:
mov ax,3h
jmp ax
cs = 1000h
ip = 4h
mov ax,2ecH
jmp ax
此时 cs = 1000h,ip = 2ecH
jmp不允许直接赋值,必须要先把值赋给寄存器之后,再jmp这个寄存器,
此限制同样适用于call等指令
SS:SP
堆栈段:栈顶指针
8086CPU是16位的,所以SP也是16位的,其可以表示的最大数据为0xFFFF 也就是64KB
PUSH 入栈 PUSH AX ;将AX的数据压如栈
POP 出栈 POP AX ;将栈顶指针指向的数据送入AX
栈是以字为单位的,也就是2个字节:
PUSH AX 会使得SP-=2,因为栈底是高位,栈顶是低位,所以压栈操作会使栈顶指针向上(低位)移动
而AX是16位寄存器,也就是2个字节,所以SP会减2
需要注意的是,对于16位CPU,PUSH操作即压栈2个字节的数据,所以即使PUSH AH/AL,也是2个字节
POS AX 则使得SP+=2,它与PUSH指令的操作正好相反
Loop指令和cx寄存器配合使用,语法:
mov cx,循环次数
标号:
循环体
loop 标号
执行流程:
1.先将cx寄存器自减 cx = cx - 1
2.判断cx的值
如果不为0则执行标号的代码,再次执行步骤1
如果为0则执行loop后的代码,跳出循环
示例:计算2^6
mov ax,2H
mov cx,5 ;和do while一样,标号bh会先执行一次,再进入循环,所以这里是5
bh: add ax,ax
loop bh
在我们计算内存数据时,需要注意溢出问题,例子:
取FFFF0H - FFFF2H所有值得和存到DX寄存器中,数据如下:
FFFF0H --- FFH
FFFF1H --- FFH
FFFF2H --- FFH
此问题有2点需要特别注意
1.一个内存地址就是1个字节,即8bit,所以最大值只能存储FFH,1AC、30EB这些肯定存不了
2.当我们使用16位寄存器比如AX对FFFF0H取值时,
因为AX是2个字节,所以会读取FFFF0H和FFFF1H的值,这显然与我们的预期违背,所以
此时我们需要使用8位寄存器来取值以保证只读取一个内存地址中的数据,但是使用8位寄存器
又会出现溢出的问题,因为8位寄存器比如AL在运算FF+FF时并不会进位到AH,而AL8位最多可以
表示FFH,所以溢出。解决方法为使用其它寄存器来过渡一下,如:
mov ax,ffffh
mov ds,ax
mov dx,0h
mov al,ds:[0] ;第一次获取不存在溢出问题
mov ah,0h
add dx,ax
mov al,ds:[1] ;第二次获取存在溢出问题
mov ah,0
add dx,ax ;因为这里使用dx和ax计算相加,所以可以进位,就解决了溢出问题
mov al,ds:[2] ;第三次获取存在溢出问题
mov ah,0
add dx,ax ;因为这里使用dx和ax计算相加,所以可以进位,就解决了溢出问题
这样,我们就利用16位寄存器可以进位的特点解决了8位寄存器溢出问题
伪指令
db(define byte) ;自定义字节
dw(define word) ;自定义字
db 20 dup(0) ;开辟20个字节的地址空间并用0填充
db 20 dup(5) ;开辟20个字节的地址空间并用5填充
saaume cs:code ;指定段地址
code segment ;定义段
...
cbegin:
...
...
;退出代码
mov ah,4ch
int 21h
code ends ;结束段定义
end ;指示编译器程序编码结束,end后可增加表示指定程序的代码段入口地址
比如end cbegin,此时begin标识之前的数据不会再被CPU当做代码执行