冯诺伊曼式的计算机大概分成4个部分:CPU、内存、总线、外设。
这是从硬件和操作系统的角度来划分的,所以操作系统里有:内存管理模块、USB总线驱动、硬盘驱动,等等。
但是从软件的角度来看,只需要关注CPU、内存、寄存器。
寄存器,是CPU里用来暂时存储数据的超高速存储单元。
写汇编语言时,大多数时间就是跟寄存器打交道。
编译器,就是个代替人类去写汇编语言的工具软件,所以编译器的大多数代码也是跟寄存器打交道。
寄存器、内存、汇编指令,是编译器后端绕不开的东西。
寄存器在不同的CPU平台上是不同的,叫的名字不一样,个数不一样,但是功能都差不多。
intel平台上,寄存器一开始是按功能来起名字的,例如:
32位的CPU只有8个寄存器,分别是:eax,ebx,ecx,edx,ebp,esp,esi,edi。
1,eax,
在16位机的时代叫ax。
到了32位机的时代给扩展到了32位,所以叫“扩展的ax”:extended ax,即eax。
其他前面带e的寄存器,也是这么来的。
它最初的目的是作为加法器,名字里的a指的是add(按英语语法该用名词)。
但实际上,eax就是个通用寄存器。
按照C语言的二进制接口(ABI),约定它同时作为函数的返回值使用。
也就是说:
int ret = write();
在汇编里如果指定ret使用eax的话,这行的赋值是不需要产生指令的(write()函数调用还是需要产生指令的)。
2,ebx,
如上面说的,它在16位时代叫bx,也是后来被扩展到32位的。
它的最初目的是作为基地址寄存器,b:base。
但实际上,eb也是个通用寄存器。
3,ecx,
它的最初目的是作为计数寄存器,c:count。
它可以作为通用寄存器,但在字符串传递、移位运算时,要作为计数器。
int a[10];
int b[10] = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9};
for (int i = 0; i < 10; i )
a[i] = b[i];
这种代码,如果让人去写汇编的话,可以这么写:
lea edi, 80(ebp)
lea esi, 120(rbp)
mov ecx, 40
rep movsb
复制10个整数,一共40字节,目的地址放在edi、源地址放在esi、字节数放在ecx。
ecx最初就是在这种指令里计量字节数用的,它现在依然保持着这个功能。
在移位运算时,如果移位的位数不是常数,也要用ecx作为计数。
例如,a <<= i,a可以放在eax里,i就要放在ecx里。
因为就算是64位机上,合理的移位数字也不超过63位,所以实际使用的只有ecx的最低8位:它有个特别的名字,cl。
4,edx,
它最初的目的是作为除法的余数、或者乘法的高位。
整数除法,结果包括商和余数,商在eax里,余数在edx里。
整数乘法,结果的位数一般是乘数位数的2倍,所以低位在eax里,高位在edx里。
不是乘法除法这种场合的话,edx也可以作为通用寄存器。
在16位时代,它叫dx,跟其他的一样也是后来扩充到32位的。
除法,d:divide。
5,ebp,
凡是带p的寄存器,最初都是存储指针的寄存器。
ebp,栈底指针寄存器(栈帧寄存器),extended bottom pointer。
它属于特殊寄存器,在代码里的使用要特别小心,以防打乱了函数的调用链。
函数的汇编代码大多是这样的:
push ebp
mov ebp, esp
...
mov esp, ebp
pop ebp
ret
首先保存ebp到栈上,然后把栈顶esp保存到ebp里,作为新函数的栈底。
在整个新函数的调用期间,ebp最好不要有任何的修改,即它应该是只读的!
这样到了函数末尾,才可以用它回写esp,让函数正常返回。
6,esp,
它是栈顶寄存器,它存储的是函数栈的当前位置,即栈指针:extended stack pointer。
esp和ebp互相配合,是CPU对函数栈的管理核心。
如果函数需要分配局部变量的话,就要把esp往低地址移动(减法),以扩大栈空间。
7,esi,edi,
这两个也是互相对应,一个做源地址寄存器,一个做目的地址寄存器,用于字符串的传递。
esi,extended source index,
edi,extended destination index。
它们两个在不是字符串传递的场合,也可以当作通用寄存器。
到了64位时代,这些寄存器全部从32位又扩展到了64位,名字改叫rax, rbx, rcx, ..., etc.
8,intel的寄存器,
0-7位(最低8位)以l结尾,al, bl, cl, dl.
8-15位以h结尾,ah, bh, ch, dh。
16位时代的寄存器只有16位,所以0-7位就是低位,low bits;8-15位就是高位,high bits。
整个16位寄存器,以x结尾:ax, bx, cx, dx。
那4个特殊寄存器:bp, sp, si, di。
到了32位时代,又都把名字前面加上了e。
到了64位时代,又把名字前面的e改成了r。
所以,rax是64位寄存器,在汇编里:它的0-7位是al,8-15位是ah,0-15位是ax,0-31位是eax,0-63位是rax。
其他寄存器,也是这么起名字的。
所以,修改al是会影响ax, eax, rax的,但不会影响ah。
rax的位数分布
到了64位时代,intel又添加了8个通用寄存器,r8-r15。
这次因为寄存器太多了,intel就采取了ARM的叫法,直接按数字编号了。
intel搞了好几十年的CISC,最后还是学了RISC[捂脸]
9,最后说说内存,
内存,从软件的角度看,是个巨大的一维数组。
32位的进程有0-4G的虚拟内存空间,这个数组就是:uint8_t memory[1 << 31];
64位的进程,虚拟内存空间可以有4Gx4G的空间:uint8_t memory[1 << 63];
内存的地址(索引)是个无符号整数,它可以做加减运算。
例如,知道数组a[10]的内存地址,要找它的元素a[1]的内存地址,那么加上4个字节就行。
CPU要读写内存,就必须知道内存的地址。
这个地址在CPU读写时,该放在哪里?
只能是寄存器里,这就是汇编语言里常说的寻址方式。
为什么CPU要有寻址方式?
因为它在读写内存的时候,必须得把内存地址以某个方式、放在某个位置。
A,如果内存地址直接放在寄存器里,那就是直接基地址寻址,也就是指针。
读:a = *p;
写:*p =a;
翻译成汇编,p在rdx,a在rax,就是:
读:mov rax, (rdx)
写:mov (rdx), rax
B,如果内存地址是某个已知位置的偏移量的话,就是基地址 偏移量寻址。
例如结构体里有个成员变量y,它离结构体的"首地址"有4个字节,那么:
p->y = 1 翻译成汇编就是mov 4(rdx), 1,
其中指针p放在rdx里,4是偏移量的字节数。
C,如果内存地址是数组的一个元素,因为数组元素的大小是一样的,用数组地址 元素个数*元素大小进行寻址最为方便,
这就是SIB寻址:scale, index, base。
base:数组的“首地址”。
index:元素的索引,即它是数组的第几个元素,从0开始计数。
scale:放大系数,对应着数组每个元素的大小,用C语言表示就是sizeof(array[0])。
例如:
给int型数组a的第i号元素,赋值为1,C代码就是 a[i] = 1,
如果a放在rbx里,i放在rcx里,那么汇编就是:mov (rbx, rcx, 4), 1,
其中,4是每个元素的大小。
D,
当然,要是给第i个int型元素的第2号字节赋值,还可以这么写:mov 2(rbx, rcx, 4), 1。
这种一般没有实际意义,因为它对应的C代码是:
a[i] &= ~0xff0000; // 保留其他3个字节,把第2号字节清零,
a[i] |= 0x010000; // 把清零之后的第2号字节设置为1。
要想判断出这2行代码的目的是给a[i]的第2号字节赋值为1,也太考验编译器了!
汇编的内存寻址方式,总的概括就是:
写内存:mov disp(base, index, scale), src
读内存:mov dst, disp(base, index, scale)
其中:
disp是相对于基地址的偏移量,
base是基地址,
index是位置索引,
scale是放大系数,
src是源操作数,它可以是寄存器,也可以是常数,但不能是另一个内存地址。
dst是目的操作数,它必须是寄存器。
表示内存地址的那4项(disp, base, index, scale),可以酌情省略一部分[呲牙]
最后,在windows和Linux上的汇编有点不同:
1,汇编的源操作数和目的操作数的位置是反的,
2,而且Linux上的寄存器前要加%,
3,内存寻址,windows上用中括号[],Linux上用小括号(),
我这种写法是把它们两个的风格混合的写法,属于伪代码。
你要是真写能用的汇编的话,最好查一下标准写法,免得汇编器报语法错误。