前言

从0开始的汇编语言系列，选用的参考书籍是清华大学出版社，王爽老师的《汇编语言第四版》。该系列属于博主的笔记系列，文中会采用一些书中的例子，图片以及思考题供读者阅读，如需详细学习汇编语言可以购入一本，谢谢。

学习之前我们做如下约定（随着学习深入还会出现新的约定）：

十六进制数均以H结尾
使用8086CPU作为案例
我们使用(地址或寄存器名称)表示一个寄存器或一个内存单元的内容，()内地址是且一定是物理地址
我们将idata视作常量
我们以reg表示一个寄存器包括ax、ah、sp、bp、si、di等，sreg表示一个段寄存器包括ds、ss、cs、es。

话不多说我们马上开始。

标志寄存器

CPU内部的寄存器中，有一种特殊的寄存器，它具有一下三种作用：

用来存储相关指令的某些执行成果
用来为CPU执行相关指令提供行为依据
用来控制CPU的相关工作方式

它叫做标志寄存器flag，其中储存的信息通常被叫做程序状态字(PSW)，flag寄存器和其他寄存器不一样，其他寄存器都是整个寄存器具有一个含义，而flag是按位起作用的，每一位都有特定的含义。

flag寄存器的结构

flag寄存器的1、3、5、12、13、14、15位在8086CPU中没有使用，不具有任何含义，其余位都具有特殊含义。

ZF标志

我们知道flag寄存器的结构后，就分别来介绍一下用到的标志位，首先是ZF标志位。

flag寄存器中第6位：ZF，零标志位。它记录着相关指令执行后，其结果是否为0，如果为0，则ZF为1，反之ZF为0。这很好理解，只要执行的指令得到的结果是0，那么ZF就是1，比如：

1 2	mov ax,1 and ax,0

这两条指令执行完后ZF就是1。

1 2	mov ax,1 or ax,0

这两条指令执行完后ZF就是0。

注意，在8086CPU的指令集中，有的指令的执行是影响标志寄存器的，比如add，sub，mul，div，inc，or，and等它们多为运算指令；有的指令对标志寄存器是没有影响的，比如mov，pop，push等它们大多数为传送指令。

PF标志

我们介绍的第二个朋友就是PF标志位。

flag寄存器中第2位：PF，奇偶标志位，它记录相关指令执行后，其结果的所有bit位中1的个数是奇数个还是偶数个，如果为偶数，那么PF就为1，反之为0，比如：

1 2	mov AL,1 add AL,10

这两条指令执行完后，结果为00001011B，其中有三个1，所以ZF就是0。

1 2	mov AL,1 or AL,2

这两条指令执行完后，结果为00000011B，其中有两个1，所以ZF就是1。

(Tips：0也是偶数哦)

SF标志

接下来是第三位朋友SF标志位。

flag寄存器中第7位SF，符号标志位。它记录相关指令执行后，其结果是否为负数，如果为负数，那么SF为1，反之为0，比如：

1 2	mov AL,10000001B add AL,1

这两条指令执行完后，结果为10000010B，如果进行的是有符号数计算，那么SF为1，代表结果为负。

1 2	mov AL,10000001B add AL,01111111B

这两条指令执行完后，结果为0，如果进行的是有符号数计算，那么SF为0，代表结果为正。

计算机中通常用补码来表示有符号数据，一个数据可以被看成有符号数字也可以被看成无符号数字，比如：

1 2	mov AL,10000001B add AL,1

结果为(AL)=10000010B。我们可以认为add指令进行了一次无符号数运算，那么add指令就相当于计算了129+1，结果为130(10000010B)；当然我们也可以认为add指令进行了一次有符号数运算，那么add指令就相当于计算-127+1，结果为-126(10000010B)。

SF标志，就是CPU对有符号数运算结果的一种记录，记录了数据的正负，我们进行有符号数计算时，可以将SF标志作为判断数据正负的依据，当我们进行无符号数计算的时候，SF标志没有什么使用价值，因此我们要根据进行的计算，去观察SF标志。

CF标志

接下来介绍大哥，CF标志位。

flag寄存器第0位CF，进位标志位。一般情况下，进行无符号数计算的时候，注意是无符号数，它记录了运算结果的最高有效位向更高位的进位值，或从更高位的借位值。

对于位数为N的无符号数来说，其对应的二进制信息的最高位，为N-1位，也就是它的最高有效位，而我们假象出来的第N位，就是相对于最高有效位的更高位。

最高有效位和假想最高位

我们知道，当两个数据相加时，就有可能产生从最高有效位向更高位的进位。比如98H+98H，将产生进位。由于这个进位值在8位数中无法保存，我们之前只是简单的说这个进位丢失了，但其实CPU在运算时，并不丢弃这个进位值，而是记录在一个特殊的寄存器的某一位上。8086CPU就使用flag的CF位来记录这个进位值，比如：

1
2
3

mov AL,98H
add AL,AL
add AL,AL

第一条add指令执行后，(AL)=30H，CF=1，CF记录了从最高有效位向更高位的进位值，第二条add指令执行后，(AL)=60H，CF=0。

同样当进行减法运算时，也可能向更高位借位。比如，两个97H-98H，将产生借位，借位后就相当于计算197H-98H。CF标志为也可以记录这个值，比如：

1
2
3

mov AL,97H
sub AL,98H
sub AL,AL

第一条sub指令执行后，(AL)=FFH，CF=1，CF记录了向更高位的借位值，第二条sub指令执行后，(AL)=0H，CF=0。

哦对了，inc指令不会影响CF的值，要记住。

OF标志

flag寄存器第11位OF，溢出标志位。在仔细了解它之前我们先来了解一下溢出的问题。

在进行有符号计算的时候，如果结果超过了机器所能表示的范围称为溢出。那么什么是机器能表示的范围呢？比如说，指令运算的结果用8位寄存器或内存单元来存放，比如，add AL,3，那么对于8位的有符号数据，机器所能表示的范围是-128到127。同理，对于16位有符号数据，机器能表示的范围为-32768到32767。如果运算结果超过了机器所能表达的范围，将产生溢出。注意我们现在所讲的溢出，是针对有符号数而言，下面我们看个例子：

1 2	mov AL,98 add AL,99

执行后将产生溢出。因为add AL,99进行的有符号数运算是：98+99=197，而结果197超出了机器能表示的8位有符号数的范围，这就发生了溢出，如果在进行有符号数运算时发生溢出，那么运算结果就不正确，就例子而言，add指令运算完的结果是(AL)=0C5H，因为进行的是有符号数计算，所以AL中存储的是有符号数，C5H是-59的补码，如果我们用add指令进行的是有符号数运算，那我们就得到了98+99=-59，这太夸张了！造成这样的原因是实际结果197无法在8位寄存器中存放，由于这样的事情存在，所以CPU要对指令执行以后是否产生了溢出进行记录。

现在我们回过头来看一下OF标志，如果指令执行以后发生了溢出OF=1反之OF=0，我们要注意，CF是对无符号数有意义的标志位，而OF是对有符号数有意义的标志位，比如：

1 2	mov AL,0F0H add AL,88H

两条指令执行后：CF=1，OF=1。对于无符号数运算来讲，0F0H+88H有进位，所以CF=1；对于有符号数运算来讲，0F0H+88H发生溢出，所以OF=1。

1 2	mov AL,0F0H add AL,78H

两条指令执行后：CF=1，OF=0。对于无符号数运算来讲，0F0H+78H有进位，所以CF=1；对于有符号数运算来讲，0F0H+78H没发生溢出，所以OF=0。

我们可以看出，CF和OF所表示的进位和溢出，分别是对无符号数计算和有符号数计算而言的，它们之间没有任何关系。

adc指令

adc指令是带进位的加法指令，它利用了CF位上记录的进位值，我们来看一下它的格式：

adc 操作对象1，操作对象2

它的功能是：操作对象1=操作对象1+操作对象2+CF，比如说adc ax,bx，实现的功能是(ax)=(ax)+(bx)+CF，我们看一下例子：

mov ax,2
mov bx,1
sub bx,ax
adc ax,1

因为sub bx,ax发生了借位，这时CF=1，之后adc指令就计算了：(ax)+1+CF=2+1+1=4，所以(ax)=4。

为什么要加上CF的值呢？CPU为什么提供了这样的指令呢？我们先来回看一下CF的值的含义，adc指令使用到的CF的值的含义是由adc指令前面的指令决定的，也就是说，关键在于所加上的CF值是被什么设置的，如果CF是被sub设置的那么就是借位值，如果是add设置的那就是进位值，所以CF存在的意义就是用来进行高位数数据计算，比如add ax,bx也可以被看做add AL,BL，adc ah,bh它们是完全等价的。我们看一个例子：

计算1EF000H+201000H，结果放在ax（高16位）和bx（低16位）中，很显然add指令做不到计算这样大的数据，所以我们打算先计算低16位相加，然后计算高16位相加再加上CF的值。也就是：

mov ax,001EH
mov bx,0F000H
add bx,1000H
adc ax,0020H

我们可以根据这个思路计算更大的数据相加。

sbb指令

sbb指令是带借位的减法指令，它利用了CF位上记录的借位值，我们来看一下它的格式：

sbb 操作对象1，操作对象2

它的功能是：操作对象1=操作对象1-操作对象2-CF，比如说sbb ax,bx，实现的功能是(ax)=(ax)-(bx)-CF。同样的我们也可以根据我们之前的思路，进行高位数数据的运算。这里我们不再赘述。

cmp指令

cmp指令是比较指令，cmp的功能相当于减法指令，只是不保存结果，cmp指令执行后将对标志寄存器产生影响，其他的指令通过识别这些被影响的标志寄存器位来得知比较结果。老样子我们看一下cmp指令的格式：

cmp 操作对象1，操作对象2

cmp指令的功能是这样的，计算操作对象1-操作对象2但并不保存结果，仅仅根据计算的结果对标志寄存器进行设置，比如cmp ax,ax它首先计算了(ax)-(ax)结果为0，但并不在ax中保存，仅根据0来设置flag中的相关位，这条指令执行后，ZF=1,PF=1,SF=0,CF=0,OF=0。

所以我们可以看出来cmp指令给了我们很多信息：

cmp指令提供的信息1

和add，sub指令一样，CPU执行cmp指令的时候也包含两种含义：对无符号数进行比较，对有符号数进行比较，上面我们讲的是对无符号数进行的比较，下面我们看一下对有符号数的比较：

我们以cmp ah,bh为例，如果(ah)=(bh)，则(ah)-(bh)=0，所以：ZF=1，反之ZF=0，所以我们根据ZF的值可以知道两个数据是否相等。接下来我们再来看(ah)<(bh)会发生什么，在这个情况下，(ah)-(bh)显然可能引起SF=1，即结果为负，但是我们不能因为SF=1就说明(ah)<(bh)，例如：(ah)-(bh)=34-(-96)=82H(-126)，我们不能因为计算后SF=1就说34<-96这显然是不合理的。当运算发生溢出以后我们逻辑上的得到的结果(130)和实际的结果(-126)是不一样的，所以单单根据SF去判断比较较结果是不可靠的，还要结合OF一起判断，下面我们就来看看SF和OF到底给我们提供了什么样的信息：

cmp指令提供的信息2

检测比较结果的条件转移指令

我们在之前的学习过程中，学到过一个条件转移指令jcxz指令，它通过检测(CX)是否为0，来判断是否进行条件转移，当然除了jcxz之外，CPU还提供了其他条件转移指令，大多数条件转移指令都检测标志寄存器的标志位，这些指令通常和cmp组合使用就像是call和ret的关系。

因为cmp有两种比较，无符号数比较和有符号数比较，所以和cmp组合的转移动指令也有两种，根据无符号数的比较结果进行转移的条件转移指令(它们检测ZF和CF的值)，根据有符号数的比较结果进行转移的的条件转移指令(它们检测SF、OF、ZF的值)。

下面是常用的根据无符号数的比较结果进行转移的条件转移指令：

常用的根据无符号数的比较结果进行转移的条件转移指令

这些指令很常用，而且很好记忆，它们的第一个字母j表示jump，之后的e代表equal，ne就是not equal，b是below，a是above。

当然了，这些指令的含义都是和cmp结合的时候才拥有的，它们做的事情只是检测相关标志位，符合条件就跳转，比如有这样一段程序：

	mov ax,0
	add ax,0
	je s
	inc ax
s:	inc ax

执行过后，(ax)=1，因为add ax,0执行过后设置了ZF=1，je指令检测到ZF=1后跳转到S处，这里就不能说谁等于谁，也就是说je指令没有什么含义，因此我们一般将cmp和这些跳转指令一起使用，它们组合起来就像是高级语言中的IF一样起到一个条件判断的作用。有符号数比较跳转指令的原理就和无符号数比较跳转指令相同了，有兴趣可以查阅相关的指令手册。

DF标志和串传送指令

接下来介绍的是flag寄存器的第10位DF，方向标志位。在串处理指令中，控制每次操作后si、di的增减。DF=0每次操作后si、di递增；DF=1每次操作后si、di递减。知道了DF的作用后，我们还得知道串传送指令，我们来看一下movsb指令，首先是movsb的格式就是movsb，当执行movsb指令时就相当于做了这样几件事：

((es)×16+(di))=((ds)×16+(si))
如果DF=0则(si)=(si)+1,(di)=(di)+1
如果DF=1则(si)=(si)-1,(di)=(di)-1

它实现了将DS:SI指向的内存字节单元的内容送入ES:DI中，然后根据DF的值将SI和DI递增1或者递减1。还有另一个指令，movsw指令，它实现了DS:SI指向的内存字单元的内容送入ES:DI中，然后根据DF的值将SI和DI递增2或者递减2。

movsb和movsw都是串传送操作的一个步骤，一般来说这两个指令都会和rep指令配合使用，rep指令的格式是rep movsb，它做的事情就像是一个循环即s:movsb；loop s。可见rep的作用是根据CX的值，重复执行后面的串传送指令，因为每执行一次movsb指令si和di都会递增或递减一个单位，所以rep movsb可以循环实现(CX)个字符的传送。同理也有rep movsw。

因为DF标志位决定了串传送指令执行后，si和di改变的方向，所以CPU给程序员提供了相应修改DF位的指令，让程序员可以修改串传送的方向，这两个指令分别是cld指令(将DF置为0)，std指令(将DF置为1)。