faryou 发布的文章

(以下内容将作为汇编教程系列的前言)
(阅读本教程系列如果有问题可直接于评论区提出,我长期提供免费解答)

一点感想
先说说我个人学习汇编语言的经历。首先,我是个怀旧的人,因而同时也对于那些古旧的技术心存向往。学习完C语言的指针之后,我希望更彻底的了解计算机底层原理,于是就决定学习汇编。我没有老师,身边的人也没有懂汇编的,当时就在淘宝上买了一本排在首位的王爽的《汇编语言》,开始自学起来。
当时我还是初一。看完书的简介和第一章节,觉得应该不很难,于是下了决心每周末啃一点,把整本书过掉。当时的我还是太天真了。到了第二章节,由于我没有系统的学习过计算机底层架构,到了CPU工作过程那里直接晕了,之后的内容也是看的云里雾里的,本站那篇《汇编中栈的原理》基本上就是直接抄书写的的。
当时觉得真的啃不下去了,又没人可以问,直接放弃。之后的一年时间里,每次心中重燃不死的希望,都去啃一点,居然一节节啃下来了!然后就是八下,竞赛冲刺。到了25年暑假,一气读完全书!到现在,就是复读、加深的过程。
个人对王爽《汇编语言》的一些认识:首先汇编语言不适合编程初学者,至少得会一门C/Pascal之类较底层的高级语言,才能去学习该书。这本书写的其实挺好的,包括作者提出的所谓“知识屏蔽”我也赞同,书中也充分体现了这一点。但是我觉得该书更适合作为老师上课的教材,对像我一样自学的人来说,前面部分对于8086CPU的底层原理介绍很生硬,需要长时间消化才能读懂。
我写这系列的教材,大体框架遵循了该书,但有些地方也根据我自认为更适合理解的方式进行了调换,目的在于更适合有C语言基础的人阅读。教程中部分需要专业术语的地方,直接用了书中原话,不再一一指出。

汇编语言简介
学习汇编语言,需要明白它作为“低级语言”,到底“低级”在什么地方。汇编语言,是一门直接对硬件编程的,也就是说,它的每一条指令(不包括伪指令,那是给编译器看的,类似高级语言中的宏),都是直接操纵硬件。计算机本质上是一堆电路,汇编语言的每一条指令所代表的功能,都代表了一块电路实现的功能。比如,mov ax,2表示将ax寄存器(寄存器是CPU中的一个电子元件,一个寄存器有16位,每一位能够以高低电平的形式存储一个1或0)的值改为2,即二进制下的0000000000000010,可以看出,直接改变了电平高低。所以,对于其中每一条指令的功能,不要有任何想法,它这个功能是由它对应的电路实现的,我们编程者并不能改变,只能使用。不要想着修改它,也不要提出“为什么一个内存单元是8位?”、“为什么不能直接改变段寄存器的值?”等问题,答案只有一个——电路就是这样接的。如果你真的想改变它的功能,请修改CPU的电路。
同时,汇编语言没有高级语言中那些抽象出来的“函数”“变量”或者“对象”这些概念,你可以操作的只有:CPU、内存、键盘、显示器等物理意义上的硬件。高级语言中的这些概念最终也是在汇编语言的基础上抽象得到,要实现这些概念,到最后仍然依赖于最底层的汇编语言。不过你可以自己在学汇编时思考高级语言中的这些概念可以如何通过汇编实现,这对于理解硬件原理帮助很大。

前言
中断是CPU中用于处理其内外突发情况的一种机制。CPU执行完当前的指令后,检测到CPU内部或外部传送的一种特殊信息(称“中断信息”),立刻处理这些信息,处理方式即立刻跳转到中断的对应处理程序,执行完这段程序后再返回。中断机制常在CPU及操作系统提供磁盘操作、键盘输入、屏幕输出等处理程序时使用,可以视为早期16位操作系统的一种“API”,本质是一种具有特殊触发条件的函数。下面我们将详细学习几种种情况引起的中断,以及编写程序时如何利用中断机制。

中断的过程
当8086CPU收到中断信息后,处理过程如下:

(1)取得中断类型码
(2)pushf
(3)修改TF、IF值为0
(4)CS、IP入栈
(5)进入中断程序(通过修改CS、IP的值)
(6)恢复CS、IP、标志寄存器的值(从而返回程序)

需要注意的是,如果进入中断的前一条指令修改了ss寄存器的值,那么即使触发了中断条件,也不会进入中断程序。因为ss:sp是一个整体,若ss:sp值不对应则会引起中断之后的错误,所以CPU提供了这一特性。

中断向量表
8086CPU支持256个中断,为此,规定内存0000:0000~0000:03FF的1024个单元存放0~255号中断的入口,从而建立中断类型码(即中断的编号)与中断程序之间的一一映射关系。其中,每两个字存放一个中断处理程序的地址,高位存放中断处理程序的段地址,低位存放其偏移地址。由此,不难理解,当CPU获得中断类型码N后,即通过设置CS:IP的值为(N4):(N4+2)跳转到中断处理程序,中断结束后再返回原来的位置。

内中断
内中断的中断信息由CPU内部产生。对8086CPU,当发生如下四种情况时,会引起内中断:

(1)除法错误(执行div等除法指令时,除数为0)
(2)单步执行(使用debug的时候)
(3)执行into指令
(4)执行int指令

下面将分别介绍说明~

除法错误中断
除法错误中断为0号中断,用于处理div等除法指令除数为零的错误。让我们执行下面的程序:

mov ah,0
mov bh,1
div bh

可以看到,屏幕上输出了“Divide overflow!”,但我们并没有写输出字符串的程序。原因是:这里出现了除数为0的错误,从而引发0号中断,0号中断处理程序的功能即输出字符串“Divide overflow”。

单步中断
单步中断为1号中断,用于提供Debug的单步执行功能。在使用Debug调试时,我们经常需要逐条调试代码(即使用T命令),单步中断就是提供这一功能的中断。其触发条件为TF值为1。这样我们就很容易理解为什么进入中断之前要设置TF值为0了:如果进入中断前TF值为1,那么执行中断处理程序的第一条指令后,CPU检测到TF值为1,触发单步中断,进入其中断处理程序;执行完中断处理程序之后,又检测到TF值为1,又重新执行1号中断的第一条指令;陷入死循环。

into指令引发内中断
into指令检测上一条计算指令是否发生了溢出,若是,则进入4号中断。我们可以通过修改4号中断对应的程序,实现需要的功能(后面会详细介绍)。into指令的格式:

into

int指令引发内中断
int指令的功能是引发中断过程,我们前面所说的中断承载的“API”功能即主要通过int指令实现。其使用格式:

int 中断类型码

操作系统把“API”以中断形式写到内存里,应用程序通过int指令即可方便地调用。同时,int指令也可以用于不同程序间的数据互通,这对于早期的单任务操作系统尤为重要。我们之前写程序最后总有一句:

int 21h

中断类型码21H对应的中断功能即为:返回操作系统。这为应用程序提供了快速返回操作系统的方式。接下来

前言&端口简介
(本文有点长,相比之前的内容也更有意思,请耐心食用~)
电脑作为一个由各零件拼凑成的整体,以CPU为核心,管理其他的硬件。端口,就是联系CPU与其他硬件的一个中间规范。各硬件把功能封装好,CPU通过端口访问,实现交互。本文以CMOS RAM为例,介绍端口的使用方法。

in指令和out指令
在8086CPU中,只有in指令和out指令这两条,能够对端口进行操作,其使用格式如下:
in指令(从端口读入数据)

in al,端口号(若为0~255号直接用常数指明,若为256~65535号则先将号码放在dx中,再在此处填写dx);本指令用于访问8位端口
in ax,端口号(同上);本指令用于访问16位端口

out指令(输出数据到端口)

out 端口号(同上),al;本指令用于访问8位端口
out 端口号(同上),ax;本指令用于访问16位端口

需要注意的是,在使用in指令和out指令时,读入和读出的数据都存放在固定寄存器中(8位端口对应al,16位端口对应ax),如果改动会出错。

CMOS RAM简介
CMOS RAM是一种芯片,存放了电脑中的时间信息及其他一些系统配置,其中有一块128字节的RAM可以读取。其只有70h和71h两个端口。我们作为初学者可以用它作为端口学习的一个简单实例,今天我们写一个小程序,用端口读入其时间并显示在屏幕上。下面说明其使用:
70h:地址端口,存放要访问的CMOS RAM单元的地址。
71h:数据端口,存放70h端口中指定地址的数据。
由此可见,我们如果要读取CMOS RAM的x(x为0~255的正整数)号单元,只需要先将x送入端口70h,再从71h读取结果即可。
在CMOS RAM中,秒、分、时、日、月、年信息依次存放在0、2、4、7、8、9单元中。用BCD码的形式存放,即用8位二进制分割为两个4位,高4位存十位,低4位存个位。例如,00010100b表示14。

如何输出内容到屏幕上
今天我们即将写出第一个输出结果到屏幕上的程序~下面介绍显示缓冲区:
在80*25彩色字符模式下,内存中B8000h~BFFFFh为显示缓冲区,分为8页,通常情况下显示第0页,即B8000h~B8F9Fh中的字符,显示时会将显示缓冲区中的内容转为ASCLL码后输出。
一个字符的信息存在一个字中,其中前一个字节放字符,后一个字节放属性
下面为一个属性字节所包含的信息:

位数(二进制位)76543210
含义闪烁背景背景背景高亮前景前景前景
对应颜色 绿

例如:
红底绿字:01000010B 红底闪烁黄字:11000110B
紫底黑字:01010000B 蓝底高亮白字:01001111B
以此类推,可以根据光学三原色互相合成调出8种颜色。

移位指令
shl和shr为逻辑移位指令,其中shl为左移,shr为右移。功能类似C语言的<<及>>。使用格式:

shl/shr 原数据(存放在的寄存器名),移位量(0~8)。

程序编写
终于介绍完全部的知识了,下面整理一下思路:

  1. 从CMOS RAM中读出一个字节
  2. 将该字节以十进制输出(原数+30h)
  3. 重复以上步骤,并将其格式化为“年/月/日 时:分:秒”的格式(前面日期用红底白字,后面时间用黑底高亮黄字)

以下为代码:

assume cs:code
code segment
start:
      mov bx,0b800h
      mov es,bx
      mov cl,4
      
      mov al,9
      out 70h,al
      in al,71h
      mov ah,al
      shr ah,cl
      and al,00001111b
      add ah,30h
      add al,30h
      mov byte ptr es:[0],ah
      mov byte ptr es:[1],01000111b
      mov byte ptr es:[2],al
      mov byte ptr es:[3],01000111b
      
      mov al,2Fh
      mov byte ptr es:[4],al
      mov byte ptr es:[5],01000111b
      
      mov al,8
      out 70h,al
      in al,71h
      mov ah,al
      shr ah,cl
      and al,00001111b
      add ah,30h
      add al,30h
      mov byte ptr es:[6],ah
      mov byte ptr es:[7],01000111b
      mov byte ptr es:[8],al
      mov byte ptr es:[9],01000111b
      
      mov al,2Fh
      mov byte ptr es:[10],al
      mov byte ptr es:[11],01000111b
      
      mov al,7
      out 70h,al
      in al,71h
      mov ah,al
      shr ah,cl
      and al,00001111b
      add ah,30h
      add al,30h
      mov byte ptr es:[12],ah
      mov byte ptr es:[13],01000111b
      mov byte ptr es:[14],al
      mov byte ptr es:[15],01000111b
      
      mov al,4
      out 70h,al
      in al,71h
      mov ah,al
      shr ah,cl
      and ah,00001111b
      add ah,30h
      add al,30h
      mov byte ptr es:[20],ah
      mov byte ptr es:[21],00001110b
      mov byte ptr es:[22],al
      mov byte ptr es:[23],00001110b
      
      mov al,3Ah
      mov byte ptr es:[24],al
      mov byte ptr es:[25],00001110b
      
      mov al,2
      out 70h,al
      in al,71h
      mov ah,al
      shr ah,4
      and 00001111b
      add ah,30h
      add al,30h
      mov byte ptr es:[26],ah
      mov byte ptr es:[27],00001110b
      mov byte ptr es:[28],al
      mov byte ptr es:[29],00001110b
      
      mov al,3Ah
      mov byte ptr es:[30],al
      mov byte ptr es:[31],00001110b
      
      mov al,0
      out 70h,al
      in al,71h
      mov ah,al
      shr ah,cl
      and ah,00001111b
      add ah,30h
      add al,30h
      mov byte ptr es:[32],ah
      mov byte ptr es:[33],00001110b
      mov byte ptr es:[34],al
      mov byte ptr es:[35],00001110b
      
      mov ax,4c00h
      int 21h

code ends
end start

(没有用循环,导致出现了挺多冗余代码的,各位可以试试用循环+子程序简化程序~)

前言
在8086CPU中,有一个特殊的寄存器,用来存放各种指令产生的临时信息,它被称为flag,即标志寄存器。本文将介绍该寄存器的使用,在编程时应灵活使用其特性。

标志寄存器简介
标志寄存器可以视为几个单二进制位的寄存器所拼凑出来的一个寄存器(几个各具自己含义的单二进制位的寄存器挤在同一个寄存器里面),存放一些指令执行时产生的附加信息(如加减法时的进位、借位,溢出等)。在标志寄存器中,每个二进制位代表一个信息。下面将详细介绍各标志寄存器的用途~

标志寄存器组成
标志寄存器由以下各位组成:
  位数  15 14 13 12 11 10  9  8  7  6  5  4  3  2  1  0
  表示              OF DF IF TF SF ZF    AF    PF    CF
其中空的位没有实际意义,有意义的位将进行介绍——

标志寄存器使用
DF标志(第10位,方向标志位)与串传送指令
DF标志控制串传送指令每次操作后si、di的增减。若DF值为0,则每次操作后si、di递增;若DF值为1,则每次操作后si、di递减。
串传送指令用于在内存中移动一批数据。其中movsb针对一个字节,movsw针对一个字。movsb的功能如下:

(1)将ds:si指向的内存单元字节送入es:di处。
(2)若DF值为0,则si、di各自增1;
    若DF值为1,则si、di各自减1。

同理,movsw的功能如下:

(1)将ds:si指向的内存单元字送入es:di处。
(2)若DF值为0,则si、di各自增2;
    若DF值为1,则si、di各自减2。

串传送指令一般和rep配合使用,如:

rep movsb

其等价于:

s:movsb
  loop s

易知rep的作用:可以实现(cx)个字节/字的传送。
由此,不难想到,CPU应提供直接更改DF值的方式。事实确实如此。在8086CPU中,我们可以通过cld/std指令将DF的值设置为0/1,格式:

cld/std

ZF标志(第6位,零标志位)
ZF标志用于记录相关指令执行后,其结果是否为0。若结果为0,则ZF值为1;反之则ZF值为0。其中,add、sub、mul、div、inc、or、and等运算指令会影响ZF的值。例如,执行如下指令后,ZF值为1:

mov ax,1
sub ax,1

PF标志(第2位,奇偶标志位)
PF标志用于记录一些指令执行后,其结果的所有单字节位中1的个数是否为偶数。若为偶数,则PF值为1;反之则PF值为0。例如,执行如下指令后,PF值为0:

mov al,1
or al,1

SF标志(第7位,符号标志位)
SF标志记录一些指令执行后,其结果是否为负。若结果为负,则SF值为1;否则SF值为0。需要注意的是,计算机中存放的数字有无符号数和有符号数两种,而一个字节单元存放的数有无符号由编程者意识决定。当你认为运算对象是有符号数时,8086CPU会将运算结果视为补码,并将其转为原码后判断其符号位的正负来更新SF位的值;当你认为运算对象是无符号数时,CPU也会以相同方式更新SF位,但此时符号对你没有意义,所以请无视SF位。例如,执行如下指令后,SF值为0(运算结果换成原码后为0,即非负数):

mov al,10000001b
add al,01111111b

CF标志(第0位,进退位标志位)
CF标志记录add、sub执行后最高位是否产生进、退位。若产生了进、退位,则CF值为1;反之则CF值为0。需要注意的是,inc和loop指令不影响CF位。
abc、sbb指令
abc、sbb指令是带借位加、减法指令。相当于在操作目标上再加、减一个CF的值,例如:

add al,bl
abc ah,bh

以上指令等效于:

add ax,bx

由此可见,我们可以通过abc和sbb指令进行大数据相加。例如,以下代码能计算1EF0001000H+2010001EFH的值,其中高、中、低16位分别存放在ax、bx、cx寄存器中:

mov ax,001EH
mov bx,0F000H
mov cx,1000H
add cx,1EF0H
abc bx,1000H
abc ax,0020H

OF标志(第11位,溢出标志位)
我们在进行有符号数运算时,可能会发生溢出,这会导致运算结果不正确。例如,我们要将两个8位二进制数(范围-128~127)98和99相加,正确结果是197。但是,由于机器无法存下,发生了溢出,我们得到了-59,显然,这与我们的希望不符。
OF标志位就是用于记录溢出的位。如果发生溢出,OF值为1;反之OF值为0。上面的98+99运算后,OF值为1。但需要注意OF和CF的区别。CF针对无符号数,而OF针对有符号数。
cmp指令和检测比较结果的条件跳转指令
cmp指令为比较指令,格式:
cmp 操作对象1,操作对象2
当执行cmp指令时,CPU会对两个操作对象作减法,但不保存在操作对象中,只影响标志寄存器的值。例如,执行如下指令后,ZF值为0,PF值为1,SF值为0,CF值为0,OF值为0:

mov ax,8
mov bx,3
cmp ax,bx

则执行cmp指令后,我们通过标志寄存器的值即可判断两个操作对象的大小。由逻辑推理,我们可以得到:

当ZF值为1时,(ax)=(bx)
当CF值为1时,(ax)<(bx)
当CF值为0且ZF值为0时,(ax)>(bx)

对于有符号数,由于其靠补码表示,故情况较为复杂:

当SF值与OF值不同时,(ax)<(bx)
当SF值与OF值相同时,(ax)≥(bx),然后根据ZF的值判断是否相等

通过上面的讨论,我们知道了不同比较结果下cmp指令的实际意义,下面介绍常用的使用cmp比较结果的方法——检测比较结果的条件转移指令。对于无符号数,其条件转移指令如下:

je/jz:等于(ZF值为1)则转移
jne/jnz:不等于(ZF值为0)则转移
ja/jnbe:高于(CF、ZF值均为0)则转移
jna/jbe:不高于(CF、ZF中至少一个值为1)则转移
jb/jnba:低于(CF值为1)则转移
jnb/jae:不低于(CF值为0)则转移

对于有符号数,其条件转移指令如下:

je/jz:等于(ZF值为1)则转移
jne/jnz:不等于(ZF值为0)则转移
jg/jnle:大于(SF、OF值相等且ZF值为1)则转移
jng/jle:不大于(SF、OF值不等或ZF值为0)则转移
jl/jnge:小于(SF、OF值不等)则转移
jnl/jge:不小于(SF、OF值相等)则转移

如果只想要用其中一个标志位,则可以使用下面针对某一个位的指令:

jc/jo/jp/js:CF/OF/PF/SF值为1则转移
jnc/jno/jnp/jns:CF/OF/PF/SF值为0则转移

以ja为例,以上全部转移指令的格式:

ja 标号

将ja替换为其他指令也可。注意,以上条件转移指令均为短转移。
AF标志(第四位,辅助进退位标志位)
AF标志位用于BCD码运算相关操作。BCD码是一种用一组四个二进制位表示十进制数的编码。若两数相加,其中低四位的最高位有进位,则AF值为1,反之AF值为0。
直接获得标志寄存器中的数据
8086CPU支持直接访问标志寄存器的数据。pushf能够将标志寄存器压栈,popf刚能够从栈中弹出数据到标志寄存器中,格式:

pushf/popf

同时,还有一个lahf指令,能够将标志寄存器的低8位送入ah寄存器。格式:

lahf

在得到标志寄存器中的数据后,我们即可通过位运算指令,建立值-指令映射关系,同样可以实现类似条件转移指令的功能(高级语言中if语句的底层逻辑就是映射)。