本文采用Crative Commons 4.0 许可协议进行许可,来源。
ARM 处理器的指令集可以分为跳转指令、数据处理指令、程序状态寄存器(PSR)处理指令、加载/存储指令、协处理器指令和异常产生指令 6 大指令。
本文只列举一些常见的基本指令,可以正常阅读汇编代码即可。有几个注意点:
- 寄存器:为标号,不加前缀(ARM 汇编中,标号就是一个符号,代表着汇编程序中指令或数据的内存地址)
- 操作数顺序:目标操作数在左,源操作数在右
- 立即数:前加#作为前缀
- 寻址格式:常见的有三种
|
|
|
|
本文中检索不到,全面的可以查看ARM 官网文档。如果想看中文版的资料可以看《汇编器指南》— 第二章、第四章:
一、跳转指令
跳转指令用于实现程序流程的跳转,在 ARM 程序中有以下两种方法可以实现程序流程的跳转:
- 使用专门的跳转指令;
- 直接向程序计数器 PC 写入跳转地址值,通过向程序计数器 PC 写入跳转地址值,可以实现在 4GB 的地址空间中的任意跳转,在跳转之前结合使用 MOV LR,PC 等类似指令,可以保存将来的返回地址值,从而实现在 4GB 连续的线性地址空间的子程序调用。
ARM 指令集中的跳转指令可以完成从当前指令向前或向后的 32MB 的地址空间的跳转,包括以下 4 条指令:
1. B 指令
B 指令是最简单的跳转指令。一旦遇到一个 B 指令,ARM 处理器将立即跳转到给定的目标地址,从那里继续执行。
注意存储在跳转指令中的实际值是相对当前 PC 值的一个偏移量,而不是一个绝对地址,它的值由汇编器来计算(参考寻址方式中的相对寻址)。它是 24 位有符号数,左移两位后有符号扩展为 32 位,表示的有效偏移为 26 位(前后 32MB 的地址空间)。
格式:
|
|
示例:
|
|
补充:BNE 与 BEQ
|
|
tst 和 bne 连用:先是用 tst 进行位与运算,然后将位与的结果与 0 比较,如果不为 0,则跳到 bne 紧跟着的标记(如 bne sleep,则跳到 sleep 处)。 tst 和 beq 连用:先是用 tst 进行位与运算,然后将位与的结果与 0 比较,如果为 0,则跳到 beq 紧跟着的标记(如 bne AAAA,则跳到 AAAA 处)。
2. BL 指令
BL 是另一个跳转指令,但跳转之前,会在寄存器 R14 中保存 PC 的当前内容,因此,可以通过将 R14 的内容重新加载到 PC 中,来返回到跳转指令之后的那个 指令处执行。该指令是实现子程序调用的一个基本但常用的手段。
格式:
|
|
示例:
|
|
3. BLX 指令
BLX 指令从 ARM 指令集跳转到指令中所指定的目标地址,并将处理器的工作状态有 ARM 状态切换到 Thumb 状态,该指令同时将 PC 的当前内容保存到寄存器 R14 中。因此,当子程序使用 Thumb 指令集,而调用者使用 ARM 指令集时,可以通过 BLX 指令实现子程序的调用和处理器工作状态的切换。同时,子程序的返回可以通过将寄存器 R14 值复制到 PC 中来完成。
格式:
|
|
4. BX 指令
BX 指令跳转到指令中所指定的目标地址,目标地址处的指令既可以是 ARM 指令,也可以是 Thumb 指令。
格式:
|
|
二、数据处理指令
此类指令用于对通用寄存器执行运算。
- 它们可对两个寄存器的内容执行加法、减法或按位逻辑等运算,并将结果存放到第三个寄存器中。
- 还可以对单个寄存器中的值执行运算,或者对寄存器中的值与指令中提供的常数(立即值)执行运算。
数据处理指令可分为数据传送指令、比较指令和算术、逻辑运算指令等。
- 数据传送指令用于在寄存器和存储器之间进行数据的双向传输;
- 算术逻辑运算指令完成常用的算术与逻辑的运算,该类指令不但将运算结果保存在目的寄存器中,同时更新 CPSR 中的相应条件标志位;
- 比较指令不保存运算结果,只更新 CPSR 中相应的条件标志位。
数据处理指令如下:
2.1 数据传送指令
1. MOV 指令(传送)
MOV 指令可完成从另一个寄存器、被移位的寄存器或将一个立即数加载到目的寄存器。
格式:
|
|
- S 选项决定指令的操作是否影响 CPSR 中条件标志位的值,当没有 S 时指令不更新 CPSR 中条件标志位的值。
示例:
|
|
2. MVN 指令(取反移动)
MVN 指令可完成从另一个寄存器、被移位的寄存器、或将一个立即数加载到目的寄存器。与 MOV 指令不同之处是在传送之前按位被取反了,即把一个被取反的值 传送到目的寄存器中。
格式:
|
|
- S 决定指令的操作是否影响 CPSR 中条件标志位的值,当没有 S 时指令不更新 CPSR 中条件标志位的值。
示例:
|
|
2.2 比较指令
1. CMP 指令(比较)
CMP 指令用于把一个寄存器的内容和另一个寄存器的内容或立即数进行比较,同时更新 CPSR 中条件标志位的值。
格式:
|
|
该指令进行一次减法运算,但不存储结果,只更改条件标志位。 标志位表示的是操作数 1 与操作数 2 的关系(大、小、相等),例如,当操作数 1 大于操作操作数 2,则此后的有 GT 后缀的指令将可以执行。
示例:
|
|
2. CMN 指令(负数比较)
CMN 指令用于把一个寄存器的内容和另一个寄存器的内容或立即数取反后进行比较,同时更新 CPSR 中条件标志位的值。该指令实际完成操作数 1 和操作数 2 相 加,并根据结果更改条件标志位。
格式:
|
|
示例:
|
|
3. TST 指令(位测试)
TST 指令用于把一个寄存器的内容和另一个寄存器的内容或立即数进行按位的与运算,并根据运算结果更新 CPSR 中条件标志位的值。
格式:
|
|
- 操作数 1 是要测试的数据,而操作数 2 是一个位掩码,该指令一般用来检测是否设置了特定的位。
示例:
|
|
4. TEQ 指令(相等测试)
TEQ 指令用于把一个寄存器的内容和另一个寄存器的内容或立即数进行按位的异或运算,并根据运算结果更新 CPSR 中条件标志位的值。该指令通常用于比较操作数 1 和操作数 2 是否相等。
格式:
|
|
示例:
|
|
2.3 算术运算指令
1. ADD 指令(相加)
ADD 指令用于把两个操作数相加,并将结果存放到目的寄存器中。
格式:
|
|
- 操作数 1 应是一个寄存器,操作数 2 可以是一个寄存器,被移位的寄存器,或一个立即数。
示例:
|
|
2. ADC 指令(带进位相加)
ADC 指令用于把两个操作数相加,再加上 CPSR 中的 C 条件标志位的值,并将结果存放到目的寄存器中。
格式:
|
|
- 它使用一个进位标志位,这样就可以做比 32 位大的数的加法,注意不要忘记设置 S 后缀来更改进位标志。
- 操作数 1 应是一个寄存器
- 操作数 2 可以是一 个寄存器,被移位的寄存器,或一个立即数
示例:
以下指令序列完成两个 128 位数的加法,第一个数由高到低存放在寄存器 R7~R4,第二个数由高到低存放在寄存器 R11~R8,运算结果由高到低存放在寄 存器 R3~R0:
|
|
3. SUB 指令(相减)
SUB 指令用于把操作数 1 减去操作数 2,并将结果存放到目的寄存器中。
格式:
|
|
- 操作数 1 应是一个寄存器
- 操作数 2 可以是一个寄存器,被移位的寄存器,或一个立即数。
该指令可用于有符号数或无符号数的减法运算。
示例:
|
|
4. SBC 指令(带进位减法)
SBC 指令用于把操作数 1 减去操作数 2,再减去 CPSR 中的 C 条件标志位的反码,并将结果存放到目的寄存器中。
格式:
|
|
- 操作数 1 应是一个寄存器
- 操作数 2 可以是一个寄存器,被移位的寄存器,或一个立即数。
该指令使用进位标志来表示借位,这样就可以做大于 32 位的减法,注意不要忘记设置 S 后缀来更改进位标志。该指令可用于有符号数或无符号数的减法运算。
示例:
|
|
5. RSB 指令(逆向/反向减法)
RSB 指令称为逆向减法指令,用于把操作数 2 减去操作数 1,并将结果存放到目的寄存器中。
格式:
|
|
- 操作数 1 应是一个寄存器
- 操作数 2 可以是一个寄存器,被移位的寄存器,或一个立即数。
该指令可用于有符号数或无符号数的减法运算。
示例:
|
|
6. RSC 指令(反向带进位减)
RSC 指令用于把 操作数 2 减去操作数 1,再减去 CPSR 中的 C 条件标志位的反码,并将结果存放到目的寄存器中。
格式:
|
|
- 操作数 1 应是一个寄存器操作
- 数 2 可以是一个寄存器,被移位 的寄存器,或一个立即数。
该指令使用进位标志来表示借位,这样就可以做大于 32 位的减法,注意不要忘记设置 S 后缀来更改进位标志。该指令可用于有符号数或 无符号数的减法运算。
示例:
|
|
—乘法指令与乘加指令—
- ARM 微处理器支持的乘法指令与乘加指令共有 6 条,可分为运算结果为 32 位和运算结果为 64 位两类。
- 与前面的数据处理指令不同,指令中的所有操作数、目的寄存器 必须为通用寄存器,不能对操作数使用立即数或被移位的寄存器,同时,目的寄存器和操作数 1 必须是不同的寄存器。
1. MUL 指令(相乘)
MUL 指令完成将操作数 1 与操作数 2 的乘法运算,并把结果放置到目的寄存器中,同时可以根据运算结果设置 CPSR 中相应的条件标志位。
格式:
|
|
- 操作数 1 和操 作数 2 均为 32 位的有符号数或无符号数。
示例:
|
|
2. MLA 指令(带累加的相乘)
MLA 指令完成将操作数 1 与操作数 2 的乘法运算,再将乘积加上操作数 3,并把结果放置到目的寄存器中,同时可以根据运算结果设置 CPSR 中相应的条件标志位。
格式:
|
|
- 操作数 1 和操作数 2 均为 32 位的有符号数或无符号数。
示例:
|
|
3. SMULL 指令
SMULL 指令完成将操作数 1 与操作数 2 的乘法运算,并把结果的低 32 位放置到目的寄存器 Low 中,结果的高 32 位放置到目的寄存器 High 中,同时可以 根据运算结果设置 CPSR 中相应的条件标志位。
格式:
|
|
- 操作数 1 和操作数 2 均为 32 位的有符号数。
示例:
|
|
4. SMLAL 指令
格式:
|
|
SMLAL 指令完成将操作数 1 与操作数 2 的乘法运算,并把结果的低 32 位同目的寄存器 Low 中的值相加后又放置到目的寄存器 Low 中,结果的高 32 位同目的寄存器 High 中的值相加后又放置到目的寄存器 High 中,同时可以根据运算结果设置 CPSR 中相应的条件标志位。
- 操作数 1 和操作数 2 均为 32 位的有符号数。
- 对于目的寄存器 Low,在指令执行前存放 64 位加数的低 32 位,指令执行后存放结果的低 32 位;
- 对于目的寄存器 High,在指令执行前存放 64 位加数的高 32 位,指令执行后存放结果的高 32 位。
示例:
|
|
5. UMULL 指令
UMULL 指令完成将操作数 1 与操作数 2 的乘法运算,并把结果的低 32 位放置到目的寄存器 Low 中,结果的高 32 位放置到目的寄存器 High 中,同时可以 根据运算结果设置 CPSR 中相应的条件标志位。
格式:
|
|
- 操作数 1 和操作数 2 均为 32 位的无符号数。
示例:
|
|
6. UMLAL 指令
格式:
|
|
UMLAL 指令完成将操作数 1 与操作数 2 的乘法运算,并把结果的低 32 位同目的寄存器 Low 中的值相加后又放置到目的寄存器 Low 中,结果的高 32 位同目的寄存器 High 中的值相加后又放置到目的寄存器 High 中,同时可以根据运算结果设置 CPSR 中相应的条件标志位。
- 操作数 1 和操作数 2 均为 32 位的无符号数;
- 对于目的寄存器 Low,在指令执行前存放 64 位加数的低 32 位,指令执行后存放结果的低 32 位;
- 对于目的寄存器 High,在指令执行前存放 64 位加数的高 32 位,指令执行后存放结果的高 32 位。
示例:
|
|
2.4 逻辑运算指令
1. AND 指令(逻辑位 与)
AND 指令用于在两个操作数上进行逻辑与运算,并把结果放置到目的寄存器中。
格式:
|
|
- 操作数 1 应是一个寄存器
- 操作数 2 可以是一个寄存器,被移位的寄存器,或一个立即数。
该指令常用于屏蔽操作数 1 的某些位。
示例:
|
|
2. ORR 指令(逻辑位 或)
ORR 指令用于在两个操作数上进行逻辑或运算,并把结果放置到目的寄存器中。
格式:
|
|
- 操作数 1 应是一个寄存器
- 操作数 2 可以是一个寄存器,被移位的寄存器,或一个立即数。
该指令常用于设置操作数 1 的某些位。
示例:
|
|
3. EOR 指令(逻辑位 异或)
EOR 指令用于在两个操作数上进行逻辑异或运算,并把结果放置到目的寄存器中。
格式:
|
|
- 操作数 1 应是一个寄存器
- 操作数 2 可以是一个寄存器,被移位的寄存器,或一个立即数
该指令常用于反转操作数 1 的某些位。
示例:
|
|
4. BIC 指令(位清零)
BIC 指令用于清除操作数 1 的某些位,并把结果放置到目的寄存器中。
格式:
|
|
- 操作数 1 应是一个寄存器
- 操作数 2 可以是一个寄存器,被移位的寄存器,或一个立即数。 操作数 2 为 32 位的掩码,如果在掩码中设置了某一位,则清除这一位。未设置的掩码位保持不变。
示例:
|
|
5. LSL ASL(LSL 逻辑左移、ASL 算术左移)
LSL(或 ASL)可完成对通用寄存器中的内容进行逻辑(或算术)的左移操作,按操作数所指定的数量向左移位,低位用零来填充。
格式:
|
|
- 操作数可以是通用寄存器,也可以是立即数(0~31)。
示例:
|
|
6. LSR(逻辑右移)
LSR 可完成对通用寄存器中的内容进行右移的操作,按操作数所指定的数量向右移位,左端用零来填充。
格式:
|
|
- 操作数可以是通用寄存器,也可以是立即数(0~31)。
示例:
|
|
7. ASR(算术右移)
ASR 可完成对通用寄存器中的内容进行右移的操作,按操作数所指定的数量向右移位,左端用第 31 位的值来填充。
格式:
|
|
- 操作数可以是通用寄存器,也可以是立即数(0~31)。
示例:
|
|
8. ROR(向右循环移)
ROR 可完成对通用寄存器中的内容进行循环右移的操作,按操作数所指定的数量向右循环移位,左端用右端移出的位来填充。
格式:
|
|
- 其中,操作数可以是通用寄存器,也可以是立即数(0~31)。显然,当进行 32 位的循环右移操作时,通用寄存器中的值不改变。
示例:
|
|
9. RRX(带扩展向右循环移)
RRX 可完成对通用寄存器中的内容进行带扩展的循环右移的操作,按操作数所指定的数量向右循环移位,左端用进位标志位 C 来填充。
格式:
|
|
- 操作数可以是通用寄存器,也可以是立即数(0~31)。
示例:
|
|
三、程序状态寄存器访问指令
此类指令向通用寄存器或者从通用寄存器往外移动状态寄存器的内容。
1. MRS 指令(从 PSR 移动到寄存器)
MRS 指令用于将程序状态寄存器的内容传送到通用寄存器中。该指令一般用在以下两种情况:
- 当需要改变程序状态寄存器的内容时,可用 MRS 将程序状态寄存器的内容读入通用寄存器,修改后再写回程序状态寄存器。
- 当在异常处理或进程切换时,需要保存程序状态寄存器的值,可先用该指令读出程序状态寄存器的值,然后保存。
格式:
|
|
示例:
|
|
2. MSR 指令(从寄存器移动到 PSR)
MSR 指令用于将操作数的内容传送到程序状态寄存器的特定域中。其中,操作数可以为通用寄存器或立即数。
格式:
|
|
<域>用于设置程序状态寄存器中需要 操作的位,32 位的程序状态寄存器可分为 4 个域:
- 位[31:24]为条件位域,用 f 表示;
- 位[23:16]为状态位域,用 s 表示;
- 位[15:8] 为扩展位域,用 x 表示;
- 位[7:0] 为控制位域,用 c 表示;
该指令通常用于恢复或改变程序状态寄存器的内容,在使用时,一般要在 MSR 指令中指明将要操作的域。
示例:
|
|
四、加载/存储指令
ARM 微处理器支持加载/存储指令用于在寄存器和存储器之间传送数据:
- 加载指令用于将存储器中的数据传送到寄存器;
- 存储指令则完成相反的操作。
数据在存储器中,都是二进制码,计算机单凭数据本身是无法区分数据格式(有符号、无符号、多少位是一个数据),甚至无法区分数据和代码的区别。这个取决于我们使用的汇编指令(计算机进行某些功能处理时候存在两套指令,分别为有符号和无符号数准备,汇编器会根据我们的源代码语义进行选择使用)。
此类指令用于从内存加载(load)单个寄存器的值,或者在内存中存储(store)单个寄存器的值。 它们可加载或存储 32 位字、16 位半字或 8 位有符号或无符号字节。 可以用符号或零扩展字节和半字加载以填充 32 位寄存器。
|
|
上面的指令功能实现,需要依赖状态寄存器(CPSR, current program status register)。CPSR 和其他寄存器不一样,其他寄存器是用来存放数据的,都是整个寄存器具有一个含义。而 CPSR 寄存器是按位起作用的,也就是说,它的每一位都有专门的含义,记录特定的信息。 也叫标记寄存器。
- CPSR 寄存器是 32 位的
- CPSR 的低 8 位(包括 I、F、T 和 M[4:0])称为
控制位
,程序无法修改,除非 CPU 运行于特权模式下,程序才能修改控制位。 - N、Z、C、V 均为
条件标志位
,分别代表运算过程中产生的状态。它们的内容可被算术或逻辑运算的结果所改变,并且可以决定某条指令是否被执行。


此外,还有多个寄存器加载和存储指令,此类指令可从内存加载通用寄存器的任何子集,或者在内存中存储这样的子集。
常用的加载存储指令如下:
1. LDR 指令
LDR 指令用于从存储器中将一个 32 位的字数据传送到目的寄存器中。该指令通常用于从存储器中读取 32 位的字数据到通用寄存器,然后对数据进行处理。
格式:
|
|
- 当程序计数器 PC 作为目的寄存器时,指令从存储器中读取的字数据被当作目的地址,从而可以实现程序流程的跳转。
该指令在程序设计中比较常用,且寻址方式灵活多样,请读者认真掌握。
示例:
|
|
2. LDRB 指令
LDRB 指令用于从存储器中将一个 8 位的字节数据传送到目的寄存器中,同时将寄存器的高 24 位清零。 该指令通常用于从存储器中读取 8 位的字节数据到通用寄存器,然后对数据进行处理。
格式:
|
|
- 当程序计数器 PC 作为目的寄存器时,指令从存储器中读取的字数据被当作目的地址,从而可以实现程序流程的跳转。
示例:
|
|
3. LDRH 指令
LDRH 指令用于从存储器中将一个 16 位的半字数据传送到目的寄存器中,同时将寄存器的高 16 位清零。 该指令通常用于从存储器中读取 16 位的半字数据到通用寄存器,然后对数据进行处理。
格式:
|
|
- 当程序计数器 PC 作为目的寄存器时,指令从存储器中读取的字数据被当作目的地址,从而可以实现程序流程的跳转。
示例:
|
|
4. LDP 指令
LDP 指令用于从内存中加载两个通用寄存器的值。
格式:
|
|
5. STR 指令
STR 指令用于从源寄存器中将一个 32 位的字数据传送到存储器中。 该指令在程序设计中比较常用,且寻址方式灵活多样,使用方式可参考指令 LDR。
格式:
|
|
示例:
|
|
6. STRB 指令
STRB 指令用于从源寄存器中将一个 8 位的字节数据传送到存储器中。该字节数据为源寄存器中的低 8 位。
格式:
|
|
示例:
|
|
7. STRH 指令
STRH 指令用于从源寄存器中将一个 16 位的半字数据传送到存储器中。该半字数据为源寄存器中的低 16 位。
格式:
|
|
示例:
|
|
8. STP 指令
STP 指令用于将两个(一对 pair)通用寄存器的值存储到内存中。
格式:
|
|
9. ADR 指令
将一个立即值与 pc 值相加,并将结果写入目标寄存器
格式:
|
|
10. ADRP 指令
以页为单位的大范围的地址读取指令,这里的 P 就是 page 的意思。取得 page 的基地址存入寄存器
格式:
|
|
示例:
|
|
—批量数据加载/存储指令—
ARM 微处理器所支持批量数据加载/存储指令可以一次在一片连续的存储器单元和多个寄存器之间传送数据,批量加载指令 用于将一片连续的存储器中的数据传送到多个寄存器,批量数据存储指令则完成相反的操作。
常用的加载存储指令如下:
1. LDM(STM)指令(加载、存储多个寄存器)
LDM(或 STM)指令用于从由基址寄存器所指示的一片连续存储器到寄存器列表所指示的多个寄存器之间传送数据,该指令的常见用途是将多个寄存器的内容入栈或出栈。
格式:
|
|
其中:
{类型}
为 以下几种情况:- IA 每次传送后地址加 1;
- IB 每次传送前地址加 1;
- DA 每次传送后地址减 1;
- DB 每次传送前地址减 1;
- FD 满递减堆栈;
- ED 空递减堆栈;
- FA 满递增堆栈;
- EA 空递增堆栈;
{!}
为可选后缀,若选用该后缀,则当数据 传送完毕之后,将最后的地址写入基址寄存器,否则基址寄存器的内容不改变。- 基址寄存器不允许为 R15,寄存器列表可以为 R0~R15 的任意组合。
{∧}
为可选后缀,当指令为 LDM 且寄存器列表中包含 R15,选用该后缀时表示:除了正常的数据传送之外,还将 SPSR 复制到 CPSR。同时,该后缀还表 示传入或传出的是用户模式下的寄存器,而不是当前模式下的寄存器。
示例:
|
|
—数据交换指令—
在寄存器和内存之间交换数据
1. SWP 指令
格式:
|
|
SWP 指令用于将源寄存器 2 所指向的存储器中的字数据传送到目的寄存器中,同时将源寄存器 1 中的字数据传送到源寄存器 2 所指向的存储器中。显然,当源寄存器 1 和目的寄存器为同一个寄存器时,指令交换该寄存器和存储器的内容。
示例:
|
|
SWP{B}:B 是一个可选的后缀。如果存在 B,则交换一个字节。否则,交换一个 32 位字。
2. SWPB 指令
格式:
|
|
SWPB 指令用于将源寄存器 2 所指向的存储器中的字节数据传送到目的寄存器中,目的寄存器的高 24 清零,同时将源寄存器 1 中的字节数据传送到源寄存器 2 所指向的存储器中。
显然,当源寄存器 1 和目的寄存器为同一个寄存器时,指令交换该寄存器和存储器的内容。
示例:
|
|
五、协处理器指令
此类指令支持一种用于扩展 ARM 体系结构的通用方式。
ARM 微处理器可支持多达 16 个协处理器,用于各种协处理操作,在程序执行的过程中,每个协处理器只执行针对自身的协处理指令,忽略 ARM 处理器和其他协处理器的指令。
ARM 的协处理器指令主要用于 ARM 处理器初始化 ARM 协处理器的数据处理操作,以及在 ARM 处理器的寄存器和协处理器的寄存器之间传送数据,和在 ARM 协处理器的寄存器和存储器之间传送数据。
1. CDP 指令
CDP 指令用于 ARM 处理器通知 ARM 协处理器执行特定的操作,若协处理器不能成功完成特定的操作,则产生未定义指令异常。
格式:
|
|
其中协处理器操作码 1 和协处理 器操作码 2 为协处理器将要执行的操作,目的寄存器和源寄存器均为协处理器的寄存器,指令不涉及 ARM 处理器的寄存器和存储器。
示例:
|
|
2. LDC 指令
LDC 指令用于将源寄存器所指向的存储器中的字数据传送到目的寄存器中,若协处理器不能成功完成传送操作,则产生未定义指令异常。
格式:
|
|
其中,{L}选项表示指 令为长读取操作,如用于双精度数据的传输。
示例:
|
|
3. STC 指令
STC 指令用于将源寄存器中的字数据传送到目的寄存器所指向的存储器中,若协处理器不能成功完成传送操作,则产生未定义指令异常。
格式:
|
|
其中,{L}选项表示指 令为长读取操作,如用于双精度数据的传输。
示例:
|
|
4. MCR 指令
MCR 指令用于将 ARM 处理器寄存器中的数据传送到协处理器寄存器中,若协处理器不能成功完成操作,则产生未定义指令异常。
格式:
|
|
其中协处理器操作码 1 和协处理 器操作码 2 为协处理器将要执行的操作,源寄存器为 ARM 处理器的寄存器,目的寄存器 1 和目的寄存器 2 均为协处理器的寄 存器。
示例:
|
|
5. MRC 指令
MRC 指令用于将协处理器寄存器中的数据传送到 ARM 处理器寄存器中,若协处理器不能成功完成操作,则产生未定义指令异常。
格式:
|
|
其中协处理器操作码 1 和协处理器操作码 2 为协处理器将要执行的操作,目的寄存器为 ARM 处理器的寄存器,源寄存器 1 和源寄存器 2 均为协处理器的寄存器。
示例:
|
|
六、异常产生指令
ARM 指令集中提供了两条产生异常的指令,通过这两条指令可以用软件的方法实现异常。
1. SWI 指令
SWI 指令用于产生软件中断,以便用户程序能调用操作系统的系统例程。操作系统在 SWI 的异常处理程序中提供相应的系统服务。
格式:
|
|
指令中 24 位的立即数指定用户程序调用系统例程的类型,相关参数通过通用寄存器传递,当指令中 24 位的立即数被忽略时,用户程序调用系统例程的类型由通用寄存器 R0 的内容决定,同时,参数通过其他通用寄存器传递。
示例:
|
|
2. BKPT 指令
BKPT 指令产生软件断点中断,可用于程序的调试。
格式:
|
|
ARM 汇编伪指令
在 ARM 汇编语言程序里,有一些特殊指令助记符,这些助记符与指令系统的助记符不同,没有相对应的操作码,通常称这些特殊指令助记符为伪指令,他们所完成的操作称为伪操作。
伪指令在源程序中的作用是为完成汇编程序作各种准备工作的,这些伪指令仅在汇编过程中起作用,一旦汇编结束,伪指令的使命就完成。
在 ARM 的汇编程序中,有如下几种伪指令:符号定义伪指令、数据定义伪指令、汇编控制伪指令(包括宏指令)、以及其他伪指令。
一、符号定义(Symbol Definition)伪指令
符号定义伪指令用于定义 ARM 汇编程序中的变量、对变量赋值以及定义寄存器的别名等操作。 常见的符号定义伪指令有如下几种:
- 用于定义全局变量的 GBLA 、GBLL 和 GBLS 。
- 用于定义局部变量的 LCLA 、LCLL 和 LCLS 。
- 用于对变量赋值的 SETA 、SETL 、SETS 。
- 为通用寄存器列表定义名称的 RLIST 。
1. GBLA、GBLL 和 GBLS
GBLA 、GBLL 和 GBLS 伪指令用于定义一个 ARM 程序中的全局变量,并将其初始化。其中:
- GBLA 伪指令用于定义一个全局的数字变量,并初始化为 0 ;
- GBLL 伪指令用于定义一个全局的逻辑变量,并初始化为 F(假);
- GBLS 伪指令用于定义一个全局的字符串变量,并初始化为空;
由于以上三条伪指令用于定义全局变量,因此在整个程序范围内变量名必须唯一。
格式:
|
|
示例:
|
|
2. LCLA、LCLL 和 LCLS
LCLA 、LCLL 和 LCLS 伪指令用于定义一个 ARM 程序中的局部变量,并将其初始化。其中:
- LCLA 伪指令用于定义一个局部的数字变量,并初始化为 0 ;
- LCLL 伪指令用于定义一个局部的逻辑变量,并初始化为 F(假);
- LCLS 伪指令用于定义一个局部的字符串变量,并初始化为空;
以上三条伪指令用于声明局部变量,在其作用范围内变量名必须唯一。
格式:
|
|
示例:
|
|
3. SETA、SETL 和 SETS
伪指令 SETA 、SETL 、SETS 用于给一个已经定义的全局变量或局部变量赋值。
- SETA 伪指令用于给一个数学变量赋值;
- SETL 伪指令用于给一个逻辑变量赋值;
- SETS 伪指令用于给一个字符串变量赋值;
其中,变量名为已经定义过的全局变量或局部变量,表达式为将要赋给变量的值。
格式:
|
|
示例:
|
|
4. RLIST
RLIST 伪指令可用于对一个通用寄存器列表定义名称,使用该伪指令定义的名称可在 ARM 指令 LDM/STM 中使用。
在 LDM/STM 指令中,列表中的寄存器访问次序为根据寄存器的编号由低到高,而与列表中的寄存器排列次序无关。
格式:
|
|
示例:
|
|
二、数据定义(Data Definition)伪指令
数据定义伪指令一般用于为特定的数据分配存储单元,同时可完成已分配存储单元的初始化。 常见的数据定义伪指令有如下几种:
- DCB:用于分配一片连续的字节存储单元并用指定的数据初始化。
- DCW(DCWU):用于分配一片连续的半字存储单元并用指定的数据初始化。
- DCD(DCDU):用于分配一片连续的字存储单元并用指定的数据初始化。
- DCFD(DCFDU):用于为双精度的浮点数分配一片连续的字存储单元并用指定的数据初始化。
- DCFS(DCFSU):用于为单精度的浮点数分配一片连续的字存储单元并用指定的数据初始化。
- DCQ(DCQU):用于分配一片以 8 字节为单位的连续的存储单元并用指定的数据初始化。
- SPACE:用于分配一片连续的存储单元。
- MAP:用于定义一个结构化的内存表首地址。
- FIELD:用于定义一个结构化的内存表的数据域。
1. DCB
DCB 伪指令用于分配一片连续的字节存储单元并用伪指令中指定的表达式初始化。
格式:
|
|
- 表达式可以为 0~255 的数字或字符串。
- DCB 也可用 “=” 代替。
示例:
|
|
2. DCW(或 DCWU)
DCW(或 DCWU)伪指令用于分配一片连续的半字存储单元并用伪指令中指定的表达式初始化。
格式:
|
|
- 表达式可以为程序标号或数字表达式。
用 DCW 分配的字存储单元是半字对齐的,而用 DCWU 分配的字存储单元并不严格半字对齐。
示例:
|
|
3. DCD(或 DCDU)
DCD(或 DCDU)伪指令用于分配一片连续的字存储单元并用伪指令中指定的表达式初始化。
格式:
|
|
- 表达式可以为程序标号或数字表达式。
- DCD 也可 用"&” 代替。
用 DCD 分配的字存储单元是字对齐的,而用 DCDU 分配的字存储单元并不严格字对齐。
示例:
|
|
4. DCFD(或 DCFDU)
DCFD(或 DCFDU)伪指令用于为双精度的浮点数分配一片连续的字存储单元并用伪指令中指定的表达式初始化。
每个双精度的浮点数占据两个字单元。
用 DCFD 分配的字存储单元是字对齐的,而用 DCFDU 分配的字存储单元并不严格字对齐。
格式:
|
|
示例:
|
|
5. DCFS(或 DCFSU)
DCFS(或 DCFSU)伪指令用于为单精度的浮点数分配一片连续的字存储单元并用伪指令中指定的表达式初始化。
每个单精度的浮点数占据一个字单元。
用 DCFS 分配的字存储单元是字对齐的,而用 DCFSU 分配的字存储单元并不严格字对齐。
格式:
|
|
示例:
|
|
6. DCQ(或 DCQU)
DCQ(或 DCQU)伪指令用于分配一片以 8 个字节(双字)为单位的连续存储区域并用伪指令中指定的表达式初始化。
用 DCQ 分配的存储单元是字对齐的,而用 DCQU 分配的存储单元并不严格字对齐。
格式:
|
|
示例:
|
|
7. SPACE
SPACE 伪指令用于分配一片连续的存储区域并初始化为 0。
格式:
|
|
- 表达式为要分配的字节数
- SPACE 也可用 “%” 代替
示例:
|
|
8. MAP
MAP 伪指令用于定义一个结构化的内存表的首地址。
格式:
|
|
- MAP 也可用 “^” 代替。
- 表达式可以为程序中的标号或数学表达式
- 基址寄存器为可选项,当基址寄存器选项不存在时,表达式的值即为内存表的首地址,当该选项存在时,内存表的首地址为表达式的值与基址寄存器的和。
MAP 伪指令通常与 FIELD 伪指令配合使用来定义结构化的内存表。
示例:
|
|
9. FILED
FIELD 伪指令用于定义一个结构化内存表中的数据域。
格式:
|
|
- FILED 也可用 “#” 代替。
- 表达式的值为当前数据域在内存表中所占的字节数。
FIELD 伪指令常与 MAP 伪指令配合使用来定义结构化的内存表。MAP 伪指令定义内存表的首地址,FIELD 伪指令定义内存表中的各个数据域,并可以为 每个数据域指定一个标号供其他的指令引用。
注意 MAP 和 FIELD 伪指令仅用于定义数据结构,并不实际分配存储单元。
示例:
|
|
三、汇编控制(Assembly Control)伪指令
汇编控制伪指令用于控制汇编程序的执行流程,常用的汇编控制伪指令包括以下几条:
1. IF、ELSE、ENDIF
IF 、ELSE 、ENDIF 伪指令能根据条件的成立与否决定是否执行某个指令序列。
格式:
|
|
- 当 IF 后面的逻辑表达式为真,则执行指令序列 1 ,否则执行指令序列 2 。
- ELSE 及指令序列 2 可以没有,此时,当 IF 后面的逻辑表达式为真,则执行指令序列 1 ,否则继续执行后面的指令。
IF 、ELSE 、ENDIF 伪指令可以嵌套使用。
示例:
|
|
2. WHILE、WEND
WHILE 、WEND 伪指令能根据条件的成立与否决定是否循环执行某个指令序列。
格式:
|
|
当 WHILE 后面的逻辑表达式为真,则执行指令序列,该指令序列执行完毕后,再判断逻辑表达式的值,若为真则继续执行,一直到逻辑表达式的值为假。
WHILE 、WEND 伪指令可以嵌套使用。
示例:
|
|
3. MACRO、MEND
MACRO 、MEND 伪指令可以将一段代码定义为一个整体,称为宏指令,然后就可以在程序中通过宏指令多次调用该段代码。
格式:
|
|
[$label] 到底有什么作用?
当宏定义体内部跳转时,这个参数会起到至关重要的作用。要想在宏内部跳转,就必须在宏定义体内部有程序标号如(LOOP),如果不使用参数($label),当在一个程序段内调用两次宏的时候,编译器就会出现错误,因为当汇编时产生了两个相同名字的程序标号。
|
|
宏指令的使用方式和功能与子程序有些相似,子程序可以提供模块化的程序设计、节省存储空间并提高运行速度。但在使用子程序结构时需要保护现场,从而增加了 系统的开销,因此,在代码较短且需要传递的参数较多时,可以使用宏指令代替子程序。
MACRO、MEND 伪指令可以嵌套使用。
4. MEXIT
MEXIT 用于从宏定义中跳转出去。
格式:
|
|
四、其他常用的伪指令
还有一些其他的伪指令,在汇编程序中经常会被使用,包括以下几条:
1. AREA
AREA 伪指令用于定义一个代码段或数据段。
格式:
|
|
- 段名若以数字开头,则该段名需用“|”括起来,如:|1_test| 。
- 属性字段表示该代码段(或数据段)的相关属性,多个属性用逗号分隔。常用的属性如下:
- CODE 属性:用于定义代码段,默认为 READONLY 。
- DATA 属性:用于定义数据段,默认为 READWRITE 。
- READONLY 属性:指定本段为只读,代码段默认为 READONLY 。
- READWRITE 属性:指定本段为可读可写,数据段的默认属性为 READWRITE 。
- ALIGN 属性:使用方式为 ALIGN 表达式。在默认时,ELF(可执行连接文件)的代码段和数据段是按字对齐的,表达式的取值范围为 0~31,相应的对齐方式为 2 表达式次方。
- COMMON 属性:该属性定义一个通用的段,不包含任何的用户代码和数据。各源文件中同名的 COMMON 段共享同一段存储单元。
一个汇编语言程序至少要包含一个段,当程序太长时,也可以将程序分为多个代码段和数据段。
示例:
|
|
2. ALIGN
ALIGN 伪指令可通过添加填充字节的方式,使当前位置满足一定的对齐方式。
格式:
|
|
- 表达式的值用于指定对齐方式,可能的取值为 2 的幂,如 1 、2 、4 、8 、16 等。若未指定表达式,则将当前位置对齐到下一个字的位置。
- 偏移量也为一个数字表达式,若使用该字段,则当前位置的对齐方式为:2 的表达式次幂+偏移量。
示例:
|
|
3. CODE16、CODE32
若在汇编源程序中同时包含 ARM 指令和 Thumb 指令时,可用 CODE16 伪指令通知编译器其后的指令序列为 16 位的 Thumb 指令,CODE32 伪指令 通知编译器其后的指令序列为 32 位的 ARM 指令。
因此,在使用 ARM 指令和 Thumb 指令混合编程的代码里,可用这两条伪指令进行切换,但注意他们只通知 编译器其后指令的类型,并不能对处理器进行状态的切换。
格式:
|
|
示例:
|
|
4. ENTRY
ENTRY 伪指令用于指定汇编程序的入口点。在一个完整的汇编程序中至少要有一个 ENTRY(也可以有多个,当有多个 ENTRY 时,程序的真正入口点由链 接器指定),但在一个源文件里最多只能有一个 ENTRY(可以没有)。
格式:
|
|
示例:
|
|
5. END
END 伪指令用于通知编译器已经到了源程序的结尾。
格式:
|
|
示例:
|
|
6. EQU
EQU 伪指令用于为程序中的常量、标号等定义一个等效的字符名称,类似于 C 语言中的#define 。
格式:
|
|
- EQU 可用“*”代替。
- 名称为 EQU 伪指令定义的字符名称
- 当表达式为 32 位的常量时,可以指定表达式的数据类型,可以有以下三种类型:CODE16 、CODE32 和 DATA
示例:
|
|
7. EXPORT(或 GLOBAL)
EXPORT 伪指令用于在程序中声明一个全局的标号,该标号可在其他的文件中引用。
格式:
|
|
- EXPORT 可用 GLOBAL 代替
- 标号在程序中区分大小写
- [WEAK] 选项声明其他的同名标号优先于该标号被引用
示例:
|
|
8. IMPORT
IMPORT 伪指令用于通知编译器要使用的标号在其他的源文件中定义,但要在当前源文件中引用,而且无论当前源文件是否引用该标号,该标号均会被加入到当前源文件的符号表中。
格式:
|
|
- 标号在程序中区分大小写
- [WEAK] 选项表示当所有的源文件都没有定义这样一个标号时,编译器也不给出错误信息,在多数情况下将该标号置为 0 ,若该标号为 B 或 BL 指令引用,则将 B 或 BL 指令置为 NOP 操作。
示例:
|
|
9. EXTERN
EXTERN 伪指令用于通知编译器要使用的标号在其他的源文件中定义,但要在当前源文件中引用,如果当前源文件实际并未引用该标号,该标号就不会被加入到当前源文件的符号表中。
格式:
|
|
- 标号在程序中区分大小写
- [WEAK] 选项表示当所有的源文件都没有定义这样一个标号时,编译器也不给出错误信息,在多数情况下将该标号置为 0 ,若该标号为 B 或 BL 指令引用,则将 B 或 BL 指令置为 NOP 操作。
示例:
|
|
10. GET(或 INCLUDE)
GET 伪指令用于将一个源文件包含到当前的源文件中,并将被包含的源文件在当前位置进行汇编处理。可以使用 INCLUDE 代替 GET。
汇编程序中常用的方法是在某源文件中定义一些宏指令,用 EQU 定义常量的符号名称,用 MAP 和 FIELD 定义结构化的数据类型,然后用 GET 伪指令将这个 源文件包含到其他的源文件中。使用方法与 C 语言中的"include” 相似。
GET 伪指令只能用于包含源文件,包含目标文件需要使用 INCBIN 伪指令。
格式:
|
|
示例:
|
|
11. INCBIN
INCBIN 伪指令用于将一个目标文件或数据文件包含到当前的源文件中,被包含的文件不作任何变动的存放在当前文件中,编译器从其后开始继续处理。
格式:
|
|
示例:
|
|
12. RN
RN 伪指令用于给一个寄存器定义一个别名。采用这种方式可以方便程序员记忆该寄存器的功能。
格式:
|
|
- 名称为给寄存器定义的别名
- 表达式为寄存器的编码
示例:
|
|
13. ROUT
ROUT 伪指令用于给一个局部变量定义作用范围。在程序中未使用该伪指令时,局部变量的作用范围为所在的 AREA,而使用 ROUT 后,局部变量的作为范围为当前 ROUT 和下一个 ROUT 之间。
格式:
|
|
示例:
|
|