ARM64 指令简易手册

本文采用Crative Commons 4.0 许可协议进行许可,来源

ARM 处理器的指令集可以分为跳转指令、数据处理指令、程序状态寄存器(PSR)处理指令、加载/存储指令、协处理器指令和异常产生指令 6 大指令。

本文只列举一些常见的基本指令,可以正常阅读汇编代码即可。有几个注意点:

  • 寄存器:为标号,不加前缀(ARM 汇编中,标号就是一个符号,代表着汇编程序中指令或数据的内存地址)
  • 操作数顺序:目标操作数在左,源操作数在右
  • 立即数:前加#作为前缀
  • 寻址格式:常见的有三种
1
2
3
4
5
;寻址格式:
[x10, #0x10]      ; signed offset。 意思是从 x10 + 0x10的地址取值
[sp, #-16]!       ; pre-index。  意思是从 sp-16地址取值,取值完后在把 sp-16  writeback 回 sp
                  ; ! 表示寄存器写回,如果没有!,那么只会从 sp-16 地址读写值,而不会修改 sp 的值
[sp], #16         ; post-index。 意思是从 sp 地址取值,取值完后在把 sp+16 writeback 回 sp
1
2
3
4
5
6
; 举例:
ldr x0,  [x1]              ; `x1`指向的地址里面取出一个 64 位大小的数存入 `x0`
ldp x1,  x2, [x10, #0x10]  ; 从 x10 + 0x10 指向的地址里面取出 2个 64位的数,分别存入x1, x2
str x5,  [sp, #24]         ; 把x5的值(64位数值)存到 sp+24 指向的内存地址上
stp x29, x30, [sp, #-16]!  ; 把 x29, x30的值存到 sp-16的地址上,并且把 sp-=16.
ldp x29, x30, [sp], #16    ; 从sp地址取出 16 byte数据,分别存入x29, x30. 然后 sp+=16;

本文中检索不到,全面的可以查看ARM 官网文档。如果想看中文版的资料可以看《汇编器指南》— 第二章、第四章

一、跳转指令

跳转指令用于实现程序流程的跳转,在 ARM 程序中有以下两种方法可以实现程序流程的跳转:

  • 使用专门的跳转指令;
  • 直接向程序计数器 PC 写入跳转地址值,通过向程序计数器 PC 写入跳转地址值,可以实现在 4GB 的地址空间中的任意跳转,在跳转之前结合使用 MOV LR,PC 等类似指令,可以保存将来的返回地址值,从而实现在 4GB 连续的线性地址空间的子程序调用。

ARM 指令集中的跳转指令可以完成从当前指令向前或向后的 32MB 的地址空间的跳转,包括以下 4 条指令:

1. B 指令

B 指令是最简单的跳转指令。一旦遇到一个 B 指令,ARM 处理器将立即跳转到给定的目标地址,从那里继续执行。

注意存储在跳转指令中的实际值是相对当前 PC 值的一个偏移量,而不是一个绝对地址,它的值由汇编器来计算(参考寻址方式中的相对寻址)。它是 24 位有符号数,左移两位后有符号扩展为 32 位,表示的有效偏移为 26 位(前后 32MB 的地址空间)。

格式:

1
B{条件} 目标地址

示例:

1
2
3
B    Label      ; 程序无条件跳转到标号Label处执行
CMP  R1, #0     ; 当CPSR寄存器中的Z条件码置位时,程序跳转到标号Label处执行
BEQ  Label

补充:BNE 与 BEQ

1
2
3
4
5
6
TST  R0, #0X8
BNE  SuspendUp  ; BNE指令是“不相等(或不为0)跳转指令”:
LDR  R1, #0x00000000

; 先进行and运算,如果R0的第四位不为1,则结果为零,则设置zero=1(继续下面的LDR指令);
; 否则,如果R0的第四位为1,zero=0(跳到SuspendUp处执行)。

tst 和 bne 连用:先是用 tst 进行位与运算,然后将位与的结果与 0 比较,如果不为 0,则跳到 bne 紧跟着的标记(如 bne sleep,则跳到 sleep 处)。 tst 和 beq 连用:先是用 tst 进行位与运算,然后将位与的结果与 0 比较,如果为 0,则跳到 beq 紧跟着的标记(如 bne AAAA,则跳到 AAAA 处)。

2. BL 指令

BL 是另一个跳转指令,但跳转之前,会在寄存器 R14 中保存 PC 的当前内容,因此,可以通过将 R14 的内容重新加载到 PC 中,来返回到跳转指令之后的那个 指令处执行。该指令是实现子程序调用的一个基本但常用的手段。

格式:

1
BL{条件} 目标地址

示例:

1
BL   Label      ; 当程序无条件跳转到标号Label处执行时,同时将当前的 PC值保存到R14(LR)中

3. BLX 指令

BLX 指令从 ARM 指令集跳转到指令中所指定的目标地址,并将处理器的工作状态有 ARM 状态切换到 Thumb 状态,该指令同时将 PC 的当前内容保存到寄存器 R14 中。因此,当子程序使用 Thumb 指令集,而调用者使用 ARM 指令集时,可以通过 BLX 指令实现子程序的调用和处理器工作状态的切换。同时,子程序的返回可以通过将寄存器 R14 值复制到 PC 中来完成。

格式:

1
BLX 目标地址

4. BX 指令

BX 指令跳转到指令中所指定的目标地址,目标地址处的指令既可以是 ARM 指令,也可以是 Thumb 指令。

格式:

1
BX{条件} 目标地址

二、数据处理指令

此类指令用于对通用寄存器执行运算。

  • 它们可对两个寄存器的内容执行加法、减法或按位逻辑等运算,并将结果存放到第三个寄存器中。
  • 还可以对单个寄存器中的值执行运算,或者对寄存器中的值与指令中提供的常数(立即值)执行运算。

数据处理指令可分为数据传送指令、比较指令和算术、逻辑运算指令等。

  • 数据传送指令用于在寄存器和存储器之间进行数据的双向传输;
  • 算术逻辑运算指令完成常用的算术与逻辑的运算,该类指令不但将运算结果保存在目的寄存器中,同时更新 CPSR 中的相应条件标志位;
  • 比较指令不保存运算结果,只更新 CPSR 中相应的条件标志位。

数据处理指令如下:

2.1 数据传送指令

1. MOV 指令(传送)

MOV 指令可完成从另一个寄存器、被移位的寄存器或将一个立即数加载到目的寄存器。

格式:

1
MOV{条件}{S} 目的寄存器,源操作数
  • S 选项决定指令的操作是否影响 CPSR 中条件标志位的值,当没有 S 时指令不更新 CPSR 中条件标志位的值。

示例:

1
2
3
MOV R1,R0          ; 将寄存器R0的值传送到寄存器R1
MOV PC,R14         ; 将寄存器R14的值传送到 PC,常用于子程序返回
MOV R1,R0,LSL#3   ; 将寄存器R0的值左移3位后传送到R1

2. MVN 指令(取反移动)

MVN 指令可完成从另一个寄存器、被移位的寄存器、或将一个立即数加载到目的寄存器。与 MOV 指令不同之处是在传送之前按位被取反了,即把一个被取反的值 传送到目的寄存器中。

格式:

1
MVN{条件}{S} 目的寄存器,源操作数
  • S 决定指令的操作是否影响 CPSR 中条件标志位的值,当没有 S 时指令不更新 CPSR 中条件标志位的值。

示例:

1
MVN R0,#0   ; 将 立即数0取反传送到寄存器R0中,完成后R0=-1

2.2 比较指令

1. CMP 指令(比较)

CMP 指令用于把一个寄存器的内容和另一个寄存器的内容或立即数进行比较,同时更新 CPSR 中条件标志位的值。

格式:

1
CMP{条件} 操作数1,操作数2

该指令进行一次减法运算,但不存储结果,只更改条件标志位。 标志位表示的是操作数 1 与操作数 2 的关系(大、小、相等),例如,当操作数 1 大于操作操作数 2,则此后的有 GT 后缀的指令将可以执行。

示例:

1
2
CMP   R1,R0     ; 将寄存器R1的值与寄存器R0的值相减,并根据 结果设置CPSR的标志位
CMP   R1,#100   ; 将寄存器R1的值与立即数100相减,并根 据结果设置CPSR的标志位

2. CMN 指令(负数比较)

CMN 指令用于把一个寄存器的内容和另一个寄存器的内容或立即数取反后进行比较,同时更新 CPSR 中条件标志位的值。该指令实际完成操作数 1 和操作数 2 相 加,并根据结果更改条件标志位。

格式:

1
CMN{条件} 操作数1,操作数2

示例:

1
2
CMN   R1,R0    ; 将寄存器R1的值与寄存器R0的值相加,并根据 结果设置CPSR 的标志位
CMN   R1,#100  ; 将寄存器R1的值与立即数100相加,并根据 结果设置CPSR的标志位

3. TST 指令(位测试)

TST 指令用于把一个寄存器的内容和另一个寄存器的内容或立即数进行按位的与运算,并根据运算结果更新 CPSR 中条件标志位的值。

格式:

1
TST{条件} 操作数1,操作数2
  • 操作数 1 是要测试的数据,而操作数 2 是一个位掩码,该指令一般用来检测是否设置了特定的位。

示例:

1
2
TST   R1,#%1       ; 用于测试在寄存器R1中是否设置了最低位(%表 示二进制数)
TST   R1,#0xffe    ; 将寄存器R1的值与立即数0xffe按位与,并根据 结果设置CPSR的标志位

4. TEQ 指令(相等测试)

TEQ 指令用于把一个寄存器的内容和另一个寄存器的内容或立即数进行按位的异或运算,并根据运算结果更新 CPSR 中条件标志位的值。该指令通常用于比较操作数 1 和操作数 2 是否相等。

格式:

1
TEQ{条件} 操作数1,操作数2

示例:

1
TEQ  R1,R2   ; 将寄存器R1的值与寄存器R2的值按位异或,并根据结果 设置CPSR的标志位

2.3 算术运算指令

1. ADD 指令(相加)

ADD 指令用于把两个操作数相加,并将结果存放到目的寄存器中。

格式:

1
ADD{条件}{S} 目的寄存器,操作数1,操作数2
  • 操作数 1 应是一个寄存器,操作数 2 可以是一个寄存器,被移位的寄存器,或一个立即数。

示例:

1
2
3
ADD     R0,R1,R2              ; R0 = R1 + R2
ADD     R0,R1,#256            ; R0 = R1 + 256
ADD     R0,R2,R3,LSL#1       ; R0 = R2 + (R3 << 1)

2. ADC 指令(带进位相加)

ADC 指令用于把两个操作数相加,再加上 CPSR 中的 C 条件标志位的值,并将结果存放到目的寄存器中。

格式:

1
ADC{条件}{S} 目的寄存器,操作数1,操作数2
  • 它使用一个进位标志位,这样就可以做比 32 位大的数的加法,注意不要忘记设置 S 后缀来更改进位标志。
  • 操作数 1 应是一个寄存器
  • 操作数 2 可以是一 个寄存器,被移位的寄存器,或一个立即数

示例:

以下指令序列完成两个 128 位数的加法,第一个数由高到低存放在寄存器 R7~R4,第二个数由高到低存放在寄存器 R11~R8,运算结果由高到低存放在寄 存器 R3~R0:

1
2
3
4
ADDS    R0,R4,R8         ;  加低端的字
ADCS    R1,R5,R9         ;  加第二个字,带进位
ADCS    R2,R6,R10        ;  加第三个字,带进位
ADC     R3,R7,R11        ;  加第四个字,带进位

3. SUB 指令(相减)

SUB 指令用于把操作数 1 减去操作数 2,并将结果存放到目的寄存器中。

格式:

1
SUB{条件}{S} 目的寄存器,操作数1,操作数2
  • 操作数 1 应是一个寄存器
  • 操作数 2 可以是一个寄存器,被移位的寄存器,或一个立即数。

该指令可用于有符号数或无符号数的减法运算。

示例:

1
2
3
SUB     R0,R1,R2             ;  R0 = R1 - R2
SUB     R0,R1,#256           ;  R0 = R1 - 256
SUB     R0,R2,R3,LSL#1      ;  R0 = R2 - (R3 << 1)

4. SBC 指令(带进位减法)

SBC 指令用于把操作数 1 减去操作数 2,再减去 CPSR 中的 C 条件标志位的反码,并将结果存放到目的寄存器中。

格式:

1
SBC{条件}{S} 目的寄存器,操作数1,操作数2
  • 操作数 1 应是一个寄存器
  • 操作数 2 可以是一个寄存器,被移位的寄存器,或一个立即数。

该指令使用进位标志来表示借位,这样就可以做大于 32 位的减法,注意不要忘记设置 S 后缀来更改进位标志。该指令可用于有符号数或无符号数的减法运算。

示例:

1
SUBS    R0,R1,R2    ; R0 = R1 - R2 - !C,并根据结果设置CPSR的进位标志位

5. RSB 指令(逆向/反向减法)

RSB 指令称为逆向减法指令,用于把操作数 2 减去操作数 1,并将结果存放到目的寄存器中。

格式:

1
RSB{条件}{S} 目的寄存器,操作数1,操作数2
  • 操作数 1 应是一个寄存器
  • 操作数 2 可以是一个寄存器,被移位的寄存器,或一个立即数。

该指令可用于有符号数或无符号数的减法运算。

示例:

1
2
3
RSB     R0,R1,R2                  ;  R0 = R2 – R1
RSB     R0,R1,#256                ;  R0 = 256 – R1
RSB     R0,R2,R3,LSL#1           ;  R0 = (R3 << 1) - R2

6. RSC 指令(反向带进位减)

RSC 指令用于把 操作数 2 减去操作数 1,再减去 CPSR 中的 C 条件标志位的反码,并将结果存放到目的寄存器中。

格式:

1
RSC{条件}{S} 目的寄存器,操作数1,操作数2
  • 操作数 1 应是一个寄存器操作
  • 数 2 可以是一个寄存器,被移位 的寄存器,或一个立即数。

该指令使用进位标志来表示借位,这样就可以做大于 32 位的减法,注意不要忘记设置 S 后缀来更改进位标志。该指令可用于有符号数或 无符号数的减法运算。

示例:

1
RSC     R0,R1,R2           ; R0 = R2 – R1 - !C

—乘法指令与乘加指令—

  • ARM 微处理器支持的乘法指令与乘加指令共有 6 条,可分为运算结果为 32 位和运算结果为 64 位两类。
  • 与前面的数据处理指令不同,指令中的所有操作数、目的寄存器 必须为通用寄存器,不能对操作数使用立即数或被移位的寄存器,同时,目的寄存器和操作数 1 必须是不同的寄存器。

1. MUL 指令(相乘)

MUL 指令完成将操作数 1 与操作数 2 的乘法运算,并把结果放置到目的寄存器中,同时可以根据运算结果设置 CPSR 中相应的条件标志位。

格式:

1
MUL{条件}{S} 目的寄存器,操作数1,操作数2
  • 操作数 1 和操 作数 2 均为 32 位的有符号数或无符号数。

示例:

1
2
MUL  R0,R1,R2            ; R0 = R1 × R2
MULS R0,R1,R2            ; R0 = R1 × R2,同时设置CPSR中的相关条件标志位

2. MLA 指令(带累加的相乘)

MLA 指令完成将操作数 1 与操作数 2 的乘法运算,再将乘积加上操作数 3,并把结果放置到目的寄存器中,同时可以根据运算结果设置 CPSR 中相应的条件标志位。

格式:

1
MLA{条件}{S} 目的寄存器,操作数1,操作数2,操作数3
  • 操作数 1 和操作数 2 均为 32 位的有符号数或无符号数。

示例:

1
2
MLA   R0,R1,R2,R3            ; R0 = R1 × R2 + R3
MLAS  R0,R1,R2,R3            ; R0 = R1 × R2 + R3,同时设置CPSR中的相关条件标志位

3. SMULL 指令

SMULL 指令完成将操作数 1 与操作数 2 的乘法运算,并把结果的低 32 位放置到目的寄存器 Low 中,结果的高 32 位放置到目的寄存器 High 中,同时可以 根据运算结果设置 CPSR 中相应的条件标志位。

格式:

1
SMULL{条件}{S}   目的寄存器Low,目的寄存器High,操作数1,操作数2
  • 操作数 1 和操作数 2 均为 32 位的有符号数。

示例:

1
2
SMULL   R0,R1,R2,R3     ; R0 = (R2 × R3)的低32位
                          ; R1 = (R2 × R3)的高32位

4. SMLAL 指令

格式:

1
SMLAL{条件}{S}   目的寄存器Low,目的寄存器High,操作数1,操作数2

SMLAL 指令完成将操作数 1 与操作数 2 的乘法运算,并把结果的低 32 位同目的寄存器 Low 中的值相加后又放置到目的寄存器 Low 中,结果的高 32 位同目的寄存器 High 中的值相加后又放置到目的寄存器 High 中,同时可以根据运算结果设置 CPSR 中相应的条件标志位。

  • 操作数 1 和操作数 2 均为 32 位的有符号数。
  • 对于目的寄存器 Low,在指令执行前存放 64 位加数的低 32 位,指令执行后存放结果的低 32 位;
  • 对于目的寄存器 High,在指令执行前存放 64 位加数的高 32 位,指令执行后存放结果的高 32 位。

示例:

1
2
SMLAL   R0,R1,R2,R3       ; R0 = (R2 × R3)的低32位 + R0
                            ; R1 = (R2 × R3)的高32位 + R1

5. UMULL 指令

UMULL 指令完成将操作数 1 与操作数 2 的乘法运算,并把结果的低 32 位放置到目的寄存器 Low 中,结果的高 32 位放置到目的寄存器 High 中,同时可以 根据运算结果设置 CPSR 中相应的条件标志位。

格式:

1
UMULL{条件}{S}   目的寄存器Low,目的寄存器High,操作数1,操作数2
  • 操作数 1 和操作数 2 均为 32 位的无符号数。

示例:

1
2
UMULL   R0,R1,R2,R3       ; R0 = (R2 × R3)的低32位
                            ; R1 = (R2 × R3)的高32位

6. UMLAL 指令

格式:

1
UMLAL{条件}{S}   目的寄存器Low,目的寄存器High,操作数1,操作数2

UMLAL 指令完成将操作数 1 与操作数 2 的乘法运算,并把结果的低 32 位同目的寄存器 Low 中的值相加后又放置到目的寄存器 Low 中,结果的高 32 位同目的寄存器 High 中的值相加后又放置到目的寄存器 High 中,同时可以根据运算结果设置 CPSR 中相应的条件标志位。

  • 操作数 1 和操作数 2 均为 32 位的无符号数;
  • 对于目的寄存器 Low,在指令执行前存放 64 位加数的低 32 位,指令执行后存放结果的低 32 位;
  • 对于目的寄存器 High,在指令执行前存放 64 位加数的高 32 位,指令执行后存放结果的高 32 位。

示例:

1
2
UMLAL   R0,R1,R2,R3            ; R0 = (R2 × R3)的低32位 + R0
                                 ; R1 = (R2 × R3)的高32位 + R1

2.4 逻辑运算指令

1. AND 指令(逻辑位 与)

AND 指令用于在两个操作数上进行逻辑与运算,并把结果放置到目的寄存器中。

格式:

1
AND{条件}{S} 目的寄存器,操作数1,操作数2
  • 操作数 1 应是一个寄存器
  • 操作数 2 可以是一个寄存器,被移位的寄存器,或一个立即数。

该指令常用于屏蔽操作数 1 的某些位。

示例:

1
AND     R0, R0, #3          ; 该指令保持R0的0、1位,其余位清零。

2. ORR 指令(逻辑位 或)

ORR 指令用于在两个操作数上进行逻辑或运算,并把结果放置到目的寄存器中。

格式:

1
ORR{条件}{S} 目的寄存器,操作数1,操作数2
  • 操作数 1 应是一个寄存器
  • 操作数 2 可以是一个寄存器,被移位的寄存器,或一个立即数。

该指令常用于设置操作数 1 的某些位。

示例:

1
ORR R0,R0,#3        ; 该指令设置R0的0、1位,其余位保持不变。

3. EOR 指令(逻辑位 异或)

EOR 指令用于在两个操作数上进行逻辑异或运算,并把结果放置到目的寄存器中。

格式:

1
EOR{条件}{S} 目的寄存器,操作数1,操作数2
  • 操作数 1 应是一个寄存器
  • 操作数 2 可以是一个寄存器,被移位的寄存器,或一个立即数

该指令常用于反转操作数 1 的某些位。

示例:

1
EOR R0,R0,#3        ; 该指令反转R0的0、1位,其余位保持不变。

4. BIC 指令(位清零)

BIC 指令用于清除操作数 1 的某些位,并把结果放置到目的寄存器中。

格式:

1
BIC{条件}{S} 目的寄存器,操作数1,操作数2
  • 操作数 1 应是一个寄存器
  • 操作数 2 可以是一个寄存器,被移位的寄存器,或一个立即数。 操作数 2 为 32 位的掩码,如果在掩码中设置了某一位,则清除这一位。未设置的掩码位保持不变。

示例:

1
BIC R0, R0, #%1011    ; 该指令清除R0中的位 0、1、和 3,其余的位保持不变。

5. LSL ASL(LSL 逻辑左移、ASL 算术左移)

LSL(或 ASL)可完成对通用寄存器中的内容进行逻辑(或算术)的左移操作,按操作数所指定的数量向左移位,低位用零来填充。

格式:

1
通用寄存器,LSL(或ASL) 操作数
  • 操作数可以是通用寄存器,也可以是立即数(0~31)。

示例:

1
MOV   R0, R1, LSL #2          ; 将R1中的内容左移两位后传送到R0 中。

6. LSR(逻辑右移)

LSR 可完成对通用寄存器中的内容进行右移的操作,按操作数所指定的数量向右移位,左端用零来填充。

格式:

1
通用寄存器,LSR 操作数
  • 操作数可以是通用寄存器,也可以是立即数(0~31)。

示例:

1
MOV   R0, R1, LSR #2         ; 将R1中的内容右移两位后传送到R0 中,左端用零来填充。

7. ASR(算术右移)

ASR 可完成对通用寄存器中的内容进行右移的操作,按操作数所指定的数量向右移位,左端用第 31 位的值来填充。

格式:

1
通用寄存器,ASR 操作数
  • 操作数可以是通用寄存器,也可以是立即数(0~31)。

示例:

1
MOV    R0, R1, ASR #2        ; 将R1中的内容右移两位后传送到R0 中,左端用第31位的值来填充。

8. ROR(向右循环移)

ROR 可完成对通用寄存器中的内容进行循环右移的操作,按操作数所指定的数量向右循环移位,左端用右端移出的位来填充。

格式:

1
通用寄存器,ROR 操作数
  • 其中,操作数可以是通用寄存器,也可以是立即数(0~31)。显然,当进行 32 位的循环右移操作时,通用寄存器中的值不改变。

示例:

1
MOV    R0, R1, ROR #2       ; 将R1中的内容循环右移两位后传送到R0 中。

9. RRX(带扩展向右循环移)

RRX 可完成对通用寄存器中的内容进行带扩展的循环右移的操作,按操作数所指定的数量向右循环移位,左端用进位标志位 C 来填充。

格式:

1
通用寄存器,RRX 操作数
  • 操作数可以是通用寄存器,也可以是立即数(0~31)。

示例:

1
MOV   R0, R1, RRX #2         ; 将R1中的内容进行带扩展的循环右移两位 后传送到R0中。

三、程序状态寄存器访问指令

此类指令向通用寄存器或者从通用寄存器往外移动状态寄存器的内容。

1. MRS 指令(从 PSR 移动到寄存器)

MRS 指令用于将程序状态寄存器的内容传送到通用寄存器中。该指令一般用在以下两种情况:

  • 当需要改变程序状态寄存器的内容时,可用 MRS 将程序状态寄存器的内容读入通用寄存器,修改后再写回程序状态寄存器。
  • 当在异常处理或进程切换时,需要保存程序状态寄存器的值,可先用该指令读出程序状态寄存器的值,然后保存。

格式:

1
MRS{条件}  通用寄存器 程序状态寄存器(CPSR或SPSR)

示例:

1
2
MRS R0,CPSR      ; 传送CPSR的内容到R0
MRS R0,SPSR      ; 传送 SPSR的内容到R0

2. MSR 指令(从寄存器移动到 PSR)

MSR 指令用于将操作数的内容传送到程序状态寄存器的特定域中。其中,操作数可以为通用寄存器或立即数。

格式:

1
MSR{条件}    程序状态寄存器(CPSR或SPSR)_<域>,操作数

<域>用于设置程序状态寄存器中需要 操作的位,32 位的程序状态寄存器可分为 4 个域:

  • 位[31:24]为条件位域,用 f 表示;
  • 位[23:16]为状态位域,用 s 表示;
  • 位[15:8] 为扩展位域,用 x 表示;
  • 位[7:0] 为控制位域,用 c 表示;

该指令通常用于恢复或改变程序状态寄存器的内容,在使用时,一般要在 MSR 指令中指明将要操作的域。

示例:

1
2
3
MSR CPSR,R0        ; 传送R0的内容到CPSR
MSR SPSR,R0        ; 传送R0的内容到SPSR
MSR CPSR_c,R0      ; 传送R0的内容到SPSR,但仅仅修改CPSR中的控制位域

四、加载/存储指令

ARM 微处理器支持加载/存储指令用于在寄存器和存储器之间传送数据:

  • 加载指令用于将存储器中的数据传送到寄存器;
  • 存储指令则完成相反的操作。

数据在存储器中,都是二进制码,计算机单凭数据本身是无法区分数据格式(有符号、无符号、多少位是一个数据),甚至无法区分数据和代码的区别。这个取决于我们使用的汇编指令(计算机进行某些功能处理时候存在两套指令,分别为有符号和无符号数准备,汇编器会根据我们的源代码语义进行选择使用)。

此类指令用于从内存加载(load)单个寄存器的值,或者在内存中存储(store)单个寄存器的值。 它们可加载或存储 32 位字、16 位半字或 8 位有符号或无符号字节。 可以用符号或零扩展字节和半字加载以填充 32 位寄存器。

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
ldr = Load Word
ldrh = Load unsigned Half Word
ldrsh = Load signed Half Word
ldrb = Load unsigned Byte
ldrsb = Load signed Bytes

str = Store Word
strh = Store unsigned Half Word
strsh = Store signed Half Word
strb = Store unsigned Byte
strsb = Store signed Byte

上面的指令功能实现,需要依赖状态寄存器(CPSR, current program status register)。CPSR 和其他寄存器不一样,其他寄存器是用来存放数据的,都是整个寄存器具有一个含义。而 CPSR 寄存器是按位起作用的,也就是说,它的每一位都有专门的含义,记录特定的信息。 也叫标记寄存器

  • CPSR 寄存器是 32 位的
  • CPSR 的低 8 位(包括 I、F、T 和 M[4:0])称为控制位,程序无法修改,除非 CPU 运行于特权模式下,程序才能修改控制位。
  • N、Z、C、V 均为条件标志位,分别代表运算过程中产生的状态。它们的内容可被算术或逻辑运算的结果所改变,并且可以决定某条指令是否被执行。

此外,还有多个寄存器加载和存储指令,此类指令可从内存加载通用寄存器的任何子集,或者在内存中存储这样的子集。

常用的加载存储指令如下:

1. LDR 指令

LDR 指令用于从存储器中将一个 32 位的字数据传送到目的寄存器中。该指令通常用于从存储器中读取 32 位的字数据到通用寄存器,然后对数据进行处理。

格式:

1
LDR{条件} 目的寄存器,<存储器地址>
  • 当程序计数器 PC 作为目的寄存器时,指令从存储器中读取的字数据被当作目的地址,从而可以实现程序流程的跳转。

该指令在程序设计中比较常用,且寻址方式灵活多样,请读者认真掌握。

示例:

1
2
3
4
5
6
7
8
LDR R0,[R1]             ; 将存储器地址为R1的字数据读入寄存器R0。
LDR R0,[R1,R2]         ; 将存储器地址为R1+R2的字数据读入寄存器R0。
LDR R0,[R1,#8]         ; 将存储器地址为R1+8的字数据读入寄存器R0。
LDR R0,[R1,R2] !       ; 将存储器地址为R1+R2的字数据读入寄存器R0,并将新地址R1+R2写入R1。
LDR R0,[R1,#8] !      ; 将存储器地址为R1+8的字数据读入寄存器R0,并将新地址 R1+8写入R1。
LDR R0,[R1],R2          ; 将存储器地址为R1的字数据读入寄存器R0,并将新地址 R1+R2写入R1。
LDR R0,[R1,R2,LSL#2]! ; 将存储器地址为R1+R2×4的字数据读入寄存器R0,并将新地址R1+R2×4写入R1。
LDR R0,[R1],R2,LSL#2   ; 将存储器地址为R1的字数据读入 寄存器R0,并将新地址R1+R2×4写入R1。

2. LDRB 指令

LDRB 指令用于从存储器中将一个 8 位的字节数据传送到目的寄存器中,同时将寄存器的高 24 位清零。 该指令通常用于从存储器中读取 8 位的字节数据到通用寄存器,然后对数据进行处理。

格式:

1
LDR{条件}B 目的寄存器,<存储器地址>
  • 当程序计数器 PC 作为目的寄存器时,指令从存储器中读取的字数据被当作目的地址,从而可以实现程序流程的跳转。

示例:

1
2
LDRB R0,[R1]           ; 将存储器地址为R1的字节数据读入寄存器R0,并将R0的高24位清零。
LDRB R0,[R1,#8]       ; 将存储器地址为R1+8的字节数据读入寄存器R0,并将R0的高24位清零。

3. LDRH 指令

LDRH 指令用于从存储器中将一个 16 位的半字数据传送到目的寄存器中,同时将寄存器的高 16 位清零。 该指令通常用于从存储器中读取 16 位的半字数据到通用寄存器,然后对数据进行处理。

格式:

1
LDR{条件}H 目的寄存器,<存储器地址>
  • 当程序计数器 PC 作为目的寄存器时,指令从存储器中读取的字数据被当作目的地址,从而可以实现程序流程的跳转。

示例:

1
2
3
LDRH   R0,[R1]         ; 将存储器地址为R1的半字数据读入寄存器 R0,并将R0的高16位清零。
LDRH   R0,[R1,#8]     ; 将存储器地址为R1+8的半字数据读入寄存器R0,并将R0 的高16位清零。
LDRH   R0,[R1,R2]     ; 将存储器地址为R1+R2的半字数据读入寄存器R0,并将 R0的高16位清零。

4. LDP 指令

LDP 指令用于从内存中加载两个通用寄存器的值。

格式:

1
LDP <Xt1>, <Xt2>, [<Xn|SP>{, #<imm>}]

5. STR 指令

STR 指令用于从源寄存器中将一个 32 位的字数据传送到存储器中。 该指令在程序设计中比较常用,且寻址方式灵活多样,使用方式可参考指令 LDR。

格式:

1
STR{条件} 源寄存器,<存储器地址>

示例:

1
2
STR R0,[R1],#8           ; 将R0中的字数据写入以R1为地址的存储器中,并将新地址R1+8写入R1。
STR R0,[R1,#8]           ; 将R0中的字数据写入以R1+8为地址的存储器中。

6. STRB 指令

STRB 指令用于从源寄存器中将一个 8 位的字节数据传送到存储器中。该字节数据为源寄存器中的低 8 位。

格式:

1
STR{条件}B 源寄存器,<存储器地址>

示例:

1
2
STRB    R0,[R1]             ; 将寄存器R0中的字节数据写入以R1为地 址的存储器中。
STRB    R0,[R1,#8]         ; 将寄存器R0中的字节数据写入以R1+8为地址的存 储器中。

7. STRH 指令

STRH 指令用于从源寄存器中将一个 16 位的半字数据传送到存储器中。该半字数据为源寄存器中的低 16 位。

格式:

1
STR{条件}H 源寄存器,<存储器地址>

示例:

1
2
STRH   R0,[R1]            ; 将寄存器R0中的半字数据写入以R1为地址的 存储器中。
STRH   R0,[R1,#8]        ; 将寄存器R0中的半字数据写入以R1+8 为地址的存储器中。

8. STP 指令

STP 指令用于将两个(一对 pair)通用寄存器的值存储到内存中。

格式:

1
STP <Xt1>, <Xt2>, [<Xn|SP>{, #<imm>}]

9. ADR 指令

将一个立即值与 pc 值相加,并将结果写入目标寄存器

格式:

1
ADR{cond}{.W}  Rd,label

10. ADRP 指令

以页为单位的大范围的地址读取指令,这里的 P 就是 page 的意思。取得 page 的基地址存入寄存器

格式:

1
ADRP{cond}  Rd  label

示例:

1
2
3
4
5
adrp    x2, .LANCHOR0   ; .LANCHOR0是个<lable>——一个大小为4KB的页的基址,指令的作用就是将该页的基址存到寄存器x2中

; 示例2:
adrp    x0, l_.str@PAGE         ; 将符号l.str所在的page基址读入x0
add     x0, x0, l_.str@PAGEOFF  ; x0 = x0 + l.str所在page中的偏移量

—批量数据加载/存储指令—

ARM 微处理器所支持批量数据加载/存储指令可以一次在一片连续的存储器单元和多个寄存器之间传送数据,批量加载指令 用于将一片连续的存储器中的数据传送到多个寄存器,批量数据存储指令则完成相反的操作。

常用的加载存储指令如下:

1. LDM(STM)指令(加载、存储多个寄存器)

LDM(或 STM)指令用于从由基址寄存器所指示的一片连续存储器到寄存器列表所指示的多个寄存器之间传送数据,该指令的常见用途是将多个寄存器的内容入栈或出栈。

格式:

1
LDM(或STM){条件}{类型} 基址寄存器{!},寄存器列表{∧}

其中:

  • {类型} 为 以下几种情况:
    • IA 每次传送后地址加 1;
    • IB 每次传送前地址加 1;
    • DA 每次传送后地址减 1;
    • DB 每次传送前地址减 1;
    • FD 满递减堆栈;
    • ED 空递减堆栈;
    • FA 满递增堆栈;
    • EA 空递增堆栈;
  • {!} 为可选后缀,若选用该后缀,则当数据 传送完毕之后,将最后的地址写入基址寄存器,否则基址寄存器的内容不改变。
    • 基址寄存器不允许为 R15,寄存器列表可以为 R0~R15 的任意组合。
  • {∧} 为可选后缀,当指令为 LDM 且寄存器列表中包含 R15,选用该后缀时表示:除了正常的数据传送之外,还将 SPSR 复制到 CPSR。同时,该后缀还表 示传入或传出的是用户模式下的寄存器,而不是当前模式下的寄存器。

示例:

1
2
STMFD R13!,{R0,R4-R12,LR}        ; 将寄存器列表中的寄存器(R0,R4到R12,LR)存入堆栈。
LDMFD R13!, {R0,R4-R12,PC}       ; 将堆栈内容恢复到寄存器(R0,R4到R12,PC)。

—数据交换指令—

在寄存器和内存之间交换数据

1. SWP 指令

格式:

1
SWP{条件} 目的寄存器,源寄存器1,[源寄存器2]

SWP 指令用于将源寄存器 2 所指向的存储器中的字数据传送到目的寄存器中,同时将源寄存器 1 中的字数据传送到源寄存器 2 所指向的存储器中。显然,当源寄存器 1 和目的寄存器为同一个寄存器时,指令交换该寄存器和存储器的内容。

示例:

1
2
SWP   R0,R1,[R2]     ; 将R2所指向的存储器中的字数据传送到R0,同时将R1 中的字数据传送到R2所指向的存储单元。
SWP   R0,R0,[R1]     ; 该指令完成将R1所指向的存储器中的字数 据与R0中的数据交换。

SWP{B}:B 是一个可选的后缀。如果存在 B,则交换一个字节。否则,交换一个 32 位字。

2. SWPB 指令

格式:

1
SWP{条件}B 目的寄存器,源寄存器1,[源寄存器2]

SWPB 指令用于将源寄存器 2 所指向的存储器中的字节数据传送到目的寄存器中,目的寄存器的高 24 清零,同时将源寄存器 1 中的字节数据传送到源寄存器 2 所指向的存储器中。

显然,当源寄存器 1 和目的寄存器为同一个寄存器时,指令交换该寄存器和存储器的内容。

示例:

1
2
SWPB   R0,R1,[R2]       ; 将R2所指向的存储器中的字节数据传送到 R0,R0的高24位清零,同时将R1中的低8位数据传送到R2所指向的存储单元。
SWPB   R0,R0,[R1]       ; 该指令完成将R1所指向的存储器中的 字节数据与R0中的低8位数据交换。

五、协处理器指令

此类指令支持一种用于扩展 ARM 体系结构的通用方式。

ARM 微处理器可支持多达 16 个协处理器,用于各种协处理操作,在程序执行的过程中,每个协处理器只执行针对自身的协处理指令,忽略 ARM 处理器和其他协处理器的指令。

ARM 的协处理器指令主要用于 ARM 处理器初始化 ARM 协处理器的数据处理操作,以及在 ARM 处理器的寄存器和协处理器的寄存器之间传送数据,和在 ARM 协处理器的寄存器和存储器之间传送数据。

1. CDP 指令

CDP 指令用于 ARM 处理器通知 ARM 协处理器执行特定的操作,若协处理器不能成功完成特定的操作,则产生未定义指令异常。

格式:

1
CDP{条件} 协处理器编码,协处理器操作码1,目的寄存器,源寄存器1,源寄存器2,协处理器操作码2。

其中协处理器操作码 1 和协处理 器操作码 2 为协处理器将要执行的操作,目的寄存器和源寄存器均为协处理器的寄存器,指令不涉及 ARM 处理器的寄存器和存储器。

示例:

1
CDP   P3,2,C12,C10,C3,4  ; 该指令完成协处理器P3的初始化

2. LDC 指令

LDC 指令用于将源寄存器所指向的存储器中的字数据传送到目的寄存器中,若协处理器不能成功完成传送操作,则产生未定义指令异常。

格式:

1
LDC{条件}{L} 协处理器编码,目的寄存器,[源寄存器]

其中,{L}选项表示指 令为长读取操作,如用于双精度数据的传输。

示例:

1
LDC   P3,C4,[R0]        ; 将ARM处理器的寄存器R0所指向的存储器中的字数 据传送到协处理器P3的寄存器C4中。

3. STC 指令

STC 指令用于将源寄存器中的字数据传送到目的寄存器所指向的存储器中,若协处理器不能成功完成传送操作,则产生未定义指令异常。

格式:

1
STC{条件}{L} 协处理器编码,源寄存器,[目的寄存器]

其中,{L}选项表示指 令为长读取操作,如用于双精度数据的传输。

示例:

1
STC   P3,C4,[R0]     ; 将协处理器P3的寄存器C4中的字数据传送到ARM处理 器的寄存器R0所指向的存储器中。

4. MCR 指令

MCR 指令用于将 ARM 处理器寄存器中的数据传送到协处理器寄存器中,若协处理器不能成功完成操作,则产生未定义指令异常。

格式:

1
MCR{条件} 协处理器编码,协处理器操作码1,源寄存器,目的寄存器1,目的寄存器2,协处理器操作码2。

其中协处理器操作码 1 和协处理 器操作码 2 为协处理器将要执行的操作,源寄存器为 ARM 处理器的寄存器,目的寄存器 1 和目的寄存器 2 均为协处理器的寄 存器。

示例:

1
MCR   P3,3,R0,C4,C5,6     ; 将ARM处理器寄存器R0中的数据传送到协处 理器P3的寄存器C4和C5中。

5. MRC 指令

MRC 指令用于将协处理器寄存器中的数据传送到 ARM 处理器寄存器中,若协处理器不能成功完成操作,则产生未定义指令异常。

格式:

1
MRC{条件} 协处理器编码,协处理器操作码1,目的寄存器,源寄存器1,源寄存器2,协处理器操作码2。

其中协处理器操作码 1 和协处理器操作码 2 为协处理器将要执行的操作,目的寄存器为 ARM 处理器的寄存器,源寄存器 1 和源寄存器 2 均为协处理器的寄存器。

示例:

1
MRC   P3,3,R0,C4,C5,6     ; 该指令将协处理器P3的寄存器中的数据传送到 ARM处理器寄存器中。

六、异常产生指令

ARM 指令集中提供了两条产生异常的指令,通过这两条指令可以用软件的方法实现异常。

1. SWI 指令

SWI 指令用于产生软件中断,以便用户程序能调用操作系统的系统例程。操作系统在 SWI 的异常处理程序中提供相应的系统服务。

格式:

1
SWI{条件} 24位的立即数

指令中 24 位的立即数指定用户程序调用系统例程的类型,相关参数通过通用寄存器传递,当指令中 24 位的立即数被忽略时,用户程序调用系统例程的类型由通用寄存器 R0 的内容决定,同时,参数通过其他通用寄存器传递。

示例:

1
SWI   0x02     ; 该指令调用操作系统编号位02的系统例程。

2. BKPT 指令

BKPT 指令产生软件断点中断,可用于程序的调试。

格式:

1
BKPT   16位的立即数

ARM 汇编伪指令

在 ARM 汇编语言程序里,有一些特殊指令助记符,这些助记符与指令系统的助记符不同,没有相对应的操作码,通常称这些特殊指令助记符为伪指令,他们所完成的操作称为伪操作。

伪指令在源程序中的作用是为完成汇编程序作各种准备工作的,这些伪指令仅在汇编过程中起作用,一旦汇编结束,伪指令的使命就完成。

在 ARM 的汇编程序中,有如下几种伪指令:符号定义伪指令、数据定义伪指令、汇编控制伪指令(包括宏指令)、以及其他伪指令。

一、符号定义(Symbol Definition)伪指令

符号定义伪指令用于定义 ARM 汇编程序中的变量、对变量赋值以及定义寄存器的别名等操作。 常见的符号定义伪指令有如下几种:

  • 用于定义全局变量的 GBLA 、GBLL 和 GBLS 。
  • 用于定义局部变量的 LCLA 、LCLL 和 LCLS 。
  • 用于对变量赋值的 SETA 、SETL 、SETS 。
  • 为通用寄存器列表定义名称的 RLIST 。

1. GBLA、GBLL 和 GBLS

GBLA 、GBLL 和 GBLS 伪指令用于定义一个 ARM 程序中的全局变量,并将其初始化。其中:

  • GBLA 伪指令用于定义一个全局的数字变量,并初始化为 0 ;
  • GBLL 伪指令用于定义一个全局的逻辑变量,并初始化为 F(假);
  • GBLS 伪指令用于定义一个全局的字符串变量,并初始化为空;

由于以上三条伪指令用于定义全局变量,因此在整个程序范围内变量名必须唯一。

格式:

1
GBLA(GBLL或GBLS)全局变量名

示例:

1
2
3
4
5
6
7
8
GBLA Test1            ; 定义一个全局的数字变量,变量名为 Test1。
Test1 SETA 0xaa       ; 将该变量赋值为0xaa。

GBLL Test2            ; 定义一个全局的逻辑变量,变量名为 Test2。
Test2 SETL {TRUE}     ; 将该变量赋值为真。

GBLS Test3            ; 定义一个全局的字符串变量,变量名为 Test3。
Test3 SETS “Testing”  ; 将该变量赋值为"Testing”。

2. LCLA、LCLL 和 LCLS

LCLA 、LCLL 和 LCLS 伪指令用于定义一个 ARM 程序中的局部变量,并将其初始化。其中:

  • LCLA 伪指令用于定义一个局部的数字变量,并初始化为 0 ;
  • LCLL 伪指令用于定义一个局部的逻辑变量,并初始化为 F(假);
  • LCLS 伪指令用于定义一个局部的字符串变量,并初始化为空;

以上三条伪指令用于声明局部变量,在其作用范围内变量名必须唯一。

格式:

1
LCLA(LCLL或LCLS) 局部变量名

示例:

1
2
3
4
5
6
7
8
LCLA Test4             ; 声明一个局部的数字变 量,变量名为Test4。
Test3 SETA 0xaa        ; 将该变量赋值为0xaa。

LCLL Test5             ; 声明一个局部的逻辑变 量,变量名为Test5。
Test4 SETL {TRUE}      ; 将该变量赋值为真。

LCLS Test6             ; 定义一个局部的字 符串变量,变量名为Test6。
Test6 SETS “Testing”   ; 将该变量赋值为 "Testing”。

3. SETA、SETL 和 SETS

伪指令 SETA 、SETL 、SETS 用于给一个已经定义的全局变量或局部变量赋值。

  • SETA 伪指令用于给一个数学变量赋值;
  • SETL 伪指令用于给一个逻辑变量赋值;
  • SETS 伪指令用于给一个字符串变量赋值;

其中,变量名为已经定义过的全局变量或局部变量,表达式为将要赋给变量的值。

格式:

1
变量名 SETA(SETL或SETS) 表达式

示例:

1
2
3
4
LCLA Test3              ; 声明一个局部的数字变量,变量名为 Test3。
Test3 SETA 0xaa         ; 将该变量赋值为0xaa。
LCLL Test4              ; 声明一个局部的逻辑变量,变量名为 Test4。
Test4 SETL {TRUE}       ; 将该变量赋值为真。

4. RLIST

RLIST 伪指令可用于对一个通用寄存器列表定义名称,使用该伪指令定义的名称可在 ARM 指令 LDM/STM 中使用。

在 LDM/STM 指令中,列表中的寄存器访问次序为根据寄存器的编号由低到高,而与列表中的寄存器排列次序无关。

格式:

1
名称 RLIST { 寄存器列表 }

示例:

1
RegList RLIST {R0-R5 ,R8 ,R10}  ; 将寄存器列表名称定义为 RegList ,可在ARM指令LDM/STM中通过该名称访问寄存器列表。

二、数据定义(Data Definition)伪指令

数据定义伪指令一般用于为特定的数据分配存储单元,同时可完成已分配存储单元的初始化。 常见的数据定义伪指令有如下几种:

  • DCB:用于分配一片连续的字节存储单元并用指定的数据初始化。
  • DCW(DCWU):用于分配一片连续的半字存储单元并用指定的数据初始化。
  • DCD(DCDU):用于分配一片连续的字存储单元并用指定的数据初始化。
  • DCFD(DCFDU):用于为双精度的浮点数分配一片连续的字存储单元并用指定的数据初始化。
  • DCFS(DCFSU):用于为单精度的浮点数分配一片连续的字存储单元并用指定的数据初始化。
  • DCQ(DCQU):用于分配一片以 8 字节为单位的连续的存储单元并用指定的数据初始化。
  • SPACE:用于分配一片连续的存储单元。
  • MAP:用于定义一个结构化的内存表首地址。
  • FIELD:用于定义一个结构化的内存表的数据域。

1. DCB

DCB 伪指令用于分配一片连续的字节存储单元并用伪指令中指定的表达式初始化。

格式:

1
标号 DCB 表达式
  • 表达式可以为 0~255 的数字或字符串。
  • DCB 也可用 “=” 代替。

示例:

1
Str DCB “This is a test” ; 分配一片连续的字节存储单元并初始化。

2. DCW(或 DCWU)

DCW(或 DCWU)伪指令用于分配一片连续的半字存储单元并用伪指令中指定的表达式初始化。

格式:

1
标号 DCW (或DCWU) 表达式
  • 表达式可以为程序标号或数字表达式。

用 DCW 分配的字存储单元是半字对齐的,而用 DCWU 分配的字存储单元并不严格半字对齐。

示例:

1
DataTest DCW 1 ,2 ,3 ; 分配一片连续的半字存储单元并初始化。

3. DCD(或 DCDU)

DCD(或 DCDU)伪指令用于分配一片连续的字存储单元并用伪指令中指定的表达式初始化。

格式:

1
标号 DCD(或DCDU) 表达式
  • 表达式可以为程序标号或数字表达式。
  • DCD 也可 用"&” 代替。

用 DCD 分配的字存储单元是字对齐的,而用 DCDU 分配的字存储单元并不严格字对齐。

示例:

1
DataTest DCD 4 , 5 , 6 ; 分配一片连续的字存储单元并初始化。

4. DCFD(或 DCFDU)

DCFD(或 DCFDU)伪指令用于为双精度的浮点数分配一片连续的字存储单元并用伪指令中指定的表达式初始化。

每个双精度的浮点数占据两个字单元。

用 DCFD 分配的字存储单元是字对齐的,而用 DCFDU 分配的字存储单元并不严格字对齐。

格式:

1
标号 DCFD(或DCFDU) 表达式

示例:

1
FDataTest DCFD 2E115 , -5E7 ; 分配一片连续的字存储单元并初始化 为指定的双精度数。

5. DCFS(或 DCFSU)

DCFS(或 DCFSU)伪指令用于为单精度的浮点数分配一片连续的字存储单元并用伪指令中指定的表达式初始化。

每个单精度的浮点数占据一个字单元。

用 DCFS 分配的字存储单元是字对齐的,而用 DCFSU 分配的字存储单元并不严格字对齐。

格式:

1
标号 DCFS(或DCFSU) 表达式

示例:

1
FDataTest DCFS 2E5 ,-5E -7 ; 分配一片连续的字存储单元并初始化为 指定的单精度数。

6. DCQ(或 DCQU)

DCQ(或 DCQU)伪指令用于分配一片以 8 个字节(双字)为单位的连续存储区域并用伪指令中指定的表达式初始化。

用 DCQ 分配的存储单元是字对齐的,而用 DCQU 分配的存储单元并不严格字对齐。

格式:

1
标号 DCQ(或DCQU) 表达式

示例:

1
DataTest DCQ 100   ; 分配一片连续的存储单元并初始化为指定的值。

7. SPACE

SPACE 伪指令用于分配一片连续的存储区域并初始化为 0。

格式:

1
标号 SPACE 表达式
  • 表达式为要分配的字节数
  • SPACE 也可用 “%” 代替

示例:

1
DataSpace SPACE 100 ; 分配连续100字节的存储单元并初始化为0 。

8. MAP

MAP 伪指令用于定义一个结构化的内存表的首地址。

格式:

1
MAP 表达式 { ,基址寄存器 }
  • MAP 也可用 “^” 代替。
  • 表达式可以为程序中的标号或数学表达式
  • 基址寄存器为可选项,当基址寄存器选项不存在时,表达式的值即为内存表的首地址,当该选项存在时,内存表的首地址为表达式的值与基址寄存器的和。

MAP 伪指令通常与 FIELD 伪指令配合使用来定义结构化的内存表。

示例:

1
MAP 0x100 , R0  ; 定义结构化内存表首地址的值为0x100+R0 。

9. FILED

FIELD 伪指令用于定义一个结构化内存表中的数据域。

格式:

1
标号 FIELD 表达式
  • FILED 也可用 “#” 代替。
  • 表达式的值为当前数据域在内存表中所占的字节数。

FIELD 伪指令常与 MAP 伪指令配合使用来定义结构化的内存表。MAP 伪指令定义内存表的首地址,FIELD 伪指令定义内存表中的各个数据域,并可以为 每个数据域指定一个标号供其他的指令引用。

注意 MAP 和 FIELD 伪指令仅用于定义数据结构,并不实际分配存储单元。

示例:

1
2
3
4
MAP 0x100    ; 定义结构化内存表首地址的值为0x100。
A FIELD 16   ; 定义A的长度为16字节,位置为0x100。
B FIELD 32   ; 定义B的长度为32字节,位置为0x110。
S FIELD 256  ; 定义S的长度为256字节,位置为0x130。

三、汇编控制(Assembly Control)伪指令

汇编控制伪指令用于控制汇编程序的执行流程,常用的汇编控制伪指令包括以下几条:

1. IF、ELSE、ENDIF

IF 、ELSE 、ENDIF 伪指令能根据条件的成立与否决定是否执行某个指令序列。

格式:

1
2
3
4
5
IF 逻辑表达式
指令序列 1
ELSE
指令序列 2
ENDIF
  • 当 IF 后面的逻辑表达式为真,则执行指令序列 1 ,否则执行指令序列 2 。
  • ELSE 及指令序列 2 可以没有,此时,当 IF 后面的逻辑表达式为真,则执行指令序列 1 ,否则继续执行后面的指令。

IF 、ELSE 、ENDIF 伪指令可以嵌套使用。

示例:

1
2
3
4
5
6
GBLL Test ; 声明一个全局的逻辑变量,变量名为Test
IF Test = TRUE
指令序列 1
ELSE
指令序列 2
ENDIF

2. WHILE、WEND

WHILE 、WEND 伪指令能根据条件的成立与否决定是否循环执行某个指令序列。

格式:

1
2
3
WHILE 逻辑表达式
指令序列
WEND

当 WHILE 后面的逻辑表达式为真,则执行指令序列,该指令序列执行完毕后,再判断逻辑表达式的值,若为真则继续执行,一直到逻辑表达式的值为假。

WHILE 、WEND 伪指令可以嵌套使用。

示例:

1
2
3
4
5
6
GBLA Counter   ; 声明一个全局的数学变量,变量名为Counter
Counter SETA 3 ; 由变量Counter 控制循环次数
……
WHILE Counter < 10
指令序列
WEND

3. MACRO、MEND

MACRO 、MEND 伪指令可以将一段代码定义为一个整体,称为宏指令,然后就可以在程序中通过宏指令多次调用该段代码。

格式:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
MACRO  ; 标识宏定义的开始.
       ; 包含在MACRO和MEND之间的指令序列称为宏定义体
       ; 在一个符号前使用$表示程序被汇编时将使用相应的值来替代$后的符号
[$标号(label)] 宏名 {$参数1, $参数2, ...}  ; 在宏定义体的第一行应声明宏的原型(包含宏名、所需的参数)
       ; [$标号] 在宏指令被展开时,被替换为用户定义的符号。
         ; $label是一个可选参数。
         ; 当宏定义体中用到多个标号时,可以使用类似$label.$internallabel的标号命名规则使程序易读。
       ; $参数为宏指令的参数。当宏指令被展开时将被替换成相应的值,类似于函数中的形式参数,可以在宏定义时为参数指定相应的默认值。
; ...
指令序列
; ...
MEND   ; 标识宏定义的开始

; 定义后,就可以在汇编程序中通过宏名来 调用该指令序列。宏指令可以使用一个或多个参数,当宏指令被展开时,这些参数被相应的值替换。
; 在源程序被编译时,汇编器将宏调用展开。用宏定义中的指令序列代替程序中的宏调用

[$label] 到底有什么作用?

当宏定义体内部跳转时,这个参数会起到至关重要的作用。要想在宏内部跳转,就必须在宏定义体内部有程序标号如(LOOP),如果不使用参数($label),当在一个程序段内调用两次宏的时候,编译器就会出现错误,因为当汇编时产生了两个相同名字的程序标号。

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
; 宏的定义体:
MACRO
$PM DELAY $CanShu
$PM
          LDR    R7,=$CanShu   ;
          ;LDR  R7,[R7] ;此时参数是一个立即数 如果是变量的话 是会用到这一句
$PM.LOOP
          SUBS R7,R7,#0X01
          BNE  $PM.LOOP
MEND


; 在程序段中的使用:(使用两次)
...
AA    DELAY 0X000005F0  ; 0x00000FF0是一个参数 在此处是一个立即数,用户可自行使用为变量等
...
BB    DELAY 0X00000FF0
...

; 此时调用多次,编译器就不会出现问题,例子中的AA和BB仅仅是一个标号,用户可以自行书写,因为在宏指令被展开时,这个符号在汇编时将使用相应的值替代

宏指令的使用方式和功能与子程序有些相似,子程序可以提供模块化的程序设计、节省存储空间并提高运行速度。但在使用子程序结构时需要保护现场,从而增加了 系统的开销,因此,在代码较短且需要传递的参数较多时,可以使用宏指令代替子程序。

MACRO、MEND 伪指令可以嵌套使用。

4. MEXIT

MEXIT 用于从宏定义中跳转出去。

格式:

1
MEXIT

四、其他常用的伪指令

还有一些其他的伪指令,在汇编程序中经常会被使用,包括以下几条:

1. AREA

AREA 伪指令用于定义一个代码段或数据段。

格式:

1
AREA 段名 属性1 ,属性2 ,……
  • 段名若以数字开头,则该段名需用“|”括起来,如:|1_test| 。
  • 属性字段表示该代码段(或数据段)的相关属性,多个属性用逗号分隔。常用的属性如下:
    • CODE 属性:用于定义代码段,默认为 READONLY 。
    • DATA 属性:用于定义数据段,默认为 READWRITE 。
    • READONLY 属性:指定本段为只读,代码段默认为 READONLY 。
    • READWRITE 属性:指定本段为可读可写,数据段的默认属性为 READWRITE 。
    • ALIGN 属性:使用方式为 ALIGN 表达式。在默认时,ELF(可执行连接文件)的代码段和数据段是按字对齐的,表达式的取值范围为 0~31,相应的对齐方式为 2 表达式次方。
    • COMMON 属性:该属性定义一个通用的段,不包含任何的用户代码和数据。各源文件中同名的 COMMON 段共享同一段存储单元。

一个汇编语言程序至少要包含一个段,当程序太长时,也可以将程序分为多个代码段和数据段。

示例:

1
AREA Init ,CODE ,READONLY   ; 该伪指令定义了一个代码段,段 名为Init ,属性为只读。

2. ALIGN

ALIGN 伪指令可通过添加填充字节的方式,使当前位置满足一定的对齐方式。

格式:

1
ALIGN { 表达式 { ,偏移量 }}
  • 表达式的值用于指定对齐方式,可能的取值为 2 的幂,如 1 、2 、4 、8 、16 等。若未指定表达式,则将当前位置对齐到下一个字的位置。
  • 偏移量也为一个数字表达式,若使用该字段,则当前位置的对齐方式为:2 的表达式次幂+偏移量。

示例:

1
2
3
AREA Init ,CODE ,READONLY ,ALIEN=3  ; 指定后面的指令为8字节对齐。
指令序列
END

3. CODE16、CODE32

若在汇编源程序中同时包含 ARM 指令和 Thumb 指令时,可用 CODE16 伪指令通知编译器其后的指令序列为 16 位的 Thumb 指令,CODE32 伪指令 通知编译器其后的指令序列为 32 位的 ARM 指令。

因此,在使用 ARM 指令和 Thumb 指令混合编程的代码里,可用这两条伪指令进行切换,但注意他们只通知 编译器其后指令的类型,并不能对处理器进行状态的切换。

格式:

1
CODE16(或CODE32)

示例:

1
2
3
4
5
6
7
8
9
AREA Init ,CODE ,READONLY   ……
CODE32 ; 通知编译器其后的指令为32位的 ARM指令
LDR R0 ,=NEXT+1 ; 将跳转地址放入寄存器R0
BX R0 ;  程序跳转到新的位置执行, 并将处理器切换到Thumb工作状态
……
CODE16 ;  通知编译器其后的指令为16位的 Thumb指令
NEXT LDR R3,=0x3FF
……
END ;

4. ENTRY

ENTRY 伪指令用于指定汇编程序的入口点。在一个完整的汇编程序中至少要有一个 ENTRY(也可以有多个,当有多个 ENTRY 时,程序的真正入口点由链 接器指定),但在一个源文件里最多只能有一个 ENTRY(可以没有)。

格式:

1
ENTRY

示例:

1
2
3
AREA Init ,CODE ,READONLY
ENTRY ;  指定应用程序的入口点
……

5. END

END 伪指令用于通知编译器已经到了源程序的结尾。

格式:

1
END

示例:

1
2
3
AREA Init ,CODE ,READONLY
……
END ; 指定应用程序的结尾

6. EQU

EQU 伪指令用于为程序中的常量、标号等定义一个等效的字符名称,类似于 C 语言中的#define 。

格式:

1
名称 EQU 表达式 { ,类型 }
  • EQU 可用“*”代替。
  • 名称为 EQU 伪指令定义的字符名称
  • 当表达式为 32 位的常量时,可以指定表达式的数据类型,可以有以下三种类型:CODE16 、CODE32 和 DATA

示例:

1
2
Test EQU 50            ; 定义标号Test 的值为50。
Addr EQU 0x55 ,CODE32  ; 定义Addr的值为0x55 ,且该处为32位的ARM指令。

7. EXPORT(或 GLOBAL)

EXPORT 伪指令用于在程序中声明一个全局的标号,该标号可在其他的文件中引用。

格式:

1
EXPORT 标号 {[WEAK]}
  • EXPORT 可用 GLOBAL 代替
  • 标号在程序中区分大小写
  • [WEAK] 选项声明其他的同名标号优先于该标号被引用

示例:

1
2
3
AREA Init ,CODE ,READONLY
EXPORT Stest ; 声明一个可全局引用的标号Stest
END

8. IMPORT

IMPORT 伪指令用于通知编译器要使用的标号在其他的源文件中定义,但要在当前源文件中引用,而且无论当前源文件是否引用该标号,该标号均会被加入到当前源文件的符号表中。

格式:

1
IMPORT 标号 {[WEAK]}
  • 标号在程序中区分大小写
  • [WEAK] 选项表示当所有的源文件都没有定义这样一个标号时,编译器也不给出错误信息,在多数情况下将该标号置为 0 ,若该标号为 B 或 BL 指令引用,则将 B 或 BL 指令置为 NOP 操作。

示例:

1
2
3
AREA Init ,CODE ,READONLY
IMPORT Main ; 通知编译器当前文件要引用标号Main,但Main在其他源文件中定 义。
END

9. EXTERN

EXTERN 伪指令用于通知编译器要使用的标号在其他的源文件中定义,但要在当前源文件中引用,如果当前源文件实际并未引用该标号,该标号就不会被加入到当前源文件的符号表中。

格式:

1
EXTERN 标号 {[WEAK]}
  • 标号在程序中区分大小写
  • [WEAK] 选项表示当所有的源文件都没有定义这样一个标号时,编译器也不给出错误信息,在多数情况下将该标号置为 0 ,若该标号为 B 或 BL 指令引用,则将 B 或 BL 指令置为 NOP 操作。

示例:

1
2
3
AREA Init ,CODE ,READONLY
EXTERN Main   ; 通知编译器当前文件要引用标号Main,但Main在其他源文件中定 义。
END

10. GET(或 INCLUDE)

GET 伪指令用于将一个源文件包含到当前的源文件中,并将被包含的源文件在当前位置进行汇编处理。可以使用 INCLUDE 代替 GET。

汇编程序中常用的方法是在某源文件中定义一些宏指令,用 EQU 定义常量的符号名称,用 MAP 和 FIELD 定义结构化的数据类型,然后用 GET 伪指令将这个 源文件包含到其他的源文件中。使用方法与 C 语言中的"include” 相似。

GET 伪指令只能用于包含源文件,包含目标文件需要使用 INCBIN 伪指令。

格式:

1
GET 文件名

示例:

1
2
3
4
AREA Init ,CODE ,READONLY
GET a1.s      ; 通知编译器当前源文件包含源文件a1.s
GET C:\a2.s  ; 通知编译器当前源文件包含源文件C:\a2.s
END

11. INCBIN

INCBIN 伪指令用于将一个目标文件或数据文件包含到当前的源文件中,被包含的文件不作任何变动的存放在当前文件中,编译器从其后开始继续处理。

格式:

1
INCBIN 文件名

示例:

1
2
3
4
AREA Init ,CODE ,READONLY
INCBIN a1.dat     ; 通知编译器当前源文件包含文件a1.dat
INCBIN C:\a2.txt ; 通知编译器当前源文件包含文件C:\a2.txt
END

12. RN

RN 伪指令用于给一个寄存器定义一个别名。采用这种方式可以方便程序员记忆该寄存器的功能。

格式:

1
名称 RN 表达式
  • 名称为给寄存器定义的别名
  • 表达式为寄存器的编码

示例:

1
Temp RN R0   ; 将R0定义一个别名Temp

13. ROUT

ROUT 伪指令用于给一个局部变量定义作用范围。在程序中未使用该伪指令时,局部变量的作用范围为所在的 AREA,而使用 ROUT 后,局部变量的作为范围为当前 ROUT 和下一个 ROUT 之间。

格式:

1
{名称} ROUT

示例:

1
xxxx
提交: 484dd0ee   环境: production   Hugo: 0.142.0   主题: 3.30.0-modified   时间: 1740227299665760   语言: zh-cn
作者对于因使用或解读所提供内容而导致的任何直接或间接后果不承担任何责任。
使用 Hugo 构建
主题 StackJimmy 设计