ARM内核寄存器&基本汇编语言讲解-环球短讯

本文目录:

一、ARM内核寄存器

内核寄存器与外设寄存器:

内核寄存器与外设寄存器是完全不同的概念。内核寄存器是指 CPU 内部的寄存器,CPU处理所有指令数据需要用到这些寄存器保存处理数据;外设寄存器是指的 串口,SPI,GPIO口这些设备有关的寄存器。


【资料图】

在我的另一篇博文:FreeRTOS记录(三、FreeRTOS任务调度原理解析_Systick、PendSV、SVC)内核中断管理 章节讲到过Cortex-M的寄存器的相关内容,这里我们再简单说明一下:

1.1 M3/M4内核寄存器

R14 ,连接寄存器(Link Register)

R15,程序计数器(Program Count)

1.2 A7内核寄存器

A7内核的程序状态寄存器 CPSR:

1.3 ARM中的PC指针的值

因为ARM指令采用三级流水线机制,所以PC指针的值并不是当前执行的指令的地址值:

M3/M4/M0:

PC的值 = 当前地址 + 4;

二、ARM汇编语言

ARM芯片属于精简指令集计算机(RISC:Reduced Instruction Set Computing),具体说明在下面这篇博文5.4小结有过说明:

2.1 ARM汇编基础

2.1.1 ARM指令集说明

最初,ARM公司发布了两类指令集:

比如:MOV R0,R1这条指令,可能是16位的,也可能是32位的

那么,在汇编中是如何在 ARM 指令 和 Thumb 指令之间切换呢?

/*ARM指令与Thumb指令的切换*/CODE16;(表示下面是Thumb指令)......;(调用下面的B函数)bxB_addr;(B的地址B_addr的bit0=0,表示跳转过去执行ARM指令);A函数...CODE32;(表示下面是ARM指令)......;B函数;(回到上面的A函数)bxA_addr+1;(A的地址A_addr的bit0=1,表示跳转过去执行Thumb指令).../**********************/

对于A7、ARM7、ARM9 内核而言它们支持 16位的Thumb 指令集 和 32位的 ARM 指令集。

对于M3、M4 内核而言它们支持的是 Thumb2 指令集,它支持16位、32位指令混合编程。

对于内核来说使用的是 ARM指令集 还是 Thumb指令集,就是在 XPSR 和 CPSR。

在M3/M4中, XPSR 寄存器的 T(bit24):1表示 Thumb指令集。

根据上面所述,M3是使用的 Thumb2 指令集,所以会有 T 总是 1。

在A7中 CPSR中的:T(bit5) :控制指令执行状态,表明本指令是 ARM 指令还是 Thumb 指令,通常和 J(bit24)一起表明指令类型。

回到开始的指令 MOV R0,R1

code16;(表示下面指令是16位的Thumb指令)MOVR0,R1code32;(表示下面指令是32位的ARM指令)MOVR0,R1Thumb;(编译器会根据指令自动识别是32位还是16位的Thumb2)MOVR0,R1

2.1.2 ARM汇编格式

编码格式:

不同指令集的编码格式(以 LDR 为例),摘自《ARM ArchitectureReference Manual ARMv7-A and ARMv7-R edition》:

以“数据处理”(其他的还有内存访问,分支跳转等)指令为例,UAL汇编格式为:

Operation表示各类汇编指令,比如 ADD、MOV;cond表示conditon,即该指令执行的条件,如 EQ,NE 等;S表示该指令执行后,是否会影响CPSR寄存器的值, 是否影响CPSR 寄存器的值,书写时影响CPSR,否则不影响;Rd为目的寄存器,用来存储运算的结果;Rn第一个操作数的寄存器Operand2第二个操作数 ,其可以有3种操作源:1-- 立即数2-- 寄存器3-- 寄存器移位

其指令编码格式如下(32位):|bit 31-28 |27-25 |24-21 |20 |19-16 | 15-12 |11-0 ||--|--|--|--|--|--|--|--|--||cond | 001 |Operation |S |Rn |Rd | Operand2 |

举个例子:

...CMPR0,R2;比较R0和R2的值MOVEQR0,R1;加上EQ,如果上面R0的值和R2的值相等的话,才执行此语句...

2.1.3 立即数

在一条ARM数据处理指令中,除了要包含处理的数据值外,还要标识ARM命令名称,控制位,寄存器等其他信息。这样在一条ARM数据处理指令中,能用于表示要处理的数据值的位数只能小于32位;

在上面的ARM汇编格式中我们介绍过,ARM在指令格式中设定,只能用指令机器码32位中的低12位来表示要操作的常数。

什么是立即数?

满足上图中条件的数我们称之为 立即数,立即数就是符合一定规矩的数。

立即数表示方式:每个立即数由一个8位的常数循环右移偶数位得到。其中循环右移的位数由一个4位二进制的两倍表示。

立即数 = 一个8位的常数 循环位移 偶数位

一个8bit常数循环右移(Y*2 = {0,2,4,6,8, ...,26, 28, 30})就得到一个立即数了;(为什么是0到30的偶数下面解释)。

如果需要深入理解立即数,推荐一篇博文:深刻认识 -->> 立即数

ARM处理器是按32位来处理数据的,ARM处理器处理的数据是32位,为了扩展到32位,因此使用了构造的方法,在12位中用8位表示基本数据值,用4位表示位移值,通过用8位基本数据值往右循环移动4位位移值*2次,来表示要操作的常数。

这里要强调最终的循环次数是4位位移值乘以2得到的,所以得到的最终循环次数肯定是一个偶数,为什么要乘以2呢,实质还是因为范围不够,4位表示位移次数,最大才15次(移位0,等于没有循环),加上8位数据还是不够32位,这样只能通过ALU的内部结构设计将4位位移次数乘以2,这样就能用12位表示32位常数了。

所以 12bit 数据存放格式如下:|bit 11-8 |7-0 ||--|--|--|--|--|--|--|--|--||移位 1111b (0~15) | 8bit常数 |

但是我们去判断一个数是否立即数,实在是太麻烦了,但是我们想把任意数值赋给 R0 寄存器,怎么办? 这就需要用到伪指令了,下面说一说什么是伪指令。

2.2 汇编伪指令

汇编语言分成两块:标准指令集和非标准指令集。伪指令属于非标准指令集。

什么是伪指令?

类似于宏的东西,把复杂的有好几天指令进行跳转的完成的小功能级进行新的标签设定,这就是伪指令。

类似于学c语言的时候的预处理,在预处理的时候把它定义于一堆的宏转化为真正的c语言的代码。同样,伪指令是在定义好之后的汇编,汇编的时候会把它翻译成标准指令,也许一条简单的伪指令可以翻译成很多条标准的汇编指令集,所以这就是伪指令最重要的作用。

我们前面说的 CODE16CODE32也是伪指令,用来指定其后的代码格式。

伪指令的作用?

基本的指令可以做各类操作了,但操作起来太麻烦了。伪指令定义了一些类似于带参数的宏,能够更好的实现汇编程序逻辑。(比如我现在要设置一个值给寄存器R0,但下次我修改了寄存器R0之后又需要读出来刚才的值,那我们就要先临时保存值到SPSR,CPSR,然后不断切换。)

伪指令只是在汇编器之前作用,汇编以后翻译为标准的汇编令集。

伪指令的类别伪指令可分为ARM汇编伪指令和GNU汇编伪指令。

2.2.1 GNU汇编伪指令

2.2.2 ARM汇编伪指令

在我的另一篇博文:STM32的启动过程(startup_xxxx.s文件解析)

里面有过一些对伪指令意思的的说明,下面也列出部分说明:

AREA:

其中,段名若以数字开头,则该段名需用 “ | ” 括起来:

指定其后面的指令为 ARM 指令还是 Thumb 指令,前面介绍过。

ENTRY:

用于指定汇编程序的入口点。在一个完整的汇编程序中至少要有一个 ENTRY (也可以有多个,当有多个 ENTRY 时,程序的真正入口点由链接器指定),但在一个源文件里最多只能有一个 ENTRY。

startup_stm32f103xg.s里面就没有。

END:

2.2.3LDRADR

LDR伪指令:

简单介绍了伪指令基础,回到上一小结留下的问题,想要把任意值复制给 R0,怎么处理,我们使用伪指令:LDR R0, =value

编译器会把“伪指令”替换成真实的指令:

LDR R0, =0x12 0x12是立即数,那么替换为:MOV R0, #0x12

LDR R0, =0x123456780x12345678不是立即数,那么替换为:LDR R0, [PC, #offset] // 2. 使用Load Register读内存指令读出值,offset是链接程序时确定的……Label DCD 0x12345678// 1. 编译器在程序某个地方保存有这个值

ADR伪指令:

ADR的意思是:address,用来读某个标号的地址:ADR{cond} Rd, labe1

ADRR0,Loop...LoopADDR0,R0,#1;(它是“伪指令”,会被转换成某条真实的指令,比如:)ADDR0,PC,#val;loop的地址等于PC值加上或者减去val的值,val的值在链接时确定,...LoopADDR0,R0,#1

2.3 ARM汇编指令集

数据传输命令 MOV

MOV指令,用于将数据从一个寄存器拷贝到另外一个寄存器,或者将一个立即数传递到寄存器。

MOV指令的格式为:MOV{条件}{S} 目的寄存器,源操作数。

MOVR0,R1;@将寄存器R1中的数据传递给R0,即R0=R1MOVR0,#0X12;@将立即数0X12传递给R0寄存器,即R0=0X12

状态寄存器访问 MRS 和 MSR

MRS指令,用于将特殊寄存器(如CPSR和SPSR)中的数据传递给通用寄存器。

MSR指令,和MRS相反,用来将普通寄存器的数据传递给特殊寄存器。

;M3/M4MRSR0,APSR;单独读APSRMRSR0,PSR;读组合程序状态;A7MRSR0,CPSR;读组合程序状态...MSRCPSR,R0;传送R0的内容到CPSR

存储器访问 LDR 和 STR

LDR:

LDR 指令用于从存储器中将一个32位的字数据传送到目的寄存器中。该指令通常用于从存储器中读取32位的字数据到通用寄存器,然后对数据进行处理。

指令的格式为:LDR{条件} 目的寄存器,<存储器地址>

当程序计数器PC作为目的寄存器时,指令从存储器中读取的字数据被当作目的地址,从而可以实现程序流程的跳转。

LDRB: 字节操作

LDRH: 半字操作

LDRRd,[Rn,#offset];从存储器Rn+offset的位置读取数据存放到Rd中。...LDRR0,=0X02077004;伪指令,将寄存器地址0X02077004加载到R0中,即R0=0X02077004LDRR1,[R0];读取地址0X02077004中的数据到R1寄存器中...LDR  R0,[R1,R2];将存储器地址为R1+R2的字数据读入寄存器R0。LDRR0,[R1,#8];将存储器地址为R1+8的字数据读入寄存器R0。...LDRR0,[R1,R2,LSL#2]!;将存储器地址R1+R2×4的字数据读入寄存器R0,并将新地址R1+R2×4写入R1。LDRR0,[R1],R2,LSL#2;将存储器地址R1的字数据读入寄存器R0,并将新地址R1+R2×4写入R1。...LDRH  R0,[R1];将存储器地址为R1的半字数据读入寄存器R0,并将R0的高16位清零。

STR 指令用于从源寄存器中将一个32位的字数据传送到存储器中。该指令在程序设计中比较常用,且寻址方式灵活多样,使用方式可参考指令LDR。

指令的格式为:STR{条件} 源寄存器,<存储器地址>

STRB: 字节操作,从源寄存器中将一个8位的字节数据传送到存储器中。该字节数据为源寄存器中的低8位。

STRRd,[Rn,#offset];将Rd中的数据写入到存储器中的Rn+offset位置。...LDRR0,=0X02077004;将寄存器地址0X02077004加载到R0中,即R0=0X02077004LDRR1,=0X2000060c;R1保存要写入到寄存器的值,即R1=0X2000060cSTRR1,[R0];将R1中的值写入到R0中所保存的地址中...STRR0,[R1],#8;将R0中的字数据写入以R1为地址的存储器中,并将新地址R1+8写入R1。STRR0,[R1,#8];将R0中的字数据写入以R1+8为地址的存储器中。...

压栈和出栈 PUSH 和 POP

PUSH :

压栈,将寄存器中的内容,保存到堆栈指针指向的内存上面,将寄存器列表存入栈中。

PUSH < reg list >

POP :

出栈,从栈中恢复寄存器列表

POP < reg list >

push{R0,R1};保存R0,R1push{R0~R3,R12};保存R0~R3和R12,入栈pop{R0~R3};恢复R0到R3,出栈

以M3内核来举个例子:

假设当前 MSP 值为 0x2000 2480;寄存器 R0 的值为 0x3434 3434寄存器 R1 的值为 0x0000 1212寄存器 R2 的值为 0x0000 0000

执行push {R0, R1,R2}之后,

内存地址的数据为:0x2000 2474的值为: 0x3434 3434 (R0的值)0x2000 2478的值为: 0x0000 1212 (R1的值)0x2000 247C的值为: 0x0000 0000 (R2的值)MSP 的值变成 0x2000 2474

高位寄存器保存到高地址,先入栈,如果是POP,数据先出到低位寄存器。

跳转指令 B 和 BL

B :

ARM 处理器将立即跳转到指定的目标地址,不再返回原地址。

B指令的格式为:B{条件} 目标地址

注意,存储在跳转指令中的实际值是相对当前PC值的一个偏移量,而不是一个绝对地址,它的值由汇编器来计算。

//设置栈顶指针后跳转到C语言_start:ldrsp,=0X80200000;设置栈指针bmain;跳到main函数

BL :

BL 跳转指令,在跳转之前会在寄存器LR(R14)中保存当前PC寄存器值,所以可以通过将LR 寄存器中的值重新加载到PC中来继续从跳转之前的代码处运行,是子程序调用的常用的方法。

BLloop;跳转到标号loop处执行时,同时将当前的PC值保存到R14中

BLX:

该跳转指令是当子程序使用Thumb指令集,而调用者使用ARM指令集时使用。

BLX指令从ARM指令集跳转到指令中所指定的目标地址,并将处理器的工作状态有ARM状态切换到Thumb状态,该指令同时将PC的当前内容保存到寄存器R14中。

BX:

BX指令跳转到指令中所指定的目标地址,目标地址处的指令既可以是ARM指令,也可以是Thumb指令。

算数运算指令

算数运算指令和下面的逻辑运算指令表格摘自《【正点原子】I.MX6U嵌入式Linux驱动开发指南》。

逻辑运算指令

三、代码反汇编简析

3.1 不同编译器的反汇编

3.1.1 Keil下面生成反汇编文件

fromelf –text -a -c –output=(改成你想生成的反汇编名字一般是工程名字).dis (需要的axf文件,根据你工程生成axf的路径填写).axf

设置好以后编译之后就会生成反汇编.dis文件:

打开如下所示:

对于上图中的红色圈出来的语句,我们可以根据本文 第 二 章节的第2小节 ARM汇编格式中的介绍来分析一下:

简单分析如下(立即数就不分析了= =!):

3.1.2 gcc下生成反汇编文件

在X86架构下的电脑上生成ARM架构的汇编代码有两种方式:

上述两种方法的区别为:

(1)反汇编可以生成ARM指令操作码,-S生成的汇编没有指令码(2)反汇编的代码是经过编译器优化过的。(3)反汇编代码量很大。

对于ARM Cortex-M,使用的是 arm-none-eabi-objdump,常用指令如下:

对于使用 arm-none-eabi-gcc 工具链(以STM32CUbeMX)的内核来说,使用如下方式生成反汇编文件:

$(OBJDUMP) -D -b binary -m arm (需要的elf文件,一般是工程名字).elf > (改成你想生成的反汇编名字,一般是工程名字).dis # OBJDUMP = arm-none-eabi-objdump

-D表示对全部文件进行反汇编,-b表示二进制,-m表示指令集架构

Makefile修改如下:

...TARGET=D6TPir########################################paths########################################BuildpathBUILD_DIR=build...PREFIX=arm-none-eabi-...OBJDUMP=$(PREFIX)objdumpdis:$(OBJDUMP)-D-bbinary-marm$(BUILD_DIR)/$(TARGET).elf>$(BUILD_DIR)/$(TARGET).dis#$(OBJDUMP)-D-bbinary-marm$(BUILD_DIR)/$(TARGET).bin>$(BUILD_DIR)/$(TARGET).dis

执行 make dis 即可生成 .dis 文件:

打开文件查看,发现怎么这个汇编语言有点不一样:

经过研究了一段时间,加上了-M force-thumb后稍微有点样子了:

在网上有各种参考,但是我都测试过了,并没有找到合适的生成完全和标准汇编一致的那种,-M后面的参数也不能乱加,需要根据自己的交叉编译器,因为这里用的是 arm-none-eabi-gcc,所以可以通过arm-none-eabi-objdump --help查看能用的命令和参数:

gcc工具链下的汇编还是不太熟悉,所以我们下面反汇编文件与 C语言的对比,使用Keil下的反汇编进行说明。

3.2 C和汇编比较分析

前面介绍了那么多,最终用一个简单的程序对比一下C语言反汇编后的汇编语言,加深一下印象,当作个实战总结。

基于STM32L051(Cortex-M0)内核,目的是为了比较C和汇编,用了个最简单的程序来分析,没有用到任务外设,程序如下:

//前面省略...voiddelay(u32count){while(count--);}u32add(u16val1,u16val2){u32add_val;add_val=val1+val2;returnadd_val;}intmain(void){u16a,b;u32c;a=12345;b=45678;c=add(a,b);while(1){c--;delay(200000);}}

反汇编的代码对应部分如下(因为基于硬件平台,其他异常中断,堆,栈,包括其他一些也有汇编代码,这里省略):

;省略前面delay0x080001ae:bf00..NOP0x080001b0:1e01..SUBSr1,r0,#00x080001b2:f1a00001....SUBr0,r0,#10x080001b6:d1fb..BNE0x80001b0;delay+20x080001b8:4770pGBXlradd0x080001ba:4602.FMOVr2,r00x080001bc:1850P.ADDSr0,r2,r10x080001be:4770pGBXlrmain0x080001c0:f2430439C.9.MOVr4,#0x30390x080001c4:f24b256eK.n%MOVr5,#0xb26e0x080001c8:4629)FMOVr1,r50x080001ca:4620FMOVr0,r40x080001cc:f7fffff5....BLadd;0x80001ba0x080001d0:4606.FMOVr6,r00x080001d2:e003..B0x80001dc;main+280x080001d4:1e76v.SUBSr6,r6,#10x080001d6:4804.HLDRr0,[pc,#16];[0x80001e8]=0x30d400x080001d8:f7ffffe9....BLdelay;0x80001ae0x080001dc:e7fa..B0x80001d4;main+20$d0x080001de:0000..DCW00x080001e0:e000ed0c....DCD37581570680x080001e4:05fa0000....DCD1002700800x080001e8:00030d40@...DCD200000;省略后面

3.2.1 MOV后面 立即数的疑问

在对比分析这段代码前,在 main 函数中的第一句:

0x080001c0:f2430439C.9.MOVr4,#0x3039

至于这个问题,网上简单查找了一下,找到一篇有关说明的文章:ARM 汇编的mov操作立即数的疑问 其中有说到,在 keil 公司方网站里关于arm汇编的说明里有这么一段:

SyntaxMOV{cond} Rd, #imm16where: imm16 is any value in the range 0-65535.

所以,是不是在 Keil 中的arm汇编 立即数可以使16位的?

为了验证一下,我稍微修改了一下程序,就是把a的值赋值超过16位(当然定义函数之类的也要跟着改,测试代码中a为u16的无符号整形),测试了一下。

a赋值为 65535,结果如下(65535不是立即数,也可以直接mov):

0x080001c0:f64f75ffO..uMOVr5,#0xffff
0x080001c0:f44f3580O..5MOVr5,#0x10000
0x080001c0:4d08.MLDRr5,[pc,#32];[0x80001e4]=0x1ffff

果然,最后当 a 大于16位,不是立即数时候,会使用伪指令 LDR,所以我们可以得出结论:

在 Keil 中的arm汇编中,16位内(包括16位)的数都直接使用 MOV 赋值,大于16位,如果是立即数,直接使用MOV,不是立即数用LDR (立即数的判断方式还是前面讲的那样)。

3.2.2 反汇编文件解析

对于上面的示例程序的汇编码,简单解析如下:

添加一个有意思的测试对于delay函数中的语句,上图是while(count--);改成while(--count);后汇编代码如下:

对于上面的测试程序,汇编中并没有使用到 PUSH 和 POP 指令,因为程序太简单了,不需要使用到栈,为了能够熟悉下单片机中必须且经常需要用到的 栈,我们稍微修改一下add函数,在add函数中调用了delay函数:

u32add(u16val1,u16val2){u32add_val;add_val=val1+val2;delay(10);returnadd_val;}

对于的add函数汇编代码如下:

add0x080001ba:b5300.PUSH{r4,r5,lr};把r4r5lr的值入栈0x080001bc:4603.FMOVr3,r00x080001be:460c.FMOVr4,r10x080001c0:191d..ADDSr5,r3,r40x080001c2:200a.MOVSr0,#0xa0x080001c4:f7fffff3....BLdelay;0x80001ae0x080001c8:4628(FMOVr0,r50x080001ca:bd300.POP{r4,r5,pc};把r4r5lr的值出栈,

可以看到,因为存在函数的多次调用,main函数中调用add函数,add函数中调用delay函数,所以在add函数运行之前,通过 push把 r4,r5,lr 寄存器的值先存入栈中,等待程序执行完(函数调用结束)再吧 r4,r5,lr 寄存器的值恢复。

上面的程序虽然简单,但是通过我们C程序 与 汇编程序的对比分析,能够让我们更加深入的理解汇编语言。

关键词:

上一篇:江苏2023年退休金上调方案细则和退休人员养老金调整最新消息公布了吗 天天精选
下一篇:最后一页
热门推荐