(第2版)
主讲内容 第1章 嵌入式系统概述 第2章 ARM微处理器概述与编程模型 第3章 ARM9指令系统 第4章 嵌入式程序设计基础 第1章 嵌入式系统概述 第2章 ARM微处理器概述与编程模型 第3章 ARM9指令系统 第4章 嵌入式程序设计基础 第5章 嵌入式内部可编程模块 第6章 嵌入式接口技术应用 第7章 软件开发环境
第4章 嵌入式程序设计基础 基于ARM的编译器一般都支持汇编语言的程序设计、C/C++语言的程序设计及两者的混合编程。 第4章 嵌入式程序设计基础 基于ARM的编译器一般都支持汇编语言的程序设计、C/C++语言的程序设计及两者的混合编程。 本章介绍ARM的嵌入式程序的基础知识 伪指令 汇编语言的语句格式 汇编语言 C/C++语言的混合编程……..
4.1 伪指令 在ARM汇编语言程序里,有一些特殊指令助记符,这些助记符与指令系统的助记符不同,没有相对应的操作码,通常称这些特殊指令助记符为伪指令,他们所完成的操作称为伪操作。 伪指令在源程序中的作用是既要把正常的程序用指令表达给计算机以外,又要把程序设计者的意图表达给编译器. 例如:要告诉编译器程序段的开始和结束,需要定义数据等.
4.1 伪指令 在ARM的汇编程序中,我们把伪指令分为三部分介绍: 通用伪指令 与ARM指令相关的伪指令 与Thumb指令相关的伪指令
4.1.1 通用伪指令 通用伪指令包括: 符号定义伪指令 数据定义伪指令 汇编控制伪指令 及其他一些常用伪指令等。
4.1.1 通用伪指令 1.符号定义伪指令 (1)GBLA、GBLL和GBLS 4.1.1 通用伪指令 1.符号定义伪指令 符号定义伪指令用于声明ARM汇编程序中的变量、对变量赋值以及定义寄存器的名称等操作。 常见的符号定义伪指令有如下几种: (1)GBLA、GBLL和GBLS 语法格式: GBLA(GBLL或GBLS) 全局变量名 GBLA、GBLL和GBLS伪指令是声明全局变量的伪指令,用于定义一个ARM程序中的全局变量,并将其初始化。
4.1.1 通用伪指令 1.符号定义伪指令 (1)GBLA、GBLL和GBLS 4.1.1 通用伪指令 1.符号定义伪指令 符号定义伪指令用于声明ARM汇编程序中的变量、对变量赋值以及定义寄存器的名称等操作。 常见的符号定义伪指令有如下几种: (1)GBLA、GBLL和GBLS 其中: GBLA用于声明一个全局的数字变量,并初始化为0; GBLL伪指令用于声明一个全局的逻辑变量,并初始化为F(假); GBLS伪指令用于声明一个全局的字符串变量,并初始化为空;对于全局变量来说,变量名在源程序中必须是唯一的。
4.1.1 通用伪指令 指令示例: GBLA DATE1 ;声明一个全局数字变量DATE1 GBLL DATE1 4.1.1 通用伪指令 指令示例: GBLA DATE1 ;声明一个全局数字变量DATE1 GBLL DATE1 ;声明一个全局逻辑变量DATE2 GBLS DATA3 ;声明一个全局的字符串变量DATE3 DATE3 SETS“Testing” ;将该变量赋值为“Testing”
4.1.1 通用伪指令 (2)LCLA、LCLL和LCLS 语法格式: LCLA(LCLL或LCLS) 局部变量名 4.1.1 通用伪指令 (2)LCLA、LCLL和LCLS 语法格式: LCLA(LCLL或LCLS) 局部变量名 LCLA、LCLL和LCLS伪指令是声明局部变量伪指令,用于定义一个ARM程序中的局部变量,并将其初始化。 其中: LCLA用于声明一个局部的数字变量,并初始化为0; LCLL用于声明一个局部的逻辑变量,并初始化为F(假); LCLS用于声明一个局部的字符串变量,并初始化为空。对于局部变量来说,变量名在使用的范围内必须是唯一的,范围限制在定义这个变量的宏指令程序段内。
4.1.1 通用伪指令 指令示例: LCLA DATE4 ;声明一个局部数字变量DATE4 LCLL DATE5 4.1.1 通用伪指令 指令示例: LCLA DATE4 ;声明一个局部数字变量DATE4 LCLL DATE5 ;声明一个局部的逻辑变量DATE5 DATA4 SETL 0x10 ;为变量DATE4赋值为0x10 LCLS DATA6 ;声明一个局部的字符串变量DATA6
4.1.1 通用伪指令 (3)SETA、SETL和SETS 语法格式: 变量名 SETA(SETL或SETS)表达式 4.1.1 通用伪指令 (3)SETA、SETL和SETS 语法格式: 变量名 SETA(SETL或SETS)表达式 SETA、SETL、SETS是变量赋值伪指令,用于给一个已经定义的全局变量或局部变量赋值。 其中: SETA用于给一个数学变量赋值; SETL用于给一个逻辑变量赋值; SETS用于给一个字符串变量赋值;
4.1.1 通用伪指令 指令示例: GBLA EXAMP1 ;先声明一个全局数字变量EXAMP1 EXAMP1 SETA 0xaa 4.1.1 通用伪指令 指令示例: GBLA EXAMP1 ;先声明一个全局数字变量EXAMP1 EXAMP1 SETA 0xaa ;将变量EXAMP1赋值为0xaa LCLL EXAMP2 ;声明一个局部的逻辑变量EXAMP2 EXAMP1 SETL {TRUE} ;将变量EXAMP1赋值为TRUE GBLA EXAMP3 ;先声明一个全局字符串变量EXAMP3 EXAMP3 SETS “string” ;将变量EXAMP3赋值为string
4.1.1 通用伪指令 (4)RLIST 语法格式: 名称 RLIST {寄存器列表} 4.1.1 通用伪指令 (4)RLIST 语法格式: 名称 RLIST {寄存器列表} RLIST伪指令是定义通用寄存列表伪指令,通用寄存器列表定义主要应用在堆栈操作或多寄存器传送中,即使用该伪指令定义的名称可在ARM指令LDM/STM中使用。 在LDM/STM指令中,列表中的寄存器访问次序为根据寄存器的编号由低到高,而与列表中的寄存器排列次序无关。
4.1.1 通用伪指令 指令示例: RegList RLIST {R0-R5,R8 } ;定义寄存器列表为RegList 在程序中使用: 4.1.1 通用伪指令 指令示例: RegList RLIST {R0-R5,R8 } ;定义寄存器列表为RegList 在程序中使用: STMFD SP!,RegList ;存储列表到堆栈 LDMIA R5,RegList ;加载列表
4.1.1 通用伪指令 2.数据定义伪指令 数据定义伪指令一般用于为特定的数据分配存储单元,同时可完成已分配存储单元的初始化。常见的数据定义伪指令有如下几种: (1)DCB 语法格式: 标号 DCB 表达式 DCB伪指令是字节分配内存单元伪指令,用来分配一片连续的字节存储单元并用伪指令中指定的数值或字符初始化。其中,数值范围为0~255,DCB也可用“=”代替。
4.1.1 通用伪指令 指令示例: String DCB “This is a test!” ;分配一片连续的字节存储单元并初始化。 4.1.1 通用伪指令 指令示例: String DCB “This is a test!” ;分配一片连续的字节存储单元并初始化。 DATA2 DCB 15,25,62,00 ;为数字常量15,25,62,00分片内存单元
4.1.1 通用伪指令 (2)DCW(或DCWU) 语法格式: 标号 DCW(或DCWU)表达式 4.1.1 通用伪指令 (2)DCW(或DCWU) 语法格式: 标号 DCW(或DCWU)表达式 DCW(或DCWU)伪指令是为半字分配内存单元,其中,表达式可以为程序标号或数字表达式。 伪指令DCW用于为半字分配一段半字对准的内存单元,并用指定的数据初始化;伪指令DCWU用于为半字分配一段可以非半字对准的内存单元,并用指定的数据初始化。
4.1.1 通用伪指令 指令示例: DATA1 DCW 1,2,3 ;分配一片连续的半字存储单元并初始化为1,2,3。 4.1.1 通用伪指令 指令示例: DATA1 DCW 1,2,3 ;分配一片连续的半字存储单元并初始化为1,2,3。 DATA2 DCWU 45,0x2a*0x2a ;分配一片非半字对准存储单元并初始化。
4.1.1 通用伪指令 (3)DCD(或DCDU) 语法格式: 标号 DCD(或DCDU) 表达式 4.1.1 通用伪指令 (3)DCD(或DCDU) 语法格式: 标号 DCD(或DCDU) 表达式 DCD(或DCDU)伪指令是为字分配内存单元伪指令,其中,表达式可以为程序标号或数字表达式。DCD也可用“&”代替。 伪指令DCD用来为字分配一段对准的内存单元,并用指定的数值或标号初始化;伪指令DCDU用来为字分配一段可以非对准的内存单元,并用指定的数值或标号初始化。
4.1.1 通用伪指令 指令示例: DATA1 DCD 4,5,6 ;分配一片连续的字存储单元并初始化。 DATA2 DCDU LOOP 4.1.1 通用伪指令 指令示例: DATA1 DCD 4,5,6 ;分配一片连续的字存储单元并初始化。 DATA2 DCDU LOOP ;为LOOP标号的地址值分配一个内存单元。
4.1.1 通用伪指令 (4)DCFD(或DCFDU)和DCFS(或DCFSU) 语法格式: 标号 伪指令 表达式 4.1.1 通用伪指令 (4)DCFD(或DCFDU)和DCFS(或DCFSU) 语法格式: 标号 伪指令 表达式 DCFD(或DCFDU)和DCFS(或DCFSU)都是为浮点数分配内存单元的伪指令。 DCFD用于为双精度的浮点数分配一段字对准的内存单元,并用指定的数据初始化,每个双精度的浮点数占两个字单元; DCFDU用于为双精度的浮点数分配一段非字对准的内存单元,并用指定的数据初始化,每个双精度的浮点数占两个字单元; DCFS用于为单精度的浮点数分配一段字对准的内存单元,并用指定的数据初始化,每个单精度的浮点数占一个字单元; DCFSU用于为单精度的浮点数分配一段非字对准的内存单元,并用指定的数据初始化,每个单精度的浮点数占一个字单元。
4.1.1 通用伪指令 指令示例: FLO1 DCFD 2E115,-5E7 4.1.1 通用伪指令 指令示例: FLO1 DCFD 2E115,-5E7 ;分配一段字对准存储单元并初始化为指定的双精度数为2E115,-5E7。 FLO2 DCFDU 22,1E2 ;分配一段非字对准存储单元并初始化为指定的双精度数为22,1E2。 FLO3 DCFS 2E5,-5E-7 ;分配一段非字对准存储单元并初始化为指定的单精度数为2E5,-5E-7。
4.1.1 通用伪指令 (5)DCQ(或DCQU) 语法格式: 标号 DCQ(或DCQU)表达式 4.1.1 通用伪指令 (5)DCQ(或DCQU) 语法格式: 标号 DCQ(或DCQU)表达式 DCQ(或DCQU)伪指令是为双字分配内存单元的伪指令。 伪指令DCQ用于为双字分配一段字对准的内存单元,并用指定的数据初始化;伪指令DCQU用于为双字分配一段可以非字对准的内存单元,并用指定的数据初始化。 指令示例: DATA1 DCQ 100 ;分配一片连续的存储单元并初始化为指定的值。
4.1.1 通用伪指令 (6)MAP和FILED 语法格式: MAP 表达式,{基址寄存器} 标号 FIELD 表明数据字节数的数值 4.1.1 通用伪指令 (6)MAP和FILED 语法格式: MAP 表达式,{基址寄存器} 标号 FIELD 表明数据字节数的数值 MAP和FILED是内存表定义伪指令。 伪指令MAP用于定义一个结构化的内存表的首地址,MAP也可用“^”代替; 伪指令FIELD用于定义内存表中的数据的长度。FILED也可用“#”代替。
4.1.1 通用伪指令 表达式可以为程序中的标号或数学表达式,基址寄存器为可选项,当基址寄存器选项不存在时,表达式的值即为内存表的首地址,当该选项存在时,内存表的首地址为表达式的值与基址寄存器的和。 注意MAP和FIELD伪指令仅用于定义数据结构,并不实际分配存储单元。
4.1.1 通用伪指令 指令示例: MAP 0x10,R1 ;定义内存表首地址的值为[R1]+0x10。 DATA1 FIELD 4 4.1.1 通用伪指令 指令示例: MAP 0x10,R1 ;定义内存表首地址的值为[R1]+0x10。 DATA1 FIELD 4 ;为数据DATA1定义4字节长度 DATA2 FIELD 16 ;为数据DATA2定义16字节长度
4.1.1 通用伪指令 (7)SPACE 语法格式: 标号 SPACE 分配的内存单元字节数 4.1.1 通用伪指令 (7)SPACE 语法格式: 标号 SPACE 分配的内存单元字节数 SPACE伪指令是内存单元分配伪指令,用于分配一片连续的存储区域并初始化为0,SPACE也可用“%”代替。 指令示例: DATASPA SPACE 100 ;为DATASPA分配100个存储单元 ;并初始化为0
4.1.1 通用伪指令 3.汇编控制伪指令 汇编控制伪指令用于控制汇编程序的执行流程,常用的汇编控制伪指令包括以下几条: 4.1.1 通用伪指令 3.汇编控制伪指令 汇编控制伪指令用于控制汇编程序的执行流程,常用的汇编控制伪指令包括以下几条: (1)MACRO、MEND和MEXIT 语法格式: MACRO $标号 宏名 $参数1,$参数2,…… 语句段 MEXIT MEND MACRO、MEND和MEXIT都是宏定义指令。
4.1.1 通用伪指令 伪指令MACRO定义一个宏语句段的开始;伪指令MEND定义宏语句段的结束;伪指令MEXIT可以实现从宏程序段的跳出。宏指令可以使用一个或多个参数,当宏指令被展开时,这些参数被相应的值替换。MACRO、MEND伪指令可以嵌套使用。 宏是一段功能完整的程序,能够实现一个特定的功能,在使用中可以把它视为一个子程序。在其他程序中,可以调用宏完成某个功能。
4.1.1 通用伪指令 调用宏是通过调用宏的名称来实现的。宏指令的使用方式和功能与子程序有些相似,子程序可以提供模块化的程序设计、节省存储空间并提高运行速度。 但在使用子程序结构时需要保护现场,从而增加了系统的开销,因此,在代码较短且需要传递的参数较多时,可以使用宏指令代替子程序。调用宏的好处是不占用传送参数的寄存器,不用保护现场。
4.1.1 通用伪指令 指令示例: MACRO ;定义宏 $DATA1 MAX $N1,$N2 4.1.1 通用伪指令 指令示例: MACRO ;定义宏 $DATA1 MAX $N1,$N2 ;宏名称是MAX,主标号是$DATA1,两个参数 语句段 ;语句段 $DATA1.MAY1 ;非主标号,由主标号构成 …… $DATA1.MAY2 ;非主标号,由主标号构成 MEND ;宏结束
4.1.1 通用伪指令 (2)IF、ELSE、ENDIF 语法格式: IF 逻辑表达式 语句段1 ELSE 语句段2 ENDIF 4.1.1 通用伪指令 (2)IF、ELSE、ENDIF 语法格式: IF 逻辑表达式 语句段1 ELSE 语句段2 ENDIF IF、ELSE、ENDIF伪指令是条件分支伪指令,能根据条件的成立与否决定是否执行某个语句。伪指令IF可以对条件进行判断;伪指令ELSE产生分支;伪指令ENDIF定义分支结束。 当IF后面的逻辑表达式为真,则执行语句段1,否则执行语句段2。其中,ELSE及语句段2可以没有,此时,当IF后面的逻辑表达式为真,则执行指令序列1,否则继续执行后面的指令。 IF、ELSE、ENDIF伪指令可以嵌套使用。
4.1.1 通用伪指令 指令示例: IF R0=0x10 ;判断R0中的内容是否是0x10 4.1.1 通用伪指令 指令示例: IF R0=0x10 ;判断R0中的内容是否是0x10 ADD R0,R1,R2 ;如果R0= 0x10,则执行R0= R1+ R2 ELSE ADD R0,R1,R3 ;如果R0≠ 0x10,则执行R0= R1+ R3 ENDIF
4.1.1 通用伪指令 (3)WHILE、WEND 语法格式: WHILE 逻辑表达式 语句段 WEND 4.1.1 通用伪指令 (3)WHILE、WEND 语法格式: WHILE 逻辑表达式 语句段 WEND WHILE、WEND伪指令是条件循环伪指令,能根据条件的成立与否决定是否循环执行某个语句段。伪指令WHILE对条件进行判断,满足条件循环,不满足条件结束循环;伪指令WEND定义循环体结束。 当WHILE后面的逻辑表达式为真,则执行语句段,该语句段执行完毕后,再判断逻辑表达式的值,若为真则继续执行,一直到逻辑表达式的值为假。
4.1.1 通用伪指令 指令示例: GBLA Cou1 ;声明一个全局的数学变量,变量名为Counter Cou1 SETA 1 ;为Cou1赋值1 WHILE Cou1< 10 ;判断WHILE Counter < 10进入循环 ADD R1,R2,R3 ;循环执行语句 Cou1 SETA Cou1+1 ;每次循环Cou1加1 WEND ;执行ADD R1,R2,R3语句10次后,结束循环。 在应用WHILE、WEND伪指令时要注意:用来进行条件判断的逻辑表达式必须是编译程序能够判断的语句,一般应该是伪指令语句。
4.1.1 通用伪指令 4.其他杂类伪指令 下面是一些比较重要的杂类伪指令,这些杂类伪指令在汇编程序中经常会被使用,包括以下几条: 4.1.1 通用伪指令 4.其他杂类伪指令 下面是一些比较重要的杂类伪指令,这些杂类伪指令在汇编程序中经常会被使用,包括以下几条: (1)ALIGN 语法格式: ALIGN {表达式{,偏移量}} ALIGN伪指令是地址对准伪指令,可通过插入字节使存储区满足所要求的地址对准。其中,表达式的值用于指定对准方式,可能的取值为2n,0≤n≤31,如果不选表达式,则默认字对准;偏移量也为一个数字表达式,若使用该字段,则当前位置的对齐方式为:2n+偏移量。
4.1.1 通用伪指令 指令示例: B START ADD R0,R1,R2 ;正常语句 DATA1 DCB “Ertai” 4.1.1 通用伪指令 指令示例: B START ADD R0,R1,R2 ;正常语句 DATA1 DCB “Ertai” ;由于插入5个字节的存储区,地址不对准 ALIGN 4 ;使用伪指令确保地址对准 START LDR R5,[R6] ;否则此标号不对准 ……
4.1.1 通用伪指令 (2)AREA 语法格式: AREA 段名 属性1,属性2,…… 4.1.1 通用伪指令 (2)AREA 语法格式: AREA 段名 属性1,属性2,…… AREA伪指令是段指示伪指令,用于定义一个代码段或数据段。其中,段名若以数字开头,则该段名需用“|”括起来,如|1_test|。 属性字段表示该代码段(或数据段)的相关属性,多个属性用逗号分隔。
4.1.1 通用伪指令 AREA常用的属性如下: ①CODE属性:用于定义代码段,默认为READONLY。 4.1.1 通用伪指令 AREA常用的属性如下: ①CODE属性:用于定义代码段,默认为READONLY。 ②DATA属性:用于定义数据段,默认为READWRITE。 ③READONLY属性:指定本段为只读,代码段默认为READONLY。 ④READWRITE属性:指定本段为可读可写,数据段的默认属性为READWRITE。
4.1.1 通用伪指令 AREA常用的属性如下: ⑤ALIGN属性:使用方式为ALIGN 表达式。在默认时,ELF(可执行连接文件)的代码段和数据段是按字对齐的,表达式的取值范围为0~31,相应的对齐方式为2表达式n次方。 ⑥COMMON属性:该属性定义一个通用的段,不包含任何的用户代码和数据。各源文件中同名的COMMON段共享同一段存储单元。
4.1.1 通用伪指令 指令示例: AREA Example1,CODE,READONLY 4.1.1 通用伪指令 指令示例: AREA Example1,CODE,READONLY ;定义了一个代码段,段名为Example1,属性为只读。
4.1.1 通用伪指令 (3)CODE16、CODE32 语法格式: CODE16 CODE32 4.1.1 通用伪指令 (3)CODE16、CODE32 语法格式: CODE16 CODE32 CODE16和CODE32伪指令是代码长度定义伪指令。 若在汇编源程序中同时包含ARM指令和Thumb指令时,可用CODE16伪指令定义后面的代码编译成16位的Thumb指令,CODE32伪指令定义后面的代码编译成32位的ARM指令。
4.1.1 通用伪指令 指令示例: AREA Example1,CODE,READONLY …… 4.1.1 通用伪指令 指令示例: AREA Example1,CODE,READONLY …… CODE32 ;定义后面的指令为32位的ARM指令 LDR R0,=NEXT+1;将跳转地址放入寄存器R0 BX R0 ;程序跳转到新的位置执行,并将处理器切换到Thumb工作状态 CODE16 ;定义后面的指令为16位的Thumb指令 NEXT LDR R3,=0x3FF END ;程序结束
4.1.1 通用伪指令 (4)ENTRY 语法格式: ENTRY 4.1.1 通用伪指令 (4)ENTRY 语法格式: ENTRY ENTRY伪指令是程序入口伪指令。在一个完整的汇编程序中至少要有一个ENTRY,编译程序在编译连接时依据程序入口进行连接。在只有一个入口时,编译程序会把这个入口的地址定义为系统复位后的程序起始点。但在一个源文件里最多只能有一个ENTRY。 指令示例: AREA Example1,CODE,READONLY ENTRY ;程序的入口处 ……
4.1.1 通用伪指令 (5)END 语法格式: END END伪指令是编译结束伪指令,用于通知编译器已经到了源程序的结尾,每个汇编语言的源程序都必须有一个END伪指令定义源程序结尾。编译程序检测到这个伪指令后,不再对后面的程序编译。 指令示例: AREA Example1,CODE,READONLY …… END ;程序结束
4.1.1 通用伪指令 (6)EQU 语法格式: 名称 EQU 表达式{,类型} 4.1.1 通用伪指令 (6)EQU 语法格式: 名称 EQU 表达式{,类型} EQU伪指令是赋值伪指令,用于为程序中的常量、标号等定义一个等效的字符名称。 名称为EQU伪指令定义的字符名称,当表达式为32位的常量时,可以指定表达式的数据类型,可以有以下三种类型:CODE16、CODE32和DATA。
4.1.1 通用伪指令 指令示例: Test EQU 50 ;定义标号Test的值为50 DATA1 EQU 0x55,CODE32 4.1.1 通用伪指令 指令示例: Test EQU 50 ;定义标号Test的值为50 DATA1 EQU 0x55,CODE32 ;定义DATA1的值为0x55且该处为32位的ARM指令
4.1.1 通用伪指令 (7)GET和INCBIN 语法格式: GET 文件名 INCBIN 文件名 4.1.1 通用伪指令 (7)GET和INCBIN 语法格式: GET 文件名 INCBIN 文件名 GET和INCBIN伪指令是文件引用伪指令。伪指令GET声明包含另一个源文件,并将被包含的源文件在当前位置进行汇编处理;伪指令INCBIN声明包含另一个源文件,在INCBIN处引用这个文件但不汇编。
4.1.1 通用伪指令 指令示例: AREA Example1,CODE,READONLY GET File1.s 4.1.1 通用伪指令 指令示例: AREA Example1,CODE,READONLY GET File1.s ;包含文件File1.s,并编译 INCBIN File2.dat ;包含文件File2.s,不编译 …… GET F:\EX\ File3.s ;包含文件File3.s,并编译 END
4.1.2 与ARM指令相关的伪指令 ADR伪指令 ADRL伪指令 LDR伪指令 NOP
4.1.2 与ARM指令相关的伪指令 1. ADR伪指令 ADR{cond} Rd, 语句标号+数值表达式 语法格式 : ;其中Rd是目标寄存器,为R0~R15。 ADR伪指令是把地址加载到寄存器中的伪指令,这个地址可以是基于PC相对偏移的地址值,也可以是基于寄存器相对偏移的地址值读取到寄存器中。对偏移的地址值限定的范围是:字对准时,不得超过±1020B;非字对准时,不得超过±255B。 指令示例: ADR R1,LOOP ;把LOOP处绝对地址加载给R1 ADR R1,LOOP+0x10 ;把LOOP+0x10处绝对地址加载给R1
4.1.2 与ARM指令相关的伪指令 2. ADRL伪指令 语法格式 : ADR{cond} Rd, 语句标号+数值表达式 ;其中Rd是目标寄存器,为R0~R15。 ADRL伪指令是把长地址加载到寄存器中的伪指令,这个地址可以是基于PC相对偏移的地址值,也可以是基于寄存器相对偏移的地址值读取到寄存器中。对偏移的地址值限定的范围是:字对准时,不得超过±256K;非字对准时,不得超过±64K。 指令示例: ADRL R1,0x10 ;把距离程序开始处16个地址单元处的绝对地址加载给R1。
4.1.2 与ARM指令相关的伪指令 3. LDR伪指令 语法格式 : LDR{cond} Rd, =数值表达式 ;加载数字常量 一是用于MOV和MVN指令中,若立即数由于超出范围而不能加载到寄存器中时,产生文字常量; 另一个是将程序相对偏移量或一个标号所对应的地址加载到寄存器中。
4.1.2 与ARM指令相关的伪指令 指令示例: LDR R1, =0x20 ;加载0x20到R1中 ;汇编器汇编成MOV R1,# 0x20 LDR R1, =0x101 ;加载0x101到R1中 ;汇编器汇编成LDR R1,[PC,offsect_data1] data1 DCD 0x101
4.1.2 与ARM指令相关的伪指令 4. NOP 语法格式: NOP NOP伪指令是空操作指令,在汇编时将被编译成一条无效指令,如MOV R0,R0,占用32位代码空间。NOP伪指令不影响CPSR中的条件标志位。
4.1.2 与ARM指令相关的伪指令 指令示例: ADDRES1 LDR R1,=ADDRES2 ;把ADDRES2地址加载给R1 ADR R2, ADDRES1 ;把ADDRES1地址加载给R2 SUB R3,R1,R2 ;相减 …… ADDRES2 NOP ;空操作
4.1.3 与Thumb指令相关的伪指令 与Thumb指令相关的伪指令共有3条,这些伪指令必须出现在Thumb程序段。 ADR伪指令 LDR伪指令 NOP
4.1.3 与Thumb指令相关的伪指令 1. ADR伪指令 语法格式 : ADR{cond} Rd, 语句标号+数值表达式 ;其中Rd是目标寄存器,为R0~R7。 ADR伪指令是把地址加载到低端寄存器中的伪指令,这个地址必须是基于PC相对偏移的地址值。偏移必须向前偏移,偏移量不大于1KB,且该指令只可以加载字对准的地址。
4.1.3 与Thumb指令相关的伪指令 指令示例: ADR R0,LOOP ;把LOOP处绝对地址 ;加载给R0 ADR R1,LOOP+0x40*2 ;把LOOP+0x40*2处 ;绝对地址加载给R1 …… ALIGN LOOP ADD R2,R0,R1
4.1.3 与Thumb指令相关的伪指令 2. LDR伪指令 语法格式 : LDR{cond} Rd, =数值表达式 ;加载数字常量 LDR伪指令是把一个数字常量或一个地址加载到低端寄存器伪指令。如果所加载的是一个32位的数字常量,则编译程序就可以把这条语句编译成一条MOV指令,如果不能用MOV指令来表达,则编译成一条LDR指令。如果所加载的是地址的话,编译程序会把这条语句编译成LDR指令。
4.1.3 与Thumb指令相关的伪指令 在使用LDR指令替代伪指令时,编译程序先把数据(或地址)存放在数据缓冲区内,在执行LDR指令时,从缓冲区读出这个数据加载到寄存器中去。因此,在使用这条伪指令时,要为程序创建数据缓冲区。 指令示例: LDR R1, =0xFFE ;加载0xFFE到R1中 ;汇编器汇编成MOV R1,# 0xFFE LDR R1, =START ;加载START处的地址到R1中
4.1.3 与Thumb指令相关的伪指令 3. NOP 语法格式: NOP NOP伪指令是空操作指令,在汇编时将被编译成一条无效指令,如MOV R0,R0,占用32位代码空间。
4.2 汇编语言的语句格式 汇编语言的源程序主要组成: 指令 伪指令 语句标号 注释
4.2.1 书写格式 ARM(Thumb)汇编语言的语句格式为: {语句标号} {指令或伪指令} {;注释} 1.语句标号 4.2.1 书写格式 ARM(Thumb)汇编语言的语句格式为: {语句标号} {指令或伪指令} {;注释} 1.语句标号 语句标号可以大小写字母混合使用,可以使用数字和下划线。语句标号不能与指令助记符、寄存器、变量名同名。 2.指令和伪指令 指令助记符和伪指令助记符可以大写,也可以小写,但不能大小写混合使用。指令助记符和后面的操作数寄存器之间必须有空格,不可以在这之间使用逗号。 3. 注释 汇编器在编译时,当发现一个分号后,把后面的内容解释为注释,不予以编译。
4.2.1 书写格式 举例: AREA EXAMPLE1,CODE,READONLY ;EXAMPLE1程序段代码段,只读属性
4.2.2 汇编语言中表达式和运算符 变量在编译过程中可能被改变。 4.2.2 汇编语言中表达式和运算符 在汇编语言程序设计中,经常使用各种符号代替地址、变量和常量等,以增加程序的可读性。 1. 变量 ARM(Thumb)汇编程序所支持的变量形式有3种: 数字变量 逻辑变量 字符串变量 变量在编译过程中可能被改变。
4.2.2 汇编语言中表达式和运算符 (1)数字变量用于在程序的运行中保存数字值,数字变量的取值范围不能超过一个32位数所能表达的范围。 4.2.2 汇编语言中表达式和运算符 (1)数字变量用于在程序的运行中保存数字值,数字变量的取值范围不能超过一个32位数所能表达的范围。 全局数字变量使用伪指令GBLA定义; 局部数字变量使用伪指令LCLA定义; 数字变量使用伪指令SETA赋值。
4.2.2 汇编语言中表达式和运算符 (2)逻辑变量用于在程序的运行中保存逻辑值,逻辑值只有两种取值情况:真或假。 4.2.2 汇编语言中表达式和运算符 (2)逻辑变量用于在程序的运行中保存逻辑值,逻辑值只有两种取值情况:真或假。 全局逻辑变量使用伪指令GBLL定义; 局部逻辑变量使用伪指令LCLL定义; 逻辑变量使用伪指令SETA赋值。
4.2.2 汇编语言中表达式和运算符 (3)字符串变量用于在程序的运行中保存一个字符串. 全局串变量使用伪指令GBLS定义; 4.2.2 汇编语言中表达式和运算符 (3)字符串变量用于在程序的运行中保存一个字符串. 全局串变量使用伪指令GBLS定义; 局部串变量使用伪指令LCLS定义; 串变量使用伪指令SETS赋值。 串变量需要使用双引号包含。
4.2.2 汇编语言中表达式和运算符 (4)变量代换 程序中的变量可通过代换操作取得一个常量。 代换操作符为“$”。 4.2.2 汇编语言中表达式和运算符 (4)变量代换 程序中的变量可通过代换操作取得一个常量。 代换操作符为“$”。 如果在数字变量前面有一个代换操作符“$”,编译器会将该数字变量的值转换为十六进制的字符串,并将该十六进制的字符串代换“$”后的数字变量; 如果在逻辑变量前面有一个代换操作符“$”,编译器会将该逻辑变量代换为它的取值(真或假); 如果在字符串变量前面有一个代换操作符“$”,编译器会将该字符串变量的值代换“$”后的字符串变量。
4.2.2 汇编语言中表达式和运算符 指令示例: LCLS String1 ;定义局部字符串变量String1和String2 4.2.2 汇编语言中表达式和运算符 指令示例: LCLS String1 ;定义局部字符串变量String1和String2 LCLS String2 String1 SETS “pen!” String2 SETS “This is a $ String1” ;字符串变量S2的值为“This is a Test!”
4.2.2 汇编语言中表达式和运算符 2. 数字表达式及运算符 4.2.2 汇编语言中表达式和运算符 2. 数字表达式及运算符 数字表达式包括数字、数字常量、数字变量、数字运算符和括号构成。表达式的结果不能超过一个32位数的表达范围。 (1)数字形式可以: 十进制 十六进制 N进制 ASCII
4.2.2 汇编语言中表达式和运算符 若是十进制,在表达的时候可以直接表达, 例如:1234、56789。 若是十六进制,有两种表达方法。 4.2.2 汇编语言中表达式和运算符 若是十进制,在表达的时候可以直接表达, 例如:1234、56789。 若是十六进制,有两种表达方法。 一种是在数值前加“0x” 另一种是在数值前加“&”。 例如:0x12A,&FF00。
4.2.2 汇编语言中表达式和运算符 若是N进制:N是一个2~9之间的整数。 表示方法是n_数值。 例如: 4.2.2 汇编语言中表达式和运算符 若是N进制:N是一个2~9之间的整数。 表示方法是n_数值。 例如: 2_01101111是一个二进制数字 8_54231067是一个八进制数字。
4.2.2 汇编语言中表达式和运算符 若是ASCII表达:有些值可以使用ASCII表达。 例如:‘A’表达A的ASCII码。 4.2.2 汇编语言中表达式和运算符 若是ASCII表达:有些值可以使用ASCII表达。 例如:‘A’表达A的ASCII码。 例如:MOV R1,#′A′等同于MOV R1,#0x41。
4.2.2 汇编语言中表达式和运算符 (2)数字常量是一个32位的整数。 可以使用伪指令EQU定义一个数字常量,并且定义后不能改变。 4.2.2 汇编语言中表达式和运算符 (2)数字常量是一个32位的整数。 可以使用伪指令EQU定义一个数字常量,并且定义后不能改变。 (3)数字变量是被定义变量的数字。
4.2.2 汇编语言中表达式和运算符 (4)数字运算符是表明两个表达式之间的关系。在数字表达式中,操作符有以下几种: ①算术运算符 “+”加 4.2.2 汇编语言中表达式和运算符 (4)数字运算符是表明两个表达式之间的关系。在数字表达式中,操作符有以下几种: ①算术运算符 “+”加 “-”减 “×” 乘 “/” 除 “MOD”取余数
4.2.2 汇编语言中表达式和运算符 以A和B表示两个数字表达式为例: A+B 表示A与B的和。 A-B 表示A与B的差。 4.2.2 汇编语言中表达式和运算符 以A和B表示两个数字表达式为例: A+B 表示A与B的和。 A-B 表示A与B的差。 A×B 表示A与B的乘积。 A/B 表示A除以B的商。 A:MOD:B 表示A除以B的余数。
4.2.2 汇编语言中表达式和运算符 ②移位运算符“ROL”、“ROR”、“SHL”及“SHR” 4.2.2 汇编语言中表达式和运算符 ②移位运算符“ROL”、“ROR”、“SHL”及“SHR” 以A和B表示两个数字表达式,以上的移位运算符代表的运算如下: A:ROL:B 表示将A循环左移B位。 A:ROR:B 表示将A循环右移B位。 A:SHL:B 表示将A左移B位。 A:SHR:B 表示将A右移B位。
4.2.2 汇编语言中表达式和运算符 ③逻辑运算符“AND”、“OR”、“NOT”及“EOR” 4.2.2 汇编语言中表达式和运算符 ③逻辑运算符“AND”、“OR”、“NOT”及“EOR” 以A和B表示两个数字表达式,以上的按位逻辑运算符代表的运算如下: A:AND:B 表示将A和B按位作逻辑与的操作。 A:OR:B 表示将A和B按位作逻辑或的操作。 A:EOR:B 表示将A和B按位作逻辑异或的操作。 NOT:B 表示将B按位作逻辑非的操作。
4.2.2 汇编语言中表达式和运算符 3. 逻辑表达式及运算符 4.2.2 汇编语言中表达式和运算符 3. 逻辑表达式及运算符 逻辑表达式包括逻辑值、逻辑变量、逻辑操作符、关系操作符和括号构成,其表达式的运算结果为真或假。与逻辑表达式相关的运算符如下: (1)逻辑值:只有{TRUE}或{FALSE}。 (2)逻辑变量:可以用伪指令定义逻辑变量。 (3)逻辑运算符:包括“LAND”、“LOR”、“LNOT”及“LEOR”运算符,他们在运算时优先权较低。
4.2.2 汇编语言中表达式和运算符 以A和B表示两个逻辑表达式,以上的逻辑运算符代表的运算如下: 4.2.2 汇编语言中表达式和运算符 以A和B表示两个逻辑表达式,以上的逻辑运算符代表的运算如下: A:LAND:B 表示将A和B 作逻辑与的操作。 A:LOR:B 表示将A和B作逻辑或的操作。 A:LEOR:B 表示将A和B作逻辑异或的操作。 LNOT:B 表示将B作逻辑非的操作。
4.2.2 汇编语言中表达式和运算符 (4)关系运算符:关系运算符所关联的两个操作数必须形式相同,运算结果应该是一个逻辑值。包括“=”、“>”、“<”、“>=”、“<= ”、“/=”、“ <>” 运算符。 以A和B表示两个逻辑表达式,以上的运算符代表的运算如下: A = B 表示A等于B。 A > B 表示A大于B。 A < B 表示A小于B。 A >= B 表示A大于等于B。 A <= B 表示A小于等于B。 A /= B 表示A不等于B。 X <> B 表示A不等于B。
4.2.2 汇编语言中表达式和运算符 指令示例: MOV R5,#0xFF00:MOD:0xF:ROL:2 ;R5寄存器里的内容为0x00 4.2.2 汇编语言中表达式和运算符 指令示例: MOV R5,#0xFF00:MOD:0xF:ROL:2 ;R5寄存器里的内容为0x00 IF R5:LAND:R6<=R7 MOV R0,#0x00 ELSE MOV R0,#0xFF ;如果R5∧R6<=R7则R0=0x00 ;否则,R0=0xFF
4.2.2 汇编语言中表达式和运算符 4. 字符串表达式及运算符 字符串表达式包括字符串常量、字符串变量、运算符和括号构成。 4.2.2 汇编语言中表达式和运算符 4. 字符串表达式及运算符 字符串表达式包括字符串常量、字符串变量、运算符和括号构成。 编译器所支持的字符串最大长度为512字节。 (1)字符串:用双引号包含在内的一系列字符称为字符串。 (2)字符串变量:被定义为变量的字符串称为字符串变量
4.2.2 汇编语言中表达式和运算符 (3)单目运算符:是只涉及一个字符串的运算符,在串运算中,单目运算符有较高的优先权。 4.2.2 汇编语言中表达式和运算符 (3)单目运算符:是只涉及一个字符串的运算符,在串运算中,单目运算符有较高的优先权。 单目运算符如表4-1所示。 (4)双目运算符:涉及两个表达式,其中至少有一个是字符串。 双目运算符如表4-2所示 。
4.2.2 汇编语言中表达式和运算符 表4-1 单目运算符 单目运算符 语法格式 功能 LEN :LEN:X 4.2.2 汇编语言中表达式和运算符 表4-1 单目运算符 单目运算符 语法格式 功能 LEN :LEN:X 当X是一个字符串时,计算X的长度。 CHR :CHR:X 当X是一个0~255之间的数字时,把X转换成ASCII的字符串。 STR :STR:X 将32位的数字表达式X转换为8个字符的16进制字符串,或逻辑表达式X转换为字符串T或F。 DEF :DEF:X 如果符号X已经定义,则结果为真,否则为假。
4.2.2 汇编语言中表达式和运算符 表4-2 双目运算符 双目运算符 语法格式 功能 LEFT X:LEFT:Y 4.2.2 汇编语言中表达式和运算符 表4-2 双目运算符 双目运算符 语法格式 功能 LEFT X:LEFT:Y 从字符串X中左侧取字符Y个。 RIGHT X:RIGHT:Y 从字符串X中右侧取字符Y个。 CC X:CC:Y 将字符串Y接在字符串X后面形成一个字符串
4.2.2 汇编语言中表达式和运算符 指令实例: GBLS STRING ;定义字符串STRING 4.2.2 汇编语言中表达式和运算符 指令实例: GBLS STRING ;定义字符串STRING STRING SETS:CHR:65;为STRING赋值 ;(65是A的ASCII) GBLS STRING2 ;定义字符串STRING2 STRING2 SETS “EMBEDDED SYSTEM” ;为STRING2赋值 GBLS STRING3 ;定义字符串STRING3 STRING3 SETS STRING2:LEFT:8 ;将值EMBEDDED赋值给字符串STRING3
4.2.2 汇编语言中表达式和运算符 5. 以寄存器和程序计数器(PC)为基址的表达式及运算符 4.2.2 汇编语言中表达式和运算符 5. 以寄存器和程序计数器(PC)为基址的表达式及运算符 常用的与寄存器和程序计数器(PC)相关的表达式及运算符如下: (1)BASE运算符 BASE运算符返回基于寄存器的表达式中寄存器的编号,其语法格式如下: :BASE:A 其中,A为与寄存器相关的表达式。
4.2.2 汇编语言中表达式和运算符 (2)INDEX运算符 4.2.2 汇编语言中表达式和运算符 (2)INDEX运算符 INDEX运算符返回基于寄存器的表达式中相对于其基址寄存器的偏移量,其语法格式如下: :INDEX:A 其中,A为与寄存器相关的表达式。
4.2.2 汇编语言中表达式和运算符 6. 运算符的优先级 在对汇编程序进行编译时,运算中一般遵循的基本规则是:先计算括号内,后计算括号外;在有多个操作符时,顺序和运算符有关;单目运算符较双目运算符优先;在相同优先权情况下,从左到右运算。 运算符的优先级如表4-3所示。
4.2.2 汇编语言中表达式和运算符 表4-3 运算符优先级 运算符 优先级顺序(由高到底) 单目运算符 乘除和取膜(×、/ 、MOD) 4.2.2 汇编语言中表达式和运算符 表4-3 运算符优先级 运算符 优先级顺序(由高到底) 单目运算符 乘除和取膜(×、/ 、MOD) 移位运算(ROL、ROR、SHL、SHR) 加减和逻辑运算(+、-、AND、OR、EOR) 各种逻辑运算(=、>、<、>=、<=、/=、<>) 逻辑运算(LAND、LOR、LEOR)
4.3 汇编程序应用 4.3.1 汇编程序基本结构 下面是一个汇编语言源程序的基本结构: 4.3 汇编程序应用 4.3.1 汇编程序基本结构 下面是一个汇编语言源程序的基本结构: AREA example,CODE,READONLY ;定义代码块为example ENTRY ;程序入口 Start MOV R0, #40 ;R0=40 MOV R1,#16 ;R1=16 ADD R2,R0,R1 ;R2= R0 +R1 MOV R0,#0x18 ;传送到软件中断的参数 LDR R1,=0x20026 ;传送到软件中断的参数 SWI 0x123456 ;通过软件中断指令返回 END ;文件结束
4.3.1 汇编程序基本结构 AREA 伪指令定义一个段,并说明所定义段的相关属性,本例定义一个名为 example 的代码段,属性为只读。 4.3.1 汇编程序基本结构 AREA 伪指令定义一个段,并说明所定义段的相关属性,本例定义一个名为 example 的代码段,属性为只读。 ENTRY 伪指令标识程序的入口点,接下来为语句段。执行主代码后,通过返回控制终止应用程序并返回到DEBUG,通过使用软件中断指令实现了返回。 在程序的末尾为 END 伪指令,该伪指令通知编译器停止对源文件的处理,每一个汇编程序段都必须有一条END伪指令,指示代码段的结束。
4.3.2 子程序调用 2. 在ARM汇编语言程序中,子程序的调用一般是通过BL指令来实现的。 3. 指令格式:BL子程序名 4.3.2 子程序调用 2. 在ARM汇编语言程序中,子程序的调用一般是通过BL指令来实现的。 3. 指令格式:BL子程序名 该指令在执行时完成如下操作:将子程序的返回地址存放在连接寄存器LR中,同时将程序计数器PC指向子程序的入口点,当子程序执行完毕需要返回调用处时,只需要将存放在LR中的返回地址重新拷贝给程序计数器PC(即:使用指令MOV PC,LR)。
4.3.2 子程序调用 习惯上用寄存器R0~R3来存放送到子程序的参数,然后从子程序返回时存放返回的结果给调用者。 4.3.2 子程序调用 习惯上用寄存器R0~R3来存放送到子程序的参数,然后从子程序返回时存放返回的结果给调用者。 下面给出的子程序,减4个参数的值,用R0返回结果(即实现R0=R0-R1-R2-R3)。
4.3.2 子程序调用 AREA Init,CODE,READONLY ;定义一个代码段 ENTRY ;定义一个程序入口 4.3.2 子程序调用 AREA Init,CODE,READONLY ;定义一个代码段 ENTRY ;定义一个程序入口 LOOP1 MOV R0,#211 ;给参数R0赋值211 MOV R1,# 106 ;给参数R1赋值106 MOV R2,# 64 ;给参数R2赋值64 MOV R3,# 195 ;给参数R3赋值195 BL SUB1 ;调用子程序SUB1,同时将子程序的返回 ;地址存放在连接寄存器R14(LR)中。 MOV R0,#0x18 ;传送到软件中断的参数 LDR R1,=0x20026 ;传送到软件中断的参数 SWI 0x123456 ;通过软件中断指令返回 SUB1 SUB R0,R0,R1 ;子程序代码 SUB R0,R0,R2 SUB R0,R0,R3 MOV PC,LR ;从子程序返回 END
4. 4 汇编语言与C/C++的混合编程 在应用系统的程序设计中,若所有的编程任务均用汇编语言来完成,其工作量是可想而知的。事实上,ARM体系结构支持C/C+以及与汇编语言的混合编程,在一个完整的程序设计的中,除了初始化部分用汇编语言完成以外,其主要的编程任务一般都用C/C++完成。 汇编语言与C/C++的混合编程通常有以下几种方式: 在C/C++代码中嵌入汇编指令。 在汇编程序和C/C++的程序之间进行变量的互访。 汇编程序、C/C++程序间的相互调用。
4. 4 汇编语言与C/C++的混合编程 在以上的几种混合编程技术中,必须遵守一定的调用规则:这里所指的是ATPCS规则,PCS即Procedure Call Standard(过程调用规范),ATPCS即ARM-THUMB procedure call standard。PCS规定了应用程序的函数可以如何分开地写,分开地编译,最后将它们连接在一起,所以它实际上定义了一套有关过程(函数)调用者与被调用者之间的协议。
4. 4 汇编语言与C/C++的混合编程 PCS强制实现如下约定:调用函数如何传递参数(即压栈方法,以何种方式存放参数),被调用函数如何获取参数,以何种方式传递函数返回值。 PCS的制订是一系列指标的“tradeoff(折衷)”(因为很大程度上涉及系统的一些性能),如:会涉及生成代码的大小,调试功能的支持,函数调用上下文处理速度以及内存消耗等。 当然,通过编译器的支持可以让生成的代码有不同的特性,如:gcc编译选项可以支持或不支持frame pointer来支持深入调试功能或提高程序运行性能。
4. 4 汇编语言与C/C++的混合编程 基本ATPCS规定了在子程序调用时的一些基本规则,包括以下三个方面的内容:各寄存器的使用规则及其相应的名字;数据栈的使用规则;参数传递的规则。 相对于其他类型的ATPCS,满足基本ATPCS的程序的执行速度更快,所占用的内存更少。但是它不能提供以下的支持ARM程序和THUMB程序相互调用;数据以及代码的位置无关;子程序的可重入性;数据栈检查等。
4. 4 汇编语言与C/C++的混合编程 1.各寄存器的使用规则 (1)子程序通过寄存器R0~R3来传递参数。 这时寄存器可以记作: A0~A3 ,被调用的子程序在返回前无需恢复寄存器R0~R3的内容。 (2)在子程序中,使用R4~R11来保存局部变量,这时寄存器R4~R11可以记作:V1~V8。如果在子程序中使用到V1~V8的某些寄存器,子程序进入时必须保存这些寄存器的值,在返回前必须恢复这些寄存器的值,对于子程序中没有用到的寄存器则不必执行这些操作。在THUMB程序中,通常只能使用寄存器R4~R7来保存局部变量。 (3)寄存器R12用作子程序间scratch寄存器,记作ip;在子程序的连接代码段中经常会有这种使用规则。
4. 4 汇编语言与C/C++的混合编程 (4)寄存器R13用作数据栈指针,记做SP;在子程序中寄存器R13不能用做其他用途。 寄存器SP在进入子程序时的值和退出子程序时的值必须相等。 (5)寄存器R14用作连接寄存器,记作lr ;它用于保存子程序的返回地址,如果在子程序中保存了返回地址,则R14可用作其它的用途。 (6)寄存器R15是程序计数器,记作PC ;它不能用作其他用途。 (7)ATPCS中的各寄存器在ARM编译器和汇编器中都是预定义的。
4. 4 汇编语言与C/C++的混合编程 2.数据栈的使用规则 ATPCS规定数据栈为满递减类型。并对数据栈的操作是8字节对齐的,下面是一个数据栈的示例及相关的名词。 (1)数据栈栈指针(stack pointer ),其指向最后一个写入栈的数据的内存地址。 (2)数据栈的基地址(stack base),是指数据栈的最高地址。由于ATPCS中的数据栈是FD类型的,实际上数据栈中最早入栈数据占据的内存单元是基地址的下一个内存单元。
4. 4 汇编语言与C/C++的混合编程 (3)数据栈界限(stack limit ),是指数据栈中可以使用的最低的内存单元地址。 (4)已占用的数据栈(used stack),是指数据栈的基地址和数据栈栈指针之间的区域,其中包括数据栈栈指针对应的内存单元。 (5)数据栈中的数据帧(stack frames) ,是指在数据栈中,为子程序分配的用来保存寄存器和局部变量的区域。 异常中断的处理程序可以使用被中断程序的数据栈,这时用户要保证中断的程序数据栈足够大。
4. 4 汇编语言与C/C++的混合编程 3.参数的传递规则 根据参数个数是否固定,可以将子程序分为参数个数固定的子程序和参数个数可变的子程序。 (1)参数个数可变的子程序参数传递规则 对于参数个数可变的子程序,当参数不超过4个时,可以使用寄存器R0~R3来进行参数传递,当参数超过4个时,还可以使用数据栈来传递参数。在参数传递时,将所有参数看做是存放在连续的内存单元中的字数据。然后,依次将各名字数据传送到寄存器R0、R1、R2、R3;如果参数多于4个,将剩余的字数据传送到数据栈中,入栈的顺序与参数顺序相反,即最后一个字数据先入栈。按照上面的规则,一个浮点数参数可以通过寄存器传递,也可以通过数据栈传递,也可能一半通过寄存器传递,另一半通过数据栈传递。
4. 4 汇编语言与C/C++的混合编程 (2)参数个数固定的子程序参数传递规则 对于参数个数固定的子程序,参数传递与参数个数可变的子程序参数传递规则不同,如果系统包含浮点运算的硬件部件,浮点参数将按照下面的规则传递:各个浮点参数按顺序处理;为每个浮点参数分配FP寄存器;分配的方法是满足该浮点参数需要的且编号最小的一组连续的FP寄存器。第一个整数参数通过寄存器R0~R3来传递,其他参数通过数据栈传递。
4. 4 汇编语言与C/C++的混合编程 4.子程序结果返回规则 (1)结果为一个32位的整数时,可以通过寄存器R0返回。 (2)结果为一个64位整数时,可以通过R0和R1返回,依此类推。 (3)对于位数更多的结果,需要通过调用内存来传递。
4. 4 汇编语言与C/C++的混合编程 如果按照上述的方法,就过于繁琐。在实际的编程应用中,使用较多的方式是: 程序的初始化部分用汇编语言完成,然后用C/C++完成主要的编程任务,程序在执行时首先完成初始化过程,然后跳转到C/C++程序代码中,汇编程序和C/C++程序之间一般没有参数的传递,也没有频繁的相互调用,因此,整个程序的结构显得相对简单,容易理解。
4.4.1 在C/C++程序中内嵌汇编指令的语法格式 在ARM C语言程序中使用关键字_asm来标识一段汇编指令程序,其用法如下: __asm { instruction [; instruction] 汇编语言程序段以及注释 … [instruction] } 其中,如果一行中有多个汇编指令,指令之间使用分号“;”隔开;如果一条指令占多行,使用续行符号”\”表示接续;在汇编指令段中可以使用C语言的注释语句。 在ARM C/C++程序中还可以使用关键词asm来内嵌一段汇编程序,其格式如下: asm(“instruction [; instruction]”); 其中,asm后面括号中必须是一条汇编语句,且其不能包含注释语句。
4.4.2 C/C++与汇编语言的混合编程应用 这里主要讨论C/C++和汇编的混合编程,包括相互之间的函数调用。下面分五种情况来进行讨论。 在C中内嵌的汇编指令包含大部分的ARM和Thumb指令,不过其使用与汇编文件中的指令有些不同,存在一些限制,主要有下面几个方面: (1)不能直接向PC寄存器赋值,程序跳转要使用B或者BL指令。 (2)在使用物理寄存器时,不要使用过于复杂的C表达式,避免物理寄存器冲突。 (3)R12和R13可能被编译器用来存放中间编译结果,计算表达式值时可能将R0~R3、R12及R14用于子程序调用,因此要避免直接使用这些物理寄存器。
4.4.2 C/C++与汇编语言的混合编程应用 (4)一般不要直接指定物理寄存器,而让编译器进行分配。 #include <stdio.h> void my_strcpy(const char *src, char *dest) //声明一个函数 { char ch; //声明一个字符型变量 __asm //调用关键词__asm LOOP ;循环入口 LDRB CH,[SRC],#1 ;Thumb指令,ch←src+1.将无符 ;号src地址的数+1送入ch STRB CH,[dest],#1 ;Thumb指令, [dest+1] ←ch, ;将无符号CH数据送入[dest+1]存储 CMP CH, #0 ;比较CH是否为零,否则循环。 ;总共循环256次 BNE LOOP; ;B 指令跳转,NE为Z位清零不相等 }
4.4.2 C/C++与汇编语言的混合编程应用 int main() ;C语言主程序 { char *a = "forget it and move on!";//声明字符型指针变量 char b[64];//字符型数组 my_strcpy(a, b);//调用子函数,进行复制 printf("original: %s", a);//屏幕输出,a的数值 printf("copyed: %s", b);//屏幕输出,b的数值 return 0; } 在这里C和汇编之间的值传递是用C的指针来实现的,因为指针对应的是地址,所以汇编中也可以访问。
4.4.2 C/C++与汇编语言的混合编程应用 2.在汇编中使用C程序全局变量 (1)使用IMPORT伪操作声明该全局变量。 (2)使用LDR指令读取该全局变量的内存地址,通常该全局变量的内存地址值存放在程序的数据缓冲池中(Literal pool)。 (3)根据该数据的类型,使用相应的LDR/STR指令读取/修改该全局变量的值。
4.4.2 C/C++与汇编语言的混合编程应用 下面通过一个例子来说明如何在汇编程序中访问C程序全局变量。 AREA asmfile,CODE,READONLY ;建立一个汇编程序段 EXPORT asmDouble ;声明可以被调用的汇编函数asmDouble IMPORT gVar_1 ;调用C语言中声明的全局变量 asmDouble ;汇编子函数入口 LDR R0,=gVar_1 ;将等于gVar_1地址的数据送入R0寄存器 LDR R1,[R0] ;将R0中的值为地址的数据送给R1。 MOV R2, #10 ;将立即数2送给R2 ADD R3, R1, R2 ;R3=R1+R2,实现了gVar_1= gVar_1+10 STR R3,[R0] ;将R3中的数据送给R0 MOV PC, LR ;子程序返回 END
4.4.2 C/C++与汇编语言的混合编程应用 3.C程序中调用汇编的函数 在C程序中调用汇编文件中的函数,主要工作有两个:一是在C中声明函数原型,并加extern关键字;二是在汇编中用EXPORT导出函数名,并用该函数名作为汇编代码段的标识,最后用MOV PC,LR返回。然后,就可以在C程序中使用该函数了。 下面是一个C程序调用汇编程序的例子,其中汇编程序strcpy实现字符串复制功能,C程序调用strcpy完成字符串复制的工作。
4.4.2 C/C++与汇编语言的混合编程应用 /* C程序*/ #include <stdio.h> extern void asm_strcpy(const char *src, char *dest); //声明可以被调用的函数 int main() //C语言主函数 { const char *s = "seasons in the sun"; //声明字符型指针变量 char d[32]; //声明字符型数组 asm_strcpy(s,d); //调用汇编子函数 printf("source: %s",s); //屏幕显示,S的值 printf(" destination: %s",d); //屏幕显示,d的值。 return 0; }
4.4.2 C/C++与汇编语言的混合编程应用 ; 汇编语言程序段 AREA asmfile,CODE,READONLY ;声明汇编语言程序段 EXPORT asm_strcpy ;声明可被调用函数名称 asm_strcpy ;函数入口地址 LOOP ;循环标志条 LDRB R4, [R0], #1 ;R0的地址加1后送给R4 CMP R4, #0 ;比较R4是否为零 BEQ OVER ;为零跳转到结束 STRB R4, [R1], #1 ;R4的值送入R1加1地址 B LOOP ;跳转到循环位置 OVER ;跳出标志位 MOV PC, LR ;子函数返回 END
4.4.2 C/C++与汇编语言的混合编程应用 4.在汇编程序中调用C的函数 在汇编中调用C的函数,需要在汇编中使用伪指令IMPORT 声明将要调用的C函数。 下面是一个汇编程序调用C程序的例子。其中在汇编程序中设置好各参数的值,本例有5个参数,分别使用寄存器R0存放第1个参数,R1存放第2个参数,R2存放第3个参数。
4.4.2 C/C++与汇编语言的混合编程应用 EXPORT asmfile ;可被调用的汇编段 AREA asmfile,CODE,READONLY;声明汇编程序段 IMPORT cFun ;声明调用C语言的cFun函数 ENTRY ;主程序起始入口 MOV R0, #11 ;将11放入R0 MOV R1, #22 ;将22放入R1 MOV R2, #33 ;将33放入R2 BL cFun;调用C语言子函数 END /*C 语言函数, 被汇编语言调用 */ int cFun(int a, int b, int c)//声明一个函数 { return a + b + c;//返回a+b+c的值 }
4.4.2 C/C++与汇编语言的混合编程应用 5.C++嵌入式系统中应用 C++和C是可以互相调用的,并且可以灵活的进行汇编语言、C语言、C++语言的混合调用。 前面讲述了C语言与汇编语言的互相调用,在这里我们将讨论C++和C语言的互相调用。当C++与C互相调用是必须使用伪指令“extern “C”{….}”,例如,extern “C”{include “cHeadfile.h”}。 extern "C"包含双重含义,其一:被它修饰的目标是“extern”的;其二:被它修饰的目标是“C”的。 (1)被extern “C”限定的函数或变量是extern类型的 extern是C/C++语言中表明函数和全局变量作用范围(可见性)的关键字,该关键字告诉编译器,其声明的函数和变量可以在本模块或其他模块中使用。
4.4.2 C/C++与汇编语言的混合编程应用 例如:extern int a;此语句仅仅是在声明一个变量,并不是定义变量a,并未为a分配内存空间。变量a在所有模块中作为一种全局变量只能被定义一次,否则会出现连接错误。 通常,在模块的头文件中对模块提供给其他模块引用的函数和全局变量以关键字extern声明。例如,如果模块B欲引用该模块A中定义的全局变量和函数时只需包含模块A的头文件即可。这样,模块B中调用模块A中的函数时,在编译阶段,模块B虽然找不到该函数,但是并不会报错,它会在连接阶段中从模块A编译生成的目标代码中找到此函数。
4.4.2 C/C++与汇编语言的混合编程应用 与extern对应的关键字是static,被它修饰的全局变量和函数只能在本模块中使用。因此,一个函数或变量只可能被本模块使用时,其不可能被extern “C”修饰。 (2)被extern "C"修饰的变量和函数是按照C语言方式编译和连接的。 作为一种面向对象的语言,C++支持函数重载,而过程式语言C则不支持。函数被C++编译后在符号库中的名字与C语言的不同。例如,假设某个函数的原型为:void foo(int x, int y);
4.4.2 C/C++与汇编语言的混合编程应用 该函数被C编译器编译后在符号库中的名字为_foo,而C++编译器则会产生像_foo_int_int之类的名字(不同的编译器可能产生的名字不同,但是都采用了相同的机制)。_foo_int_int这样的名字包含了函数名、函数参数数量及类型信息,C++就是靠这种机制来实现函数重载的。例如,在C++中,函数void foo(int x, int y)与void foo(int x, float y)编译产生的符号是不相同的,后者为_foo_int_float。
4.4.2 C/C++与汇编语言的混合编程应用 (3)extern "C"的惯用法 ①在C++中引用C语言中的函数和变量,在包含C语言头文件(假设为cExample.h)时,需进行下列处理: extern "C" { #include "cExample.h" }
4.4.2 C/C++与汇编语言的混合编程应用 而在C语言的头文件中,对其外部函数只能指定为extern类型,C语言中不支持extern "C"声明,在.c文件中包含了extern "C"时会出现编译语法错误。 ②在C中引用C++语言中的函数和变量时,C++的头文件需添加extern "C",但是在C语言中不能直接引用声明了extern "C"的头文件,应该仅将C文件中将C++中定义的extern "C"函数声明为extern类型。
4.4.2 C/C++与汇编语言的混合编程应用 例如: //C++头文件 cppExample.h #ifndef CPP_EXAMPLE_H #define CPP_EXAMPLE_H extern "C" int add(int x, int y); #endif //C++实现文件 cppExample.cpp #include "cppExample.h" int add(int x, int y) { return x+y; }
4.4.2 C/C++与汇编语言的混合编程应用 /*C实现文件cFile.c /*这样会编译出错:#include "cppExample.h"*/ extern int add(int x, int y); int main(int argc, char *argv[])//C 语言主程序入口 { add(2,3); return 0; }
4.5 本章小结 本章介绍了ARM汇编语言程序设计中常见的通用伪指令、与ARM指令相关的伪指令、与Thumb指令相关的伪指令及汇编语言的基本语句格式和基本结构等,同时简单介绍了C/C++和汇编语言的混合编程的语法格式及应用等。 通过本章的学习,要求基本掌握伪指令、表达式和运算符的含义及用法,能够编写出汇编语言程序及掌握与C/C++的混合编程方法。