内存地址、机器码与汇编指令的三角恋关系

程序员文章站 2022-07-15 14:21:54

...

虽然机器码和内存地址领证在一起了，但是俩个人都和汇编指令有着说不清的关系，机器码的前任是汇编指令，而汇编指令又与内存地址暗地相通，这究竟是道德的沦丧还是人性的扭曲，今天就让我来领大家细细分解这三者的前世今生！！！

文章目录

一.原汇编代码
二.反汇编代码
三.三角恋关系

1.汇编指令与内存地址的关系
2.机器码与汇编指令
3.内存地址与机器码

之前我们使用汇编语言编写了点亮LED程序，.S文件通过FTP传到Ubuntu中，通过交叉编译工具生成.bin文件传回本机，然后通过oflash烧写进裸机的Nand FLASH，从而点亮LED。
这里分析一下汇编代码在此过程中的意义，内存地址、机器码与汇编指令三者之间的联系。

一.原汇编代码

汇编代码如下：

.text
.global _start

_start:                   ;程序从这里开始
	ldr r1, =0X56000050   ;将地址存在r1
	ldr r0, =0X100        ;将值存在r0
	str r0, [r1]          ;将r0的值写入[]中的地址
	
	ldr r1, =0X56000054	  ;同上
	ldr r0, =0            
	str r0, [r1]          
	
halt:                     ;死循环
	b halt                ;一直跳转到halt

简单解释一下代码：

要点亮LED，就要将GPF4引脚输出低电平，通过在GPFCON和GPFDAT寄存器中的对应位写入值来实现，即对0X56000050地址中写入0X100，对0X56000054地址中写入0 。

用到的汇编代码指令如下：

ldr（load）：读内存命令

str（store）：写内存命令

b：跳转

mov（move）：赋值

二.反汇编代码

编译器会将汇编指令转换成机器码，而机器码又存放在内存地址中！！！通过反汇编指令可以得到反汇编文件，里面有内存地址、机器码与汇编指令三者的对应关系！！！

机器码就是.bin文件的十六进制形式，一组机器码有32位，ARM一次也能够处理32位的数据，这些知识都是相统一的。

通过将汇编代码，传到Linux中可以进行编译，然后生成.bin文件，当然也可以通过交叉编译工具的反汇编，生成机器码和处理后的标准的汇编码，反汇编文件为.dis文件，反汇编文件中可以查看内存地址、机器码与汇编指令三者之间的联系：

led_on.elf:     file format elf32-littlearm

Disassembly of section .text:

/*地址*/  /*机器码*/   /*汇编指令*/
00000000 <_start>:
   0:	e59f1014 	ldr	r1, [pc, #20]	; 1c <.text+0x1c>
   4:	e3a00c01 	mov	r0, #256	; 0x100
   8:	e5810000 	str	r0, [r1]
   c:	e59f100c 	ldr	r1, [pc, #12]	; 20 <.text+0x20>
  10:	e3a00000 	mov	r0, #0	; 0x0
  14:	e5810000 	str	r0, [r1]

00000018 <halt>:
  18:	eafffffe 	b	18 <halt>
  1c:	56000050 	undefined
  20:	56000054 	undefined

在S3C2440中，CPU有各种寄存器，如图：

内存地址、机器码与汇编指令的三角恋关系

左边是各种寄存器，右边是寄存器的别名，下面介绍一下比较重要的几个寄存器：

pc（program counter）是程序计数器，当把一个地址写入pc寄存器中，CPU就会跳转到这个地址去取指令。
lr（link register）是返回地址寄存器，当程序执行完一个调用函数时，要跳转回原来的地址，这个**lr寄存器中存放就是原来的地址，**调用函数执行完毕后，只需要转到lr中的地址就可以继续执行程序了。
sp（stack point）是栈指针

三.三角恋关系

1.汇编指令与内存地址的关系

下面分析一下汇编指令与内存地址之间的关系

说明一下：为什么俩条相邻指令的内存地址差为4？

这是因为内存地址的单位都是Byte，也就是8位（bit），而且ARM是32位的，一次只能够处理32位指令，也就是4Byte的指令，所以指令的内存存放都是以4Byte为单位的。

第一条指令，要知道pc中的地址是当前指令的地址+8，因为ARM执行指令是流水线式的，比如当前执行地址a的指令，已经在对地址a+4的指令进行译码，已经在读取地址a+8的指令，也就是说，当前pc中存放的是a+8的值（第三条指令的地址）。就拿第一个指令来讲（[x]代表：x地址）：
内存地址、机器码与汇编指令的三角恋关系