i++循环与i-–循环的执行效率(递增与递减效率)
程序员文章站
2022-05-24 22:38:10
昨天同事问了我一个问题,有两个循环语句: 复制代码 代码如下: for(i = n; i > 0; i--) { … } for(i = 0; i < n; i...
昨天同事问了我一个问题,有两个循环语句:
for(i = n; i > 0; i--)
{
…
}
for(i = 0; i < n; i++)
{
…
}
为什么前者比后者快?
我当时的解释是:
i- -操作本身会影响cpsr(当前程序状态寄存器),cpsr常见的标志有n(结果为负), z(结果为0),c(有进位),o(有溢出)。i > 0,可以直接通过z标志判断出来。
i++操作也会影响cpsr(当前程序状态寄存器),但只影响o(有溢出)标志,这对于i < n的判断没有任何帮助。所以还需要一条额外的比较指令,也就是说每个循环要多执行一条指令。
(这是五年前tjww告诉我的,当时他在avr上写一个lcd驱动程序,使用后者lcd会闪烁,使用前者则没有问题。)
为了确认我的理解是正确的,做了个实验:
int loop_dec(int n)
{
int i = 0;
int v = 0;
for(i = n; i > 0; i--)
v +=i;
return v;
}
int loop_inc(int n)
{
int i = 0;
int v = 0;
for(i = 0; i < n; i++)
v +=i;
return v;
}
用arm-linux-gcc编译,然后反汇编:
i--的循环条件:
4c: e51b3014 ldr r3, [fp, #-20]
50: e3530000 cmp r3, #0 ; 0x0
54: cafffff5 bgt 30 <loop_dec+0x30>
i++的循环条件:
b8: e51b3018 ldr r3, [fp, #-24]
bc: e1520003 cmp r2, r3
c0: bafffff4 blt 98 <loop_inc+0x30>结果和我想象的并不一样,这是怎么回事呢?我想可能因为没有加优化选项,于是加上-o选项,结果变为:
i--的循环条件:
14: e2500001 subs r0, r0, #1 ; 0x1
18: 1afffffc bne 10 <loop_dec+0x10>
i++的循环条件:
3c: e2833001 add r3, r3, #1 ; 0x1
40: e1500003 cmp r0, r3
44: 1afffffb bne 38 <loop_inc+0x14>这下没错了,果然少一个cmp指令。
文章出处:http://www.limodev.cn/blog
复制代码 代码如下:
for(i = n; i > 0; i--)
{
…
}
for(i = 0; i < n; i++)
{
…
}
为什么前者比后者快?
我当时的解释是:
i- -操作本身会影响cpsr(当前程序状态寄存器),cpsr常见的标志有n(结果为负), z(结果为0),c(有进位),o(有溢出)。i > 0,可以直接通过z标志判断出来。
i++操作也会影响cpsr(当前程序状态寄存器),但只影响o(有溢出)标志,这对于i < n的判断没有任何帮助。所以还需要一条额外的比较指令,也就是说每个循环要多执行一条指令。
(这是五年前tjww告诉我的,当时他在avr上写一个lcd驱动程序,使用后者lcd会闪烁,使用前者则没有问题。)
为了确认我的理解是正确的,做了个实验:
复制代码 代码如下:
int loop_dec(int n)
{
int i = 0;
int v = 0;
for(i = n; i > 0; i--)
v +=i;
return v;
}
int loop_inc(int n)
{
int i = 0;
int v = 0;
for(i = 0; i < n; i++)
v +=i;
return v;
}
用arm-linux-gcc编译,然后反汇编:
i--的循环条件:
4c: e51b3014 ldr r3, [fp, #-20]
50: e3530000 cmp r3, #0 ; 0x0
54: cafffff5 bgt 30 <loop_dec+0x30>
i++的循环条件:
b8: e51b3018 ldr r3, [fp, #-24]
bc: e1520003 cmp r2, r3
c0: bafffff4 blt 98 <loop_inc+0x30>结果和我想象的并不一样,这是怎么回事呢?我想可能因为没有加优化选项,于是加上-o选项,结果变为:
i--的循环条件:
14: e2500001 subs r0, r0, #1 ; 0x1
18: 1afffffc bne 10 <loop_dec+0x10>
i++的循环条件:
3c: e2833001 add r3, r3, #1 ; 0x1
40: e1500003 cmp r0, r3
44: 1afffffb bne 38 <loop_inc+0x14>这下没错了,果然少一个cmp指令。
文章出处:http://www.limodev.cn/blog