CH8.7 查看编译器优化结果

2019-05-19  本文已影响0人  磊宝万岁

8.7 查看编译的结果

编译器形成汇编代码做了很多事情,但是有些情况下他做的并不是很好,如果我们能够查看汇编代码并且有目的的优化那是最好不过了。
在gcc中可以使用-fsource-asm选项来查看c代码与汇编代码的对应关系,因为只加-S参数的话在.s文件中不会显示源代码只会显示行数。

gcc xx.c -S -fsource-asm

注意 如果你想看看编译器完全优化之后的样子,就不要开启-fsource-asm选项。

下面的例子展示了如何通过汇编代码来优化我们的程序:加入我们有这个一个程序:

void Func(int a[], int & r) {
  int i;
  for (i = 0; i < 100; i++) {
    a[i] = r + i/2;
  }
}

编译后该部分代码是这样的:

ALIGN 4 ; align by 4
PUBLIC ?Func@@YAXQAHAAH@Z ; mangled function name
?Func@@YAXQAHAAH@Z PROC NEAR ; start of Func
; parameter 1: 8 + esp ; a
; parameter 2: 12 + esp ; r
    $B1$1:                        ; unused label
    push ebx                      ; save ebx on stack
    mov ecx, DWORD PTR [esp+8]    ; ecx = a
    xor eax, eax                  ; eax = i = 0
    mov edx, DWORD PTR [esp+12]   ; edx = r
$B1$2:                            ; top of loop
    mov ebx, eax                  ; compute i/2 in ebx
    shr ebx, 31                   ; shift down sign bit of i
    add ebx, eax                  ; i + sign(i)  ;; == i + 1 ,because of division operation
    sar ebx, 1                    ; shift right = divide by 2
    add ebx, DWORD PTR [edx]      ; add what r points to
    mov DWORD PTR[ecx+eax*4],ebx  ; store result in array
    add eax, 1                    ; i++
    cmp eax, 100                  ; check if i < 100
    jl $B1$2                      ; repeat loop if true
$B1$3:                            ; unused label
    pop ebx                       ; restore ebx from stack
    ret                           ; return
    ALIGN 4                       ; align
?Func@@YAXQAHAAH@Z ENDP           ; mark end of procedure

上面代码比较好懂,但是有个一个部分我是看了好久然后跟实验室同学讨论过后才明白,就是shr ebx, eax \n add ebx, eax这两步为什么要有i + sign(i)操作呢?
CSAPP上有详细的讲计算机补码的除法运算那一部分有讲:除法的补救部分,对于除数是2的指数可以用以为操作来计算,但是当被除数是负数的时候(第一位是1),单纯的移位不能得到正确的结果,但是有一个技巧就是对被除数加上一个“偏置”然后移位,比如说a / (2^k) 在计算机里面a是用a的补码表示的,计算方法就是 : (a_补 + 2^k-1) >> k; 如果a是正数就直接a>>k;
对应于上面汇编,因为除数是2(源代码里对应 "i / 2")所以如果i<0要对i进行"+2^1-1 = +1"操作,如果i>0就+0,正好对应+sign(i) 操作,不得不说编译器还真TM智能。

上面代码我们可能我们每天都会写,但是仔细阅读上面汇编我们可能发现如下问题:
1. i+sign(i)然后移位的操作虽然很秀,但是根本没必要,因为通过代码我们知道i是loop counter,不可能会小于0,所以除2操作直接移位就可以了;
2. add ebx, DWORD PTR [edx] ; add what r points to 这一步在循环中反复被执行,而我们知道这对应着一步访存操作,因为函数里面我们传的是&r,我们不知道r会不会在某一时刻改变,所以只能每次loop都重新从内存中load一遍,非常的耗时。
3. 由于r + i/2 是i的阶跃函数,所以我们可以把这个循环给展开来。

针对以上三点,我们修改后的代码如下:

void Func(int a[], int & r) {
  unsigned int i;
  int Induction = r;
  for (i = 0; i < 100; i += 2) {
    a[i] = Induction;
    a[i+1] = Induction;
    Induction++;
  }
}

编译后的代码如下:

ALIGN 4 ; align by 4
PUBLIC ?Func@@YAXQAHAAH@Z ; mangled function name
?Func@@YAXQAHAAH@Z PROC NEAR ; start of Func
; parameter 1: 4 + esp ; a
; parameter 2: 8 + esp ; r
$B1$1: ; unused label
    mov eax, DWORD PTR [esp+4]    ; eax = address of a
    mov edx, DWORD PTR [esp+8]    ; edx = address in r
    mov ecx, DWORD PTR [edx]      ; ecx = Induction
    lea edx, DWORD PTR [eax+400]  ; edx = point to end of a
$B2$2:                            ; top of loop
    mov DWORD PTR [eax], ecx      ; a[i] = Induction;
    mov DWORD PTR [eax+4], ecx    ; a[i+1] = Induction;
    add ecx, 1                    ; Induction++;
    add eax, 8                    ; point to a[i+2]
    cmp edx, eax                  ; compare with end of array
    ja $B2$2                      ; jump to top of loop
$B2$3:                            ; unused label
    ret                           ; return from Func
    ALIGN 4
; mark_end;

上一篇下一篇

猜你喜欢

热点阅读