CH9.3/9.4 优化cache

2019-05-21  本文已影响0人  磊宝万岁
如何利用cache
code
  1. 把一起使用的代码放在有一块,把经常使用的代码放在一块;这里的“一起使用”是指翻译之后的,即汇编代码要在一块,通常情况下,汇编代码是和源代码差不多顺序的。
  2. 把不常用到的代码,比如异常处理放在代码(函数)的最后,或者另外使用一个函数。
  3. 对于跨文件的情况, 比如子类一个文件,父类一个文件,有时候子类的函数和父类的函数要一块执行,所以我们最好在link的时候把他们组织在一块;
    怎么组织呢,通常来讲文件link的顺序就是他们在makefile中出现的顺序。可以通过查找map file 来看每个函数在内存的什么位置。
Variable
  1. 函数中用到的变量要在函数中声明,因为函数中声明的变量(非动态分配的内存)是放在堆栈中的,我们知道堆栈中的数据是连续的,这给我们cache提供了良好的数据结构(动态分配的内存不是放在堆栈中,而是分布在内存的各个部分)。

  2. 面向对象语言可以很好的组织数据,因为一个对象里的数据肯定是连续存放的。

  3. 如果我们循环访问多个数组的相同位置,我们我们可以重新组织数据,时期访问连续。重新组织的方法有两个:合并数组和使用structa。
    例如:如下代码访问a、b数组

    int Func(int);
    const int size = 1024;
    int a[size], b[size], i;
    ...
    for(i=0; i<size; i++){
        b[i] = Func(a[i]);
    }
    

    上述代码访问a和b数组的对应位置。为了使访存连续,我们可以利用struct来组织数据结构,声明struct不会有额外消耗。

    int Func(int);
    const int size = 1024;
    struct Sab {int a; int b};
    Sab ab[size];
    int i;
    ...
    for(i=0; i<size; i++){
        ab[i].a = Func(ab[i].b);
    }
    

    上面代码有三个好处:(1) 数据访问时连续的; (2) 声明struct不会产生额外的开销; (3) 程序只需访问一个数组而不是两个。

    然后经过我的测试,上述代码不会并没有产生性能提升。。。。

  4. 如果我们可以根据条件选择不同的数据类型,我们可以使用union来节省一半空间。如下所示:

    void F1(int x[]);
    void F2(float x[]);
    void F3(bool y) {
      if (y) {
        int a[1000];
        F1(a);
      }
      else {
        float b[1000];
        F2(b);
      }
    } 
    

    我们到a 和 b 数组只能用一个,所以用union可以更节省空间。

    void F3(bool y) {
      union {
        int a[1000];
        float b[1000];
      };
      if (y) {
        F1(a);
      }
      else {
        F2(b);
      }
    }
    
上一篇 下一篇

猜你喜欢

热点阅读