理解rust的所有权

2021-06-18 本文已影响0人梁帆

一、值拷贝和引用拷贝

先引入c++中的两个概念，值拷贝和引用拷贝。

1、两者区别

值拷贝，拷贝的是存储在stack上的数据。如以下代码，发生的就是值拷贝：

值拷贝

引用拷贝，拷贝的是存储在heap上的数据的所在地址，该地址存储在stack中。如拷贝String，就发生了引用拷贝：

引用拷贝

2、引用拷贝容易引发的问题

引用拷贝的原理如下：

引用拷贝的原理

问题一：悬垂指针

经过引用拷贝之后，指针s2和指针s1指向了同一块地址。试想一下这样的情景：当s1指向的堆内存被释放了之后，如c语言中执行了free(s1)语句，那么s2指针若在其后被使用，就会导致内存访问的错误，造成严重的后果。这个情境中，s2指针就被成为悬垂指针(Dangling Pointer)。

悬垂指针：指针所指向的对象已经被释放或者回收了，但是指向该对象的指针没有作任何的修改，仍旧指向已经回收的内存地址。此类指针称为垂悬指针。

问题二：二次释放

当变量离开作用域后，Rust 自动调用 drop 函数并清理变量的堆内存。试想一下这样的情景：当 s2 和 s1 离开作用域，他们都会尝试释放相同的内存，两次释放（相同）内存会导致内存污染，它可能会导致潜在的安全漏洞。这种错误叫做二次释放(double free)。

二、所有权机制

1、基本内容

针对以上可能存在的问题，为了能保证内存安全，rust设计了所有权机制：当做了"let s2=s1"这种引用拷贝之后，rust就认为原来指向那块内存的指针s1失效。若在s2创建之后再去使用s1，就会发生报错。内存示意图如下：

引用移动

其实在rust中，用“引用拷贝”是不贴切的。图中的s1和s2，与其说是拷贝，不如说是移动。rust中有两种语义：复制(copy)和移动(move)，Copy就对应了值的拷贝，即在栈中复制一份副本，然后绑定在新的变量上；Move就表示引用/指针发生了移动，原有的指针失效，只有新的指针有效。

由此，rust的所有权机制(OwnerShip)就被揭开：

rust中分配的每一块内存都有且仅有唯一的所有者，由所有者来负责该内存的释放和读写权限。

2、所有权与函数

向函数中传递参数时，可能会发生Copy或者Move，就跟赋值语句一样。

示例如下：

示例

其中有指向堆内存的指针s字符串，有栈值x。当s进入函数中时发生了Move行为，堆内存的所有权移交给了函数，原有的所有权占有者s失效；而x进入函数时发生的是Copy行为，进入函数的只是原来x值的一个副本。

3、引用

（1）引用的基本概念

有一个问题如下：

写一个函数，传入一个字符串，要求返回字符串的内容和长度。

考虑到rust的所有权机制，我们会写成下面的样子：

没有引用的代码

这个例子中，我们必须要新引入一个变量s2用于接收s1传进函数中丢失的所有权。这样一来就显得代码臃肿。由此引出rust在设计上的另一个特性：引用(reference)。

有引用的代码

引用的底层原理如下：

引用的原理

&s1 语法让我们创建一个指向值 s1 的引用，但是并不拥有它。即引用是不持有所有权的。因为并不拥有这个值，当引用离开作用域时其指向的值也不会被丢弃。

（2）可变引用和不可变引用

有示例如下：

示例

change函数尝试在s之后加上新的字符串内容，这里运行会出错，因为s是不可变的。

只需要在源代码上稍作修改，就可以正常运行：

修改后的示例

这里s用到了mut，函数形参和实参都用到了&mut，这就是可变引用的实例。

但是值得注意的是：

在特定作用域中的特定数据有且只有一个可变引用。

如以下代码，是没办法通过编译的：

多个可变引用导致编译失败

这可以非常有效地避免数据竞争。但如果是多个不可变的引用，则是可以正常编译运行的，因为都是不可变的，对内存安全没有影响。同时有可变和不可变的引用，也是不被允许的。