理解rust的所有权

2021-06-18  本文已影响0人  梁帆

一、值拷贝和引用拷贝

先引入c++中的两个概念,值拷贝引用拷贝

1、两者区别

值拷贝,拷贝的是存储在stack上的数据。如以下代码,发生的就是值拷贝:

值拷贝

引用拷贝,拷贝的是存储在heap上的数据的所在地址,该地址存储在stack中。如拷贝String,就发生了引用拷贝:

引用拷贝

2、引用拷贝容易引发的问题

引用拷贝的原理如下:

引用拷贝的原理

问题一:悬垂指针

经过引用拷贝之后,指针s2和指针s1指向了同一块地址。试想一下这样的情景:当s1指向的堆内存被释放了之后,如c语言中执行了free(s1)语句,那么s2指针若在其后被使用,就会导致内存访问的错误,造成严重的后果。这个情境中,s2指针就被成为悬垂指针(Dangling Pointer)。

悬垂指针:指针所指向的对象已经被释放或者回收了,但是指向该对象的指针没有作任何的修改,仍旧指向已经回收的内存地址。 此类指针称为垂悬指针。

问题二:二次释放

当变量离开作用域后,Rust 自动调用 drop 函数并清理变量的堆内存。试想一下这样的情景:当 s2 和 s1 离开作用域,他们都会尝试释放相同的内存,两次释放(相同)内存会导致内存污染,它可能会导致潜在的安全漏洞。这种错误叫做二次释放(double free)。

二、所有权机制

1、基本内容

针对以上可能存在的问题,为了能保证内存安全,rust设计了所有权机制:当做了"let s2=s1"这种引用拷贝之后,rust就认为原来指向那块内存的指针s1失效。若在s2创建之后再去使用s1,就会发生报错。内存示意图如下:

引用移动

其实在rust中,用“引用拷贝”是不贴切的。图中的s1和s2,与其说是拷贝,不如说是移动。rust中有两种语义:复制(copy)移动(move),Copy就对应了值的拷贝,即在栈中复制一份副本,然后绑定在新的变量上;Move就表示引用/指针发生了移动,原有的指针失效,只有新的指针有效。

由此,rust的所有权机制(OwnerShip)就被揭开:

rust中分配的每一块内存都有且仅有唯一的所有者,由所有者来负责该内存的释放和读写权限。

2、所有权与函数

向函数中传递参数时,可能会发生Copy或者Move,就跟赋值语句一样。

示例如下:

示例

其中有指向堆内存的指针s字符串,有栈值x。当s进入函数中时发生了Move行为,堆内存的所有权移交给了函数,原有的所有权占有者s失效;而x进入函数时发生的是Copy行为,进入函数的只是原来x值的一个副本。

3、引用

(1)引用的基本概念

有一个问题如下:

写一个函数,传入一个字符串,要求返回字符串的内容和长度。

考虑到rust的所有权机制,我们会写成下面的样子:

没有引用的代码

这个例子中,我们必须要新引入一个变量s2用于接收s1传进函数中丢失的所有权。这样一来就显得代码臃肿。由此引出rust在设计上的另一个特性:引用(reference)。

有引用的代码

引用的底层原理如下:

引用的原理

&s1 语法让我们创建一个 指向 值 s1 的引用,但是并不拥有它。即引用是不持有所有权的。因为并不拥有这个值,当引用离开作用域时其指向的值也不会被丢弃。

(2)可变引用和不可变引用

有示例如下:

示例

change函数尝试在s之后加上新的字符串内容,这里运行会出错,因为s是不可变的。

只需要在源代码上稍作修改,就可以正常运行:

修改后的示例

这里s用到了mut,函数形参和实参都用到了&mut,这就是可变引用的实例。

但是值得注意的是:

在特定作用域中的特定数据有且只有一个可变引用。

如以下代码,是没办法通过编译的:

多个可变引用导致编译失败

这可以非常有效地避免数据竞争。但如果是多个不可变的引用,则是可以正常编译运行的,因为都是不可变的,对内存安全没有影响。同时有可变和不可变的引用,也是不被允许的。

上一篇下一篇

猜你喜欢

热点阅读