Rust self可变性污染

2021-03-19 本文已影响0人黑天鹅学院

问题背景

来看一个简单的结构体定义：

#[derive(Debug, Default)]
pub struct A {
    data: i32,
}

#[derive(Debug, Default)]
pub struct B {
    data: i32,
    a: A,
}

impl A {
    pub fn foo(&self) -> i32 {
        // ...
    }
}
impl B {
    pub fn foo(&self) -> i32 {
        let val = self.a.foo();
        // ...
    }
}

在结构体B中包含了一个结构体A，如果需要在A的foo函数中对A中的变量进行修改，则A中的foo函数需要修改参数为&mut self，此时，B中的foo函数中self.a需要变成&mut，在这种情况下，B中的foo函数参数也需要修改为&mut self。本来只是修改了A的定义，现在却连带B的定义也需要进行修改，这种现象称为self可变性污染。

污染的根源在于底层结构A中的self可变性与高层结构B中的self可变性发生了耦合，一旦底层结构发生可变性修改，必须连带高层结构同时修改。

非耦合场景

非耦合场景中，底层与高层结构均不需要可变性。


#[derive(Debug, Default)]
pub struct A {
    data: i32,
}

#[derive(Debug, Default)]
pub struct B {
    data: i32,
    a: A,
}

impl A {
    pub fn foo(&self) -> i32 {
        return self.data;
    }
}
impl B {
    pub fn foo(&self) -> i32 {
        let val = self.a.foo();
        return val;
    }
}

fn main() {
    let a = A{data: 123};
    let b = B{a: a, data: 234};

    println!("before b = {:?}", b);

    let result = b.foo(456);
    println!("result = {}", result);
    println!("after b = {:?}", b);
}

耦合模式实现

底层引入可变性后，连带高层需要加入可变性，同时最顶层的变量也需要加入可变属性。


#[derive(Debug, Default)]
pub struct A {
    data: i32,
}

#[derive(Debug, Default)]
pub struct B {
    data: i32,
    a: A,
}

impl A {
    pub fn foo(&mut self, data: i32) -> i32 {
        self.data = data;
        return self.data;
    }
}
impl B {
    pub fn foo(&mut self, data: i32) -> i32 {
        let val = self.a.foo(data);
        return val;
    }
}

fn main() {
    let a = A{data: 123 };
    let mut b = B{a: a, data: 234};

    println!("before b = {:?}", b);

    let result = b.foo(789);
    println!("result = {}", result);
    println!("after b = {:?}", b);
}

上面仅仅展示了一个简单的结构体引用的场景，如果这个结构体引用层次较多，或者包含了其他crate中定义的结构，这种可变性污染将是个灾难性的难题。

为了避免可变性污染，需要将结构体间的引用解耦开，使得底层定义的修改仅限于内部完成，一旦发生修改，仅修改特定的定义即可，这个场景，正符合内部可变性的应用范围。

包裹模式实现

use std::cell::RefCell;
use std::rc::Rc;

#[derive(Debug, Default)]
pub struct A {
    data: i32,
}

#[derive(Debug, Default)]
pub struct B {
    data: i32,
    a: Rc<RefCell<A>>,
}

impl A {
    pub fn foo(&mut self, data: i32) -> i32 {
        self.data = data;
        return self.data;
    }
}
impl B {
    pub fn foo(&self, data: i32) -> i32 {
        let val = self.a.borrow_mut().foo(data);
        return val;
    }
}

fn main() {
    let a = A{data: 123};
    let b = B{a: Rc::new(RefCell::new(a)), data: 234};

    println!("before b = {:?}", b);

    let result = b.foo(789);
    println!("result = {}", result);
    println!("after b = {:?}", b);
}

通过使用Rc<RefCell<T>>的包裹，在A中进行的修改与B本身的可变性无关，在B中通过borrow_mut获取到A的引用，后续的修改仅与A本身相关。

总结

在Rust中，由于可变性的限制，结构体引用是一个会导致极大复杂度的设计方法，为了避免可变性的污染，应该尽量使得结构体内部的引用之间解耦开，使得有逻辑依赖的结构体可以独立的进行修改。

在解耦之后，需要使用borrow，match等手段才能取到被包裹的原始内容，可能会带来一定的复杂性，但是相比语义污染而言，这种方法不失为一种更加优秀的设计模式。

使用RefCell包裹后，避免了可变性污染的问题，但是也不应该滥用导致可变性限制失去约束力，编码过程中应结合实际情况选择合适的方法。

Rust self可变性污染

问题背景

非耦合场景

耦合模式实现

包裹模式实现

总结

猜你喜欢

热点阅读