Rust self可变性污染

2021-03-19  本文已影响0人  黑天鹅学院

问题背景

来看一个简单的结构体定义:

#[derive(Debug, Default)]
pub struct A {
    data: i32,
}

#[derive(Debug, Default)]
pub struct B {
    data: i32,
    a: A,
}

impl A {
    pub fn foo(&self) -> i32 {
        // ...
    }
}
impl B {
    pub fn foo(&self) -> i32 {
        let val = self.a.foo();
        // ...
    }
}

在结构体B中包含了一个结构体A,如果需要在A的foo函数中对A中的变量进行修改,则A中的foo函数需要修改参数为&mut self,此时,B中的foo函数中self.a需要变成&mut,在这种情况下,B中的foo函数参数也需要修改为&mut self。本来只是修改了A的定义,现在却连带B的定义也需要进行修改,这种现象称为self可变性污染。

污染的根源在于底层结构A中的self可变性与高层结构B中的self可变性发生了耦合,一旦底层结构发生可变性修改,必须连带高层结构同时修改。

非耦合场景

非耦合场景中,底层与高层结构均不需要可变性。


#[derive(Debug, Default)]
pub struct A {
    data: i32,
}

#[derive(Debug, Default)]
pub struct B {
    data: i32,
    a: A,
}

impl A {
    pub fn foo(&self) -> i32 {
        return self.data;
    }
}
impl B {
    pub fn foo(&self) -> i32 {
        let val = self.a.foo();
        return val;
    }
}

fn main() {
    let a = A{data: 123};
    let b = B{a: a, data: 234};

    println!("before b = {:?}", b);

    let result = b.foo(456);
    println!("result = {}", result);
    println!("after b = {:?}", b);
}

耦合模式实现

底层引入可变性后,连带高层需要加入可变性,同时最顶层的变量也需要加入可变属性。


#[derive(Debug, Default)]
pub struct A {
    data: i32,
}

#[derive(Debug, Default)]
pub struct B {
    data: i32,
    a: A,
}

impl A {
    pub fn foo(&mut self, data: i32) -> i32 {
        self.data = data;
        return self.data;
    }
}
impl B {
    pub fn foo(&mut self, data: i32) -> i32 {
        let val = self.a.foo(data);
        return val;
    }
}

fn main() {
    let a = A{data: 123 };
    let mut b = B{a: a, data: 234};

    println!("before b = {:?}", b);

    let result = b.foo(789);
    println!("result = {}", result);
    println!("after b = {:?}", b);
}

上面仅仅展示了一个简单的结构体引用的场景,如果这个结构体引用层次较多,或者包含了其他crate中定义的结构,这种可变性污染将是个灾难性的难题。

为了避免可变性污染,需要将结构体间的引用解耦开,使得底层定义的修改仅限于内部完成,一旦发生修改,仅修改特定的定义即可,这个场景,正符合内部可变性的应用范围。

包裹模式实现

use std::cell::RefCell;
use std::rc::Rc;

#[derive(Debug, Default)]
pub struct A {
    data: i32,
}

#[derive(Debug, Default)]
pub struct B {
    data: i32,
    a: Rc<RefCell<A>>,
}

impl A {
    pub fn foo(&mut self, data: i32) -> i32 {
        self.data = data;
        return self.data;
    }
}
impl B {
    pub fn foo(&self, data: i32) -> i32 {
        let val = self.a.borrow_mut().foo(data);
        return val;
    }
}

fn main() {
    let a = A{data: 123};
    let b = B{a: Rc::new(RefCell::new(a)), data: 234};

    println!("before b = {:?}", b);

    let result = b.foo(789);
    println!("result = {}", result);
    println!("after b = {:?}", b);
}

通过使用Rc<RefCell<T>>的包裹,在A中进行的修改与B本身的可变性无关,在B中通过borrow_mut获取到A的引用,后续的修改仅与A本身相关。

总结

在Rust中,由于可变性的限制,结构体引用是一个会导致极大复杂度的设计方法,为了避免可变性的污染,应该尽量使得结构体内部的引用之间解耦开,使得有逻辑依赖的结构体可以独立的进行修改。

在解耦之后,需要使用borrow,match等手段才能取到被包裹的原始内容,可能会带来一定的复杂性,但是相比语义污染而言,这种方法不失为一种更加优秀的设计模式。

使用RefCell包裹后,避免了可变性污染的问题,但是也不应该滥用导致可变性限制失去约束力,编码过程中应结合实际情况选择合适的方法。

上一篇 下一篇

猜你喜欢

热点阅读