Rust 智能指针深入浅出

原创已于 2025-07-08 10:49:22 修改 · 738 阅读

10 ·

CC 4.0 BY-SA版权

文章标签：

#rust #开发语言 #后端

于 2025-07-08 10:34:31 首次发布

Rust 专栏收录该内容

19 篇文章

订阅专栏

在 Rust 中，智能指针是管理内存的高级工具，它们不仅提供指针功能，还包含额外的元数据和能力（如所有权管理、引用计数等）。以下是 Rust 主要智能指针的全面解析：

一、智能指针 vs 普通引用

特性	普通引用 (`&T`)	智能指针
所有权	只借用数据	通常拥有数据所有权
功能	简单的内存访问	附加管理逻辑
内存位置	可指向栈或堆	通常管理堆内存
元数据	无	包含额外元数据

二、核心智能指针类型

1. `Box<T>`：堆分配的最简指针

作用：在堆上分配值，栈上存储指针
所有权：单一所有者
特点：
- 编译时已知大小（因为指针大小固定）
- 离开作用域自动释放内存
使用场景：
- 递归类型（如链表节点）
- 大数据转移所有权（避免复制）
- trait 对象（Box<dyn Trait>）

let boxed = Box::new(5); // 在堆上分配整数
let list = Cons(1, Box::new(Cons(2, Box::new(Nil)))); // 递归类型

2. `Rc<T>`：引用计数指针

作用：多所有权共享数据
所有权：多个不可变引用
特点：
- 单线程使用
- 运行时引用计数
- clone() 增加计数，离开作用域减少计数
使用场景：
- 共享只读数据
- 图结构、UI 组件树

use std::rc::Rc;

let shared = Rc::new(42);
let clone1 = Rc::clone(&shared);
let clone2 = Rc::clone(&shared);
// 所有克隆指向同一数据

3. `RefCell<T>`：内部可变性容器

作用：在不可变引用中修改数据
所有权：运行时借用检查
特点：
- 单线程使用
- 绕过编译时借用检查（运行时检查）
- 使用 borrow() 和 borrow_mut() 访问
使用场景：
- 需要修改共享数据
- 模拟编译时无法确认的借用模式

use std::cell::RefCell;

let cell = RefCell::new(42);
{
    let mut ref_mut = cell.borrow_mut(); // 运行时借用检查
    *ref_mut += 10;
}
println!("{}", cell.borrow()); // 52

4. `Arc<T>`：原子引用计数

作用：线程安全的引用计数
所有权：多线程共享
特点：
- 使用原子操作保证线程安全
- 比 Rc 性能略低
使用场景：
- 跨线程共享数据
- 常与 Mutex 配合使用

use std::sync::Arc;
use std::thread;

let shared = Arc::new(42);
let threads: Vec<_> = (0..5).map(|i| {
    let arc_clone = Arc::clone(&shared);
    thread::spawn(move || {
        println!("Thread {}: {}", i, arc_clone);
    })
}).collect();

for t in threads {
    t.join().unwrap();
}

5. `Mutex<T>`：互斥锁

作用：线程间安全共享可变数据
所有权：通过锁机制控制访问
特点：
- 提供内部可变性
- 阻塞等待锁释放
使用场景：
- 跨线程修改共享数据
- 常与 Arc 组合使用

use std::sync::{Arc, Mutex};

let counter = Arc::new(Mutex::new(0));
let mut handles = vec![];

for _ in 0..10 {
    let counter = Arc::clone(&counter);
    let handle = thread::spawn(move || {
        let mut num = counter.lock().unwrap();
        *num += 1;
    });
    handles.push(handle);
}

for handle in handles {
    handle.join().unwrap();
}
println!("Result: {}", *counter.lock().unwrap()); // 10

三、智能指针关键特性

1. `Deref` Trait：解引用能力

use std::ops::Deref;

struct MyBox<T>(T);

impl<T> Deref for MyBox<T> {
    type Target = T;
    
    fn deref(&self) -> &Self::Target {
        &self.0
    }
}

fn main() {
    let my_box = MyBox(5);
    assert_eq!(5, *my_box); // 通过Deref实现解引用
}

2. `Drop` Trait：自定义清理

struct CustomPointer {
    data: String,
}

impl Drop for CustomPointer {
    fn drop(&mut self) {
        println!("Dropping: {}", self.data);
    }
}

fn main() {
    let _p = CustomPointer { data: "resource".into() };
    // 离开作用域时打印 "Dropping: resource"
}

四、组合使用模式

1. `Rc<RefCell<T>>`：单线程共享可变数据

use std::rc::Rc;
use std::cell::RefCell;

let shared_vec = Rc::new(RefCell::new(vec![1, 2, 3]));

// 克隆引用
let clone1 = Rc::clone(&shared_vec);
let clone2 = Rc::clone(&shared_vec);

// 在不同位置修改
clone1.borrow_mut().push(4);
clone2.borrow_mut().push(5);

println!("{:?}", shared_vec.borrow()); // [1, 2, 3, 4, 5]

2. `Arc<Mutex<T>>`：多线程共享可变数据

use std::sync::{Arc, Mutex};
use std::thread;

let counter = Arc::new(Mutex::new(0));
let mut handles = vec![];

for _ in 0..10 {
    let counter = Arc::clone(&counter);
    let handle = thread::spawn(move || {
        let mut num = counter.lock().unwrap();
        *num += 1;
    });
    handles.push(handle);
}

// 等待所有线程完成
for handle in handles {
    handle.join().unwrap();
}

println!("Final count: {}", *counter.lock().unwrap()); // 10

五、智能指针选择指南

场景需求	推荐智能指针
单一所有权堆分配	`Box<T>`
单线程共享不可变数据	`Rc<T>`
单线程共享可变数据	`Rc<RefCell<T>>`
多线程共享不可变数据	`Arc<T>`
多线程共享可变数据	`Arc<Mutex<T>>` 或 `Arc<RwLock<T>>`
需要自定义析构行为	实现 `Drop` trait

六、最佳实践与注意事项

优先选择编译时检查：能用引用解决就不用智能指针
避免循环引用：
- 使用 Weak<T> 打破 Rc/Arc 循环

use std::rc::{Rc, Weak};

struct Node {
    parent: RefCell<Weak<Node>>,
    children: RefCell<Vec<Rc<Node>>>,
}

注意死锁风险：
1. 避免在持有锁时调用可能再次请求锁的代码
性能考量：
- RefCell 有运行时开销
- Mutex 有加锁开销
替代方案：
- 考虑使用基于栈的 arena 分配器处理大量小对象
- 使用第三方库如 crossbeam 的高级并发工具

七、底层原理揭秘

1. `Rc` 内存布局：

[ strong count | weak count | data ]
  -----------   ---------   ------
     8字节        8字节       T大小

2. `Arc` 的原子操作：

// 简化版原子计数
use std::sync::atomic::{AtomicUsize, Ordering};

struct ArcInner<T> {
    strong: AtomicUsize, // 原子计数器
    data: T,
}

3. `Mutex` 实现伪代码：

struct Mutex<T> {
    locked: AtomicBool, // 锁状态
    data: UnsafeCell<T>, // 内部可变性
}

Rust 智能指针深入浅出

一、智能指针 vs 普通引用

二、核心智能指针类型

1. Box<T>：堆分配的最简指针

2. Rc<T>：引用计数指针

3. RefCell<T>：内部可变性容器

4. Arc<T>：原子引用计数

5. Mutex<T>：互斥锁

三、智能指针关键特性

1. Deref Trait：解引用能力

2. Drop Trait：自定义清理

四、组合使用模式

1. Rc<RefCell<T>>：单线程共享可变数据

2. Arc<Mutex<T>>：多线程共享可变数据

五、智能指针选择指南

六、最佳实践与注意事项

七、底层原理揭秘

1. Rc 内存布局：

2. Arc 的原子操作：

3. Mutex 实现伪代码：

1. `Box<T>`：堆分配的最简指针

2. `Rc<T>`：引用计数指针

3. `RefCell<T>`：内部可变性容器

4. `Arc<T>`：原子引用计数

5. `Mutex<T>`：互斥锁

1. `Deref` Trait：解引用能力

2. `Drop` Trait：自定义清理

1. `Rc<RefCell<T>>`：单线程共享可变数据

2. `Arc<Mutex<T>>`：多线程共享可变数据

1. `Rc` 内存布局：

2. `Arc` 的原子操作：

3. `Mutex` 实现伪代码：