当前位置: 首页 > news >正文

理解 Rust 中的 String 分配机制

在 Rust 中,哪怕是一行再普通不过的代码,也可能暗藏玄机。这次我们就来剖析这样一句看似简单的代码:

let s = "hello world".to_string();

这行代码触发了 只读数据段(.rodata)堆(heap)栈(stack) 三个内存区域的联动。我们将一步步解析这背后发生的事情,并最终弄清楚为什么一个字符串变量要占用 3 个 word(24 字节)


一、从这行代码开始

我们先看代码:

let s = "hello world".to_string();

你可能以为这里只是创建了一个字符串对象,实则触发了一连串复杂的内存操作。


二、程序中的三大内存区域

1. .rodata(只读数据段)

  • 存储内容:程序中所有不可变的字符串常量(比如 "hello world"
  • 特点:编译时就确定,加载程序时直接映射进内存,不可修改
  • 举例:"hello world" 编译后会保存在 .rodata 里,是只读的静态内存

2. 堆(Heap)

  • 存储内容:运行时动态分配的内存
  • 特点:需要手动管理(Rust 用所有权系统保障安全)
  • 在这里:.to_string() 会在堆上开辟一块新空间,把 "hello world" 拷贝进来

3. 栈(Stack)

  • 存储内容:函数里的局部变量和结构体字段(固定大小)
  • 在这里:变量 s 是个 String,它是一个结构体,保存在栈上,记录了堆那块内存的三个关键信息

三、什么是一个 word?

  • 64 位系统 中,一个 word = 8 字节
  • Rust 中很多基础类型如指针、usize 等都是一个 word 大小
  • 一个 String 包含 3 个字段:指针 + 长度 + 容量 → 共 3 个 word = 24 字节

四、Rust 中 String 的结构

Rust 的 String 实际上是下面这个结构:

struct String {
    ptr: *const u8,    // 指向堆上的字符串数据
    len: usize,        // 当前字符串的长度
    capacity: usize,   // 分配的总内存容量
}

举个例子,如果你用 .to_string() 创建了 "hello world",那么:

  • ptr → 指向堆上的字符串数据
  • len = 11(hello world 一共 11 个字符)
  • capacity = 11(刚好分配了 11 字节)

五、这行代码到底做了什么?

来回顾这句代码:

let s = "hello world".to_string();

执行过程:

  1. "hello world" 是字符串字面量,编译阶段进入 .rodata
  2. .to_string() 时:
    • 在堆上申请 11 字节
    • .rodata 中的数据逐字节拷贝过去
  3. 在栈上创建一个 String 结构体(变量 s):
    • 存储堆地址(ptr)
    • 长度(len = 11)
    • 容量(capacity = 11)

📦 三个 word 分别是什么?

字段类型意义
ptr*const u8指向堆上数据的地址
lenusize表示字符串当前长度
capacityusize表示堆中已分配的空间容量

六、用代码验证 String 的大小

可以用 std::mem::size_of::<String>() 来验证:

use std::mem::size_of;

fn main() {
    println!("Size of String: {}", size_of::<String>());
}

输出为:

Size of String: 24

七、可视化内存布局

.rodata(只读段):
+----------------+
| "hello world"  | ← 编译时写入,可读不可改

堆:
+-----------------------------------+
| 'h' 'e' 'l' 'l' 'o' ' ' 'w' 'o' 'r' 'l' 'd' |
^
|__ s.ptr 指向这里,len = 11,cap = 11

栈:
+------------------------------+
| ptr(指向堆)               |
| len = 11                    |
| capacity = 11               |
+------------------------------+

八、延伸思考与解答

❓1. 如果改用 let s = "hello world"; 会发生什么?

这是 &'static str,不是 String

  • "hello world" 仍然在 .rodata
  • s 是对该段的引用,不会复制也不会在堆上分配内存
  • s 的类型是 &'static str,本质上就是一个指针和长度的组合,占 16 字节(2 个 word)

👉 更高效,但不可变。


❓2. 为什么还要用 .to_string(),不直接用 &str

  • &str只读的,不能修改
  • .to_string() 创建一个 可变字符串,你可以 .push().insert()
  • 在需要修改字符串内容时,必须使用 String

❓3. 如果字符串很长或频繁修改,是否性能差?

  • 如果你不断修改字符串,比如 .push_str(),可能会多次触发重新分配(扩容)
  • 最好使用 .with_capacity() 预先分配内存,避免多次扩容

例如:

let mut s = String::with_capacity(100);
s.push_str("hello");

❓4. Vec<T>String 内部结构一样吗?

几乎一样!

  • String 就是 Vec<u8> 的封装
  • 二者都有指针、长度、容量
  • 所以你可以通过 .into_bytes()String 转成 Vec<u8>,而 .from_utf8() 可以反转回来

九、总结

这一行代码表面上只是创建了一个字符串,但它背后涉及了:

  • .rodata 存储静态常量
  • 堆上拷贝数据(可变性)
  • 栈上维护指针、长度、容量

它完美体现了 Rust 的内存模型:安全、高效、结构清晰

相关文章:

  • 【Vue-组件】学习笔记
  • AI烘焙大赛中的算法:理解PPO、GRPO与DPO的罪简单的方式
  • NVR接入录像回放平台用EasyCVR打造地下车库安防:大型商居安全优选方案
  • Windows 图形显示驱动开发-WDDM 2.0功能_重排范围
  • 阿里云大模型训练与推理开发
  • 关于点卷积
  • 利用Ollama对AI大模型进行攻击
  • vue3 处理文字 根据文字单独添加class
  • MySQL基础 [五] - 表的增删查改
  • 进程状态(运行 阻塞 僵尸)及其场景分析
  • 智谛达多功能人形机器人:未来生活的得力助手
  • DMA 概念与讲解
  • LeetCode 热题 100_完全平方数(84_279_中等_C++)(动态规划(完全背包))
  • 随机产生4位随机码(java)
  • 设计模式之享元模式
  • 图解AUTOSAR_SWS_FlexRayDriver
  • 使用分布式锁和乐观锁解决超卖问题
  • 闪蒸高密度聚乙烯无纺布市场报告:探索高性能材料的新机遇
  • 搜广推面经六十八
  • yum拒绝连接
  • 更改wordpress小工具的样式/关键词seo服务
  • 免费cms网站管理系统/中央电视台一套广告价目表
  • 班组安全建设 网站/优化最狠的手机优化软件
  • 哪个cms做企业网站好/新闻最新消息10条
  • 计算机专业设计一个网站/推广工作的流程及内容
  • 江苏省建设厅网站证件查询/河北百度seo