Rust 程序设计语言
Rust 前言
Rust 简介
Rust 入门指南
1. Rust 安装
2. Rust Hello, World!
3. Rust Hello, Cargo!
Rust 写个猜数字游戏
Rust 常见编程概念
1. Rust 变量和可变性
2. Rust 数据类型
3. Rust 函数
4. Rust 注释
5. Rust 控制流
Rust 认识所有权
1. Rust 什么是所有权？
2. Rust 引用与借用
3. Rust Slice 类型
Rust 使用结构体组织相关联的数据
1. Rust 结构体的定义和实例化
2. Rust 结构体示例程序
3. Rust 方法语法
Rust 枚举和模式匹配
1. Rust 枚举的定义
2. Rust match 控制流结构
3. Rust if let 简洁控制流
Rust 使用包、Crate 和模块管理不断增长的项目
1. Rust 包和 Crate
2. Rust 定义模块来控制作用域与私有性
3. Rust 引用模块项目的路径
4. Rust 使用 use 关键字将路径引入作用域
5. Rust 将模块拆分成多个文件
Rust 常见集合
1. Rust 使用 Vector 储存列表
2. Rust 使用字符串储存 UTF-8 编码的文本
3. Rust 使用 Hash Map 储存键值对
Rust 错误处理
1. Rust 用 panic! 处理不可恢复的错误
2. Rust 用 Result 处理可恢复的错误
3. Rust 要不要 panic!
Rust 泛型、Trait 和生命周期
1. Rust 泛型数据类型
2. Rust Trait：定义共同行为
3. Rust 生命周期确保引用有效
Rust 编写自动化测试
1. Rust 如何编写测试
2. Rust 控制测试如何运行
3. Rust 测试的组织结构
Rust 一个 I/O 项目：构建一个命令行程序
1. Rust 接受命令行参数
2. Rust 读取文件
3. Rust 重构改进模块性和错误处理
4. Rust 采用测试驱动开发完善库的功能
5. Rust 处理环境变量
6. Rust 将错误信息输出到标准错误而不是标准输出
Rust 中的函数式语言功能：迭代器与闭包
1. Rust 闭包：可以捕获环境的匿名函数
2. Rust 使用迭代器处理元素序列
3. Rust 改进之前的 I/O 项目
4. Rust 性能对比：循环 VS 迭代器
Rust 进一步认识 Cargo 和 Crates.io
1. Rust 采用发布配置自定义构建
2. Rust 将 crate 发布到 Crates.io
3. Rust Cargo 工作空间
4. Rust 使用 cargo install 从 Crates.io 安装二进制文件
5. Rust Cargo 自定义扩展命令
Rust 智能指针
1. Rust 使用Box<T>指向堆上的数据
2. Rust 通过 Deref trait 将智能指针当作常规引用处理
3. Rust 使用 Drop Trait 运行清理代码
4. Rust Rc<T> 引用计数智能指针
5. Rust RefCell<T> 和内部可变性模式
6. Rust 引用循环会导致内存泄漏
Rust 无畏并发
1. Rust 使用线程同时运行代码
2. Rust 使用消息传递在线程间传送数据
3. Rust 共享状态并发
4. Rust 使用 Sync 和 Send trait 的可扩展并发
Rust 的面向对象特性
1. Rust 面向对象语言的特征
2. Rust 顾及不同类型值的 trait 对象
3. Rust 面向对象设计模式的实现
Rust 模式与模式匹配
1. Rust 所有可能会用到模式的位置
2. Rust Refutability（可反驳性）: 模式是否会匹配失效
3. Rust 所有的模式语法
Rust 高级特征
1. Rust 不安全 Rust
2. Rust 高级 trait
3. Rust 高级类型
4. Rust 高级函数与闭包
5. Rust 宏
Rust 最后的项目: 构建多线程 web server
1. Rust 构建单线程 web server
2. Rust 将单线程 server 变为多线程 server
3. Rust 优雅停机与清理
Rust 附录
1. Rust 附录 A：关键字
2. Rust 附录 B：运算符与符号
3. Rust 附录 C：可派生的 trait
4. Rust 附录 D：实用开发工具
5. Rust 附录 E：版本
6. Rust 附录 F：本书译本
7. Rust 附录 G：Rust 是如何开发的与 “Nightly Rust”

阅读(1.3k) 书签赞(0) 我要纠错

Rust 高级类型

2023-03-22 15:16 更新

ch19-04-advanced-types.md
commit a90f07f1e9a7fc75dc9105a6c6f16d5c13edceb0

Rust 的类型系统有一些我们曾经提到但没有讨论过的功能。首先我们从一个关于为什么 newtype 与类型一样有用的更宽泛的讨论开始。接着会转向类型别名（type aliases），一个类似于 newtype 但有着稍微不同的语义的功能。我们还会讨论 ! 类型和动态大小类型。

这一部分假设你已经阅读了之前的 “newtype 模式用于在外部类型上实现外部 trait” 部分。

为了类型安全和抽象而使用 newtype 模式

newtype 模式可以用于一些其他我们还未讨论的功能，包括静态的确保某值不被混淆，和用来表示一个值的单元。实际上示例 19-15 中已经有一个这样的例子：Millimeters 和 Meters 结构体都在 newtype 中封装了 u32 值。如果编写了一个有 Millimeters 类型参数的函数，不小心使用 Meters 或普通的 u32 值来调用该函数的程序是不能编译的。

另一个 newtype 模式的应用在于抽象掉一些类型的实现细节：例如，封装类型可以暴露出与直接使用其内部私有类型时所不同的公有 API，以便限制其功能。

newtype 也可以隐藏其内部的泛型类型。例如，可以提供一个封装了 HashMap<i32, String> 的 People 类型，用来储存人名以及相应的 ID。使用 People 的代码只需与提供的公有 API 交互即可，比如向 People 集合增加名字字符串的方法，这样这些代码就无需知道在内部我们将一个 i32 ID 赋予了这个名字了。newtype 模式是一种实现第十七章 “封装隐藏了实现细节” 部分所讨论的隐藏实现细节的封装的轻量级方法。

类型别名用来创建类型同义词

连同 newtype 模式，Rust 还提供了声明 类型别名（type alias）的能力，使用 type 关键字来给予现有类型另一个名字。例如，可以像这样创建 i32 的别名 Kilometers：

    type Kilometers = i32;

这意味着 Kilometers 是 i32 的 同义词（synonym）；不同于示例 19-15 中创建的 Millimeters 和 Meters 类型。Kilometers 不是一个新的、单独的类型。Kilometers 类型的值将被完全当作 i32 类型值来对待：

    type Kilometers = i32;

    let x: i32 = 5;
    let y: Kilometers = 5;

    println!("x + y = {}", x + y);

因为 Kilometers 是 i32 的别名，他们是同一类型，可以将 i32 与 Kilometers 相加，也可以将 Kilometers 传递给获取 i32 参数的函数。但通过这种手段无法获得上一部分讨论的 newtype 模式所提供的类型检查的好处。

类型别名的主要用途是减少重复。例如，可能会有这样很长的类型：

Box<dyn Fn() + Send + 'static>

在函数签名或类型注解中每次都书写这个类型将是枯燥且易于出错的。想象一下如示例 19-24 这样全是如此代码的项目：

    let f: Box<dyn Fn() + Send + 'static> = Box::new(|| println!("hi"));

    fn takes_long_type(f: Box<dyn Fn() + Send + 'static>) {
        // --snip--
    }

    fn returns_long_type() -> Box<dyn Fn() + Send + 'static> {
        // --snip--
    }

示例 19-24: 在很多地方使用名称很长的类型

类型别名通过减少项目中重复代码的数量来使其更加易于控制。这里我们为这个冗长的类型引入了一个叫做 Thunk 的别名，这样就可以如示例 19-25 所示将所有使用这个类型的地方替换为更短的 Thunk：

    type Thunk = Box<dyn Fn() + Send + 'static>;

    let f: Thunk = Box::new(|| println!("hi"));

    fn takes_long_type(f: Thunk) {
        // --snip--
    }

    fn returns_long_type() -> Thunk {
        // --snip--
    }

示例 19-25: 引入类型别名 Thunk 来减少重复

这样读写起来就容易多了！为类型别名选择一个好名字也可以帮助你表达意图（单词 thunk 表示会在之后被计算的代码，所以这是一个存放闭包的合适的名字）。

类型别名也经常与 Result<T, E> 结合使用来减少重复。考虑一下标准库中的 std::io 模块。I/O 操作通常会返回一个 Result<T, E>，因为这些操作可能会失败。标准库中的 std::io::Error 结构体代表了所有可能的 I/O 错误。std::io 中大部分函数会返回 Result<T, E>，其中 E 是 std::io::Error，比如 Write trait 中的这些函数：

use std::fmt;
use std::io::Error;

pub trait Write {
    fn write(&mut self, buf: &[u8]) -> Result<usize, Error>;
    fn flush(&mut self) -> Result<(), Error>;

    fn write_all(&mut self, buf: &[u8]) -> Result<(), Error>;
    fn write_fmt(&mut self, fmt: fmt::Arguments) -> Result<(), Error>;
}

这里出现了很多的 Result<..., Error>。为此，std::io 有这个类型别名声明：

type Result<T> = std::result::Result<T, std::io::Error>;

因为这位于 std::io 中，可用的完全限定的别名是 std::io::Result<T> —— 也就是说，Result<T, E> 中 E 放入了 std::io::Error。Write trait 中的函数最终看起来像这样：

pub trait Write {
    fn write(&mut self, buf: &[u8]) -> Result<usize>;
    fn flush(&mut self) -> Result<()>;

    fn write_all(&mut self, buf: &[u8]) -> Result<()>;
    fn write_fmt(&mut self, fmt: fmt::Arguments) -> Result<()>;
}

类型别名在两个方面有帮助：易于编写并在整个 std::io 中提供了一致的接口。因为这是一个别名，它只是另一个 Result<T, E>，这意味着可以在其上使用 Result<T, E> 的任何方法，以及像 ? 这样的特殊语法。

从不返回的 never type

Rust 有一个叫做 ! 的特殊类型。在类型理论术语中，它被称为 empty type，因为它没有值。我们更倾向于称之为 never type。这个名字描述了它的作用：在函数从不返回的时候充当返回值。例如：

fn bar() -> ! {
    // --snip--
}

这读 “函数 bar 从不返回”，而从不返回的函数被称为 发散函数（diverging functions）。不能创建 ! 类型的值，所以 bar 也不可能返回值。

不过一个不能创建值的类型有什么用呢？如果你回想一下示例 2-5 中的代码，曾经有一些看起来像这样的代码，如示例 19-26 所重现的：

        let guess: u32 = match guess.trim().parse() {
            Ok(num) => num,
            Err(_) => continue,
        };

示例 19-26: match 语句和一个以 continue 结束的分支

当时我们忽略了代码中的一些细节。在第六章 “match 控制流运算符” 部分，我们学习了 match 的分支必须返回相同的类型。如下代码不能工作：

    let guess = match guess.trim().parse() {
        Ok(_) => 5,
        Err(_) => "hello",
    };

这里的 guess 必须既是整型也是字符串，而 Rust 要求 guess 只能是一个类型。那么 continue 返回了什么呢？为什么示例 19-26 中会允许一个分支返回 u32 而另一个分支却以 continue 结束呢？

正如你可能猜到的，continue 的值是 !。也就是说，当 Rust 要计算 guess 的类型时，它查看这两个分支。前者是 u32 值，而后者是 ! 值。因为 ! 并没有一个值，Rust 决定 guess 的类型是 u32。

描述 ! 的行为的正式方式是 never type 可以强转为任何其他类型。允许 match 的分支以 continue 结束是因为 continue 并不真正返回一个值；相反它把控制权交回上层循环，所以在 Err 的情况，事实上并未对 guess 赋值。

never type 的另一个用途是 panic!。还记得 Option<T> 上的 unwrap 函数吗？它产生一个值或 panic。这里是它的定义：

impl<T> Option<T> {
    pub fn unwrap(self) -> T {
        match self {
            Some(val) => val,
            None => panic!("called `Option::unwrap()` on a `None` value"),
        }
    }
}

这里与示例 19-34 中的 match 发生了相同的情况：Rust 知道 val 是 T 类型，panic! 是 ! 类型，所以整个 match 表达式的结果是 T 类型。这能工作是因为 panic! 并不产生一个值；它会终止程序。对于 None 的情况，unwrap 并不返回一个值，所以这些代码是有效的。

最后一个有着 ! 类型的表达式是 loop：

    print!("forever ");

    loop {
        print!("and ever ");
    }

这里，循环永远也不结束，所以此表达式的值是 !。但是如果引入 break 这就不为真了，因为循环在执行到 break 后就会终止。

动态大小类型和 Sized trait

因为 Rust 需要知道例如应该为特定类型的值分配多少空间这样的信息其类型系统的一个特定的角落可能令人迷惑：这就是 动态大小类型（dynamically sized types）的概念。这有时被称为 “DST” 或 “unsized types”，这些类型允许我们处理只有在运行时才知道大小的类型。

让我们深入研究一个贯穿本书都在使用的动态大小类型的细节：str。没错，不是 &str，而是 str 本身。str 是一个 DST；直到运行时我们都不知道字符串有多长。因为直到运行时都不能知道其大小，也就意味着不能创建 str 类型的变量，也不能获取 str 类型的参数。考虑一下这些代码，他们不能工作：

    let s1: str = "Hello there!";
    let s2: str = "How's it going?";

Rust 需要知道应该为特定类型的值分配多少内存，同时所有同一类型的值必须使用相同数量的内存。如果允许编写这样的代码，也就意味着这两个 str 需要占用完全相同大小的空间，不过它们有着不同的长度。这也就是为什么不可能创建一个存放动态大小类型的变量的原因。

那么该怎么办呢？你已经知道了这种问题的答案：s1 和 s2 的类型是 &str 而不是 str。如果你回想第四章 “字符串 slice” 部分，slice 数据结构储存了开始位置和 slice 的长度。

所以虽然 &T 是一个储存了 T 所在的内存位置的单个值，&str 则是两个值：str 的地址和其长度。这样，&str 就有了一个在编译时可以知道的大小：它是 usize 长度的两倍。也就是说，我们总是知道 &str 的大小，而无论其引用的字符串是多长。这里是 Rust 中动态大小类型的常规用法：他们有一些额外的元信息来储存动态信息的大小。这引出了动态大小类型的黄金规则：必须将动态大小类型的值置于某种指针之后。

可以将 str 与所有类型的指针结合：比如 Box<str> 或 Rc<str>。事实上，之前我们已经见过了，不过是另一个动态大小类型：trait。每一个 trait 都是一个可以通过 trait 名称来引用的动态大小类型。在第十七章 “为使用不同类型的值而设计的 trait 对象” 部分，我们提到了为了将 trait 用于 trait 对象，必须将他们放入指针之后，比如 &dyn Trait 或 Box<dyn Trait>（Rc<dyn Trait> 也可以）。

为了处理 DST，Rust 有一个特定的 trait 来决定一个类型的大小是否在编译时可知：这就是 Sized trait。这个 trait 自动为编译器在编译时就知道大小的类型实现。另外，Rust 隐式的为每一个泛型函数增加了 Sized bound。也就是说，对于如下泛型函数定义：

fn generic<T>(t: T) {
    // --snip--
}

实际上被当作如下处理：

fn generic<T: Sized>(t: T) {
    // --snip--
}

泛型函数默认只能用于在编译时已知大小的类型。然而可以使用如下特殊语法来放宽这个限制：

fn generic<T: ?Sized>(t: &T) {
    // --snip--
}

?Sized 上的 trait bound 意味着 “T 可能是也可能不是 Sized” 同时这个注解会覆盖泛型类型必须在编译时拥有固定大小的默认规则。这种意义的 ?Trait 语法只能用于 Sized ，而不能用于任何其他 trait。

另外注意我们将 t 参数的类型从 T 变为了 &T：因为其类型可能不是 Sized 的，所以需要将其置于某种指针之后。在这个例子中选择了引用。

接下来，让我们讨论一下函数和闭包！

以上内容是否对您有帮助：

← Rust 高级 trait

Rust 高级函数与闭包 →

写笔记

我要补充