四、Rust 数据类型
类型系统 对于任何一门语言都是重中之重,因为它体现了语言所支持的不同类型的值。
类型系统 也是 IT 初学者最难啃的三座大山之一,而类型系统之所以难以理解,主要是没有合适的现成的参考体系。
举个例子,比如我们说 类型系统 存在的目的,就是 程序在存储或操作某个数之前检查这个数的有效性。
就这一句话,简简单单,看起来每个文字都懂,如果把它们放在一起,就有那么一点天书的味道了。
类型系统在程序存储或操作之前检查所提供值的有效性。这可以保证程序运行时给变量提供的数据不会发生类型错误。
更近一步说,类型系统可以允许编辑器时时报告错误或者自动提示。
Rust 是一个静态的严格数据类型的语言。每个值都有唯一的数据类型,要么是整型,要么是浮点型等等。
Rust 语言在赋值时并不强制要求指定变量的数据类型,Rust 编译器可以根据分配给它的值自动推断变量的数据类型。
4.1 声明/定义一个变量
Rust 语言使用 let 关键字来声明和定义一个变量。
Rust 语言中声明变量的语法格式如下
let variable_name = value;
这里我们只会粗略带过变量的定义和声明,后面的章节我们会详细介绍。
下面的代码演示了如何定义变量
fn main() {
let company_string = "TutorialsPoint"; // string 字符串类型
let rating_float = 4.5; // float 类型
let is_growing_boolean = true; // boolean 类型
let icon_char = '♥'; //unicode character 类型
println!("company name is:{}",company_string);
println!("company rating on 5 is:{}",rating_float);
println!("company is growing :{}",is_growing_boolean);
println!("company icon is:{}",icon_char);
}
上面的代码中,我们并没有为每一个变量指定它们的数据类型。Rust 编译器会自动从 等号= 右边的值中推断出该变量的类型。例如 Rust 会自动将 双引号 阔起来的数据推断为 字符串,把 没有小数点的数字 自动推断为 整型。把 true 或 false 值推断为 布尔类型。
println!() 是一个宏,而不是一个函数,区分函数和宏的唯一办法,就是看函数名/宏名最后有没有感叹号 !. 如果有感叹号则是宏,没有则是函数。
println!() 宏接受两个参数:
- 第一个参数是格式化符,一般是 {},如果是复杂类型,则是 {:?}。
- 第二个参数是变量名或者常量名。
编译运行以上 Rust 代码,输出结果如下
company name is: TutorialsPoint
company rating on 5 is:4.5
company is growing: true
company icon is: ♥
4.2 标量数据类型
标量数据类型 又称为 基本数据类型。标量数据类型只能存储单个值,例如 10 或 3.14 或 c。
Rust 语言中有四种标量数据类型:
- 整型
- 浮点型
- 布尔类型
- 字符类型
接下来我们会对每种标量数据类型做一个简单的介绍。
4.3 整型
整数就是没有小数点的数字,比如说 0,1,-1,-2,9999999 等,但是 0.0 、1.0 和 -1.11 等都不是整数。
整型 能够囊括所有的数字,虽然不可能无穷大,但已经大到足够使用了。
最大的整型为 340282366920938463463374607431768211455,由 std::u128:MAX 定义。
最小的整型为 -170141183460469231731687303715884105728,由 std::i128:MIN 定义。
它们看起来是不是一个天文数字?
整型可以进一步分为 有符号整型 和 无符号整型 两种:
- 有符号整型,英文 signed,既可以存储正数,也可以存储负数。
- 无符号整型,因为 unsigned,只能存储正数。
按照存储空间来说,整型可以进一步划分为 1字节、2字节、4字节、8字节、16字节。
1 字节 = 8 位,每一位能只能存储二进制 0 或 1,因此每一个字节能够存储的最大数字是 256,而最小数字则是 -127。
有点复杂了,详细的看 C 语言的数据可能会更简单。
下表列出了整型所有的细分类型:
大小 | 有符号 | 无符号 |
---|---|---|
8bit | i8 | u8 |
16bit | i16 | u16 |
32bit | i32 | u32 |
64bit | i64 | u64 |
128bit | i128 | u128 |
Arch | isize | usize |
i32 是默认的整型,如果我们直接说出一个数字而不说它的数据类型,那么它默认就是 i32 。
整型的长度还可以是 arch。arch 是由 CPU 构架决定的大小的整型类型。大小为 arch 的整数在 x86 机器上为 32 位,在 x64 机器上为 64 位。
Arch 整型通常用于表示容器的大小或者数组的大小,或者数据在内存上存储的位置。
4.3.1 范例:如何定义各种整型的变量
定义整型变量的时候要注意每种整型的最大值和最小值,如果超出可能会赋值失败,也有可能结果不是我们想要的。
fn main() {
let result = 10; // i32 默认
let age:u32 = 20;
let sum:i32 = 5-15;
let mark:isize = 10;
let count:usize = 30;
println!("result value is {}",result);
println!("sum is {} and age is {}",sum,age);
println!("mark is {} and count is {}",mark,count);
}
编译运行以上 Rust 代码,输出结果如下
result value is 10
sum is -10 and age is 20
mark is 10 and count is 30
整型只能保存整数,不能保存有小数点的数字,哪怕小数点后面全是 0。如果把一个有小数的数字赋值给整型,会报编译错误
fn main() {
let age:u32 = 20.0;
}
编译运行以上 Rust 代码,报错信息如下
error[E0308]: mismatched types
--> src/main.rs:2:18
|
2 | let age:u32 = 20.0;
| ^^^^ expected u32, found floating-point number
|
= note: expected type `u32`
found type `{float}`
从报错信息中可以看出,Rust 语言将 20.0 这种有小数点的数字称为 浮点数。使用 float 来表示。
我们不能将一个 float 类型的数字赋值给 u32 类型。
4.3.2 整型范围
每种整型并不都是能存储任意数字的,每种整型只能装下固定大小的数字,但总体上,大的整型能装下小的整型。
每种 有符号整型 能够存储的最小值为 -(2^(n-1),能够存储的最大值为 2^(n-1) -1。
每种 无符号整型 能够存储的最小值为 0,能够存储的最大值为 2^n - 1。
其中 n 是指数据类型的大小。
例如一个 8 位有符号整型 i8,它能够存储的最小值为 -(2^(8-1)) = -128。最大值为 (2^(8-1)-1) = 127。
例如一个 8 位无符号整型 u8,它能够存储的最小值为 0,能够存储的最大值为 2^8-1 = 255。
4.3.3 整型溢出
每种整型并不都是能存储任意数字的,每种整型只能装下固定大小的数字。如果给予的数字超出了整型的范围则会发生溢出。
比如一个 i8 能够存储的最小值是 0,如果我们让它来存储 -1 则会发生溢出。
当发生数据溢出时,Rust 抛出一个错误指示数据溢出。
例如下面的代码,编译会报错。
fn main() {
let age:u8 = 255;
// u8 只能存储 0 to 255
let weight:u8 = 256; // 溢出值为 0
let height:u8 = 257; // 溢出值为 1
let score:u8 = 258; // 溢出值为 2
println!("age is {} ",age);
println!("weight is {}",weight);
println!("height is {}",height);
println!("score is {}",score);
}
编译运行以上代码,报错信息如下
error: literal out of range for u8
--> src/main.rs:5:20
|
5 | let weight:u8 = 256; // 溢出值为 0
| ^^^
|
= note: #[deny(overflowing_literals)] on by default
error: literal out of range for u8
--> src/main.rs:6:20
|
6 | let height:u8 = 257; // 溢出值为 1
| ^^^
error: literal out of range for u8
--> src/main.rs:7:19
|
7 | let score:u8 = 258; // 溢出值为 2
| ^^^
从错误信息来看,三个溢出的地方都报错了。提示赋值的数字超出了 u8 的范围。
4.4 浮点型:f32 和 f64
前面我们提到过,整型只能保存没有小数点的数字。而对于有小数点的数字,Rust 提供了浮点型。
Rust 区分整型和浮点型的唯一指标就是 有没有小数点。
Rust 中的整型和浮点型是严格区分的,不能相互转换。
也就是说,我们不能将 0.0 赋值给任意一个整型,也不能将 0 赋值给任意一个浮点型。
按照存储大小,我们把浮点型划分为 f32 和 f64。其中 f64 是默认的浮点类型。
- f32 又称为 单精度浮点型。
- f64 又称为 双精度浮点型,它是 Rust 默认的浮点类型.
4.3.1 范例:如何定义各种浮点型的变量
定义浮点型变量的时候要注意每种浮点型的最大值和最小值,如果超出可能会赋值失败,也有可能结果不是我们想要的。
fn main() {
let result = 10.00; // 默认是 f64
let interest:f32 = 8.35;
let cost:f64 = 15000.600; // 双精度浮点型
println!("result value is {}",result);
println!("interest is {}",interest);
println!("cost is {}",cost);
}
编译运行以上 Rust 代码,报错信息如下
interest is 8.35
cost is 15000.6
4.4 不允许类型自动转换
Rust 中的数字类型与 C/C++ 中不同的是 Rust 语言不允许类型自动转换。
例如,把一个 整型 赋值给一个 浮点型 是会报错的。
4.4.1 范例
fn main() {
let interest:f32 = 8; // integer assigned to float variable
println!("interest is {}",interest);
}
编译上面的代码,会抛出 mismatched types error 错误
error[E0308]: mismatched types
--> main.rs:2:22
|
2 | let interest:f32=8;
| ^ expected f32, found integral variable
|
= note: expected type `f32`
found type `{integer}`
error: aborting due to previous error(s)
4.5 数字可读性分隔符 _
为了方便阅读超大的数字,Rust 语言允许使用一个 虚拟的分隔符 也就是 下划线( _ ) 来对数字进行可读性分隔符。
比如为了提高 50000 的可读性,我们可以写成 50_000 。
Rust 语言会在编译时移除数字可读性分隔符 _
4.5.1 范例
我们写几个例子来演示下 数字分隔符,从结果中可以看出,分隔符对数字没有造成任何影响。
fn main() {
let float_with_separator = 11_000.555_001;
println!("float value {}",float_with_separator);
let int_with_separator = 50_000;
println!("int value {}",int_with_separator);
}
编译运行上面的代码,输出结果如下
float value 11000.555001
int value 50000
4.6 布尔类型 bool
布尔类型 只有两个可能的取值 true 或 false 。
Rust 使用 bool 关键字来声明一个 布尔类型 的变量。
4.6.1 范例
fn main() {
let isfun:bool = true;
println!("Is Rust Programming Fun ? {}",isfun);
}
编译运行上面的代码,输出结果如下
Is Rust Programming Fun ? true
4.7 字符类型 char
字符,简单的来说,就是字符串的基本组成部分,也就是单个字符或字。
Rust 使用 char 作为 字符数据类型。这点可谓是继承了 C / C++。
但与 C / C++ 不同的是:Rust 使用 UTF-8 作为底层的编码 ,而不是常见的使用 ASCII 作为底层编码。
也就是说,Rust 中的 字符数据类型 包含了数字、字母、Unicode 和 其它特殊字符。
Rust 选用 UTF-8 作为底层编码可谓是顺应时代的潮流。因为编程和互联网早就不极限于拉丁语系的国家,像中国、印度、日本等国家都有大量的程序员和网民。
Unicode 编码的标量值的范围从 U+0000 到 U+D7FF, U+E000 到 U+10FFFF(含)
4.7.1 范例
我们输出几个不同语系的字符来演示下 Rust 中的 char 字符类型。
fn main() {
let special_character = '@'; //default
let alphabet:char = 'A';
let emoji:char = 'c'; // 笑脸的那个图
println!("special character is {}",special_character);
println!("alphabet is {}",alphabet);
println!("emoji is {}",emoji);
}
编译运行上面的代码,输出结果如下
special character is @
alphabet is A
emoji is c