数据类型

数据类型

传统上，Unix Shell 命令之间使用字符串文本进行通信。一个命令通过标准输出（通常缩写为 “stdout”）输出文本，另一个命令通过标准输入（或 “stdin”）读入文本，以此来让两个命令进行通信。

我们可以认为这种通信是基于字符串的。

Nu 在其命令中采用了这种方法，并将其扩展到包括其他类型的数据。目前，Nu 支持两种数据类型：简单的和结构化的数据。

像许多编程语言一样，Nu 使用一组简单和结构化的数据类型对数据进行建模。简单的数据类型包括整数、浮点数、字符串、布尔、日期和路径。它还包括一个用于表示文件大小的特殊类型。

整数

整数（或整形）数字：例子包括 1、5 和 100。

小数

小数是指带有一些小数成分的数字，例如，1.5，2.0，和 15.333。

字符串

代表文本的字符串。在 Nushell 中，我们有几种方法可以表示字符串：

双引号

"my message"

双引号是最常见的引号形式，只要是需要文字的地方，你都可能看到。

单引号

'my message'

单引号也生成一个字符串值，就像双引号一样。这里的区别是，它们允许你在文本中使用双引号，例如：'他说："你能帮我拿下杯子吗？"'。

字符串插值

Nushell 支持字符串插值，允许你在以$为前缀的字符串中运行子表达式。比如：

> echo $"6 x 7 = (6 * 7)"
6 x 7 = 42

> ls | each { |it| echo $"($it.name) is ($it.size)" }
───┬─────────────────────
 0 │ genawait is 4.1 KB
 1 │ learncpp is 4.1 KB
 2 │ nuscripts is 4.1 KB
───┴─────────────────────

裸字符串

> echo hello

Nushell 的一个独特特征是，你也可以创建一个没有任何引号的单字字符串。

上面的内容和如下写法是一样的：

> echo "hello"

另见字符串的使用。

文本行

文本行(Lines)是具有隐含的操作系统特定行结尾的字符串。使用时需要加上操作系统特定的行尾标识。

列路径

列路径(Column Paths)是指通过表格到特定子表、列、行或单元格的路径。

例如) open data.toml | get foo.0.bar中的值foo.0.bar

Glob 模式（通配符）

在 Nushell 中，文件操作也允许你传入一个 glob 模式，有时被称为 “通配符”。这允许你给出一个可以匹配多个文件路径的模式。

最常见的模式是 *，它将匹配所有的路径。通常，你会看到这个模式被用作另一个模式的一部分，例如*.bak和temp\*。

在 Nushell 中，我们也支持通过双 * 来遍历其他目录内嵌套得更深的路径。例如，ls **/*将列出所有嵌套在当前目录下的非隐藏路径。

除了*，还有?模式，它将匹配一个单一的字符。例如，你可以通过使用模式p???来匹配 “port”。

布尔类型

布尔类型是指真或假的状态。它通常用于一个比较的结果，而非直接使用该值。

布尔类型的两个值是true和false。

日期

日期和时间被保存在日期(Date)值类型中。系统使用的日期值是有时区的，默认使用 UTC 时区。

日期有三种形式，基于 RFC 3339 标准：

日期:
- 2022-02-02
日期和时间 (GMT 格式):
- 2022-02-02T14:30:00
包含时区的日期和时间:
- 2022-02-02T14:30:00+05:00

时间间隔

时间间隔(Duration)表示时间的长短。一秒钟、五周和一年都是时间间隔。

Eg) 1wk是一个星期的时间间隔。

下表显示了目前支持的所有时间间隔：

Duration	时长
`1ns`	1 纳秒
`1us`	1 微秒
`1ms`	1 毫秒
`1sec`	1 秒
`1min`	1 分钟
`1hr`	1 小时
`1day`	1 天
`1wk`	1 周

区间

区间(Ranges)是一种表达从开始到结束的数值序列的方式。它们的形式是'start' + '..' + 'end'。例如，范围 1..3表示数字 1、2、和 3。

闭区间和开区间

默认情况下，区间是包含性的，也就是说，结束值被算作区间的一部分。区间1..3包括数字3作为区间内的最后一个值。

有时，你可能想要一个达到某个数字的区间，但在输出中不包含该数字。对于这种情况，你可以使用..<代替..。例如，1..<5包含数字 1、2、3 和 4。

开放式区间

区间也可以是开放式的。你可以去掉区间的起点或终点，使其成为开放式的。

比方说，你想从 3 开始计数，但你心里没有一个具体的终点。你可以用 3.. 这个区间来表示。当你在右边使用一个无限制的区间时，请记住，这将持续计数尽可能长的时间，这可能是一个非常长的时间，你可能会在 first 这样的命令中使用开放式区间，这样你就可以从区间中取出你想要的指定数量的元素。

你也可以使区间的开始部分开放。在这种情况下，Nushell 将从0开始向上计数。区间..2包含数字 0、1 和 2。

文件路径

文件路径(File Paths)是在给定的操作系统中代表文件路径的一种与平台无关的方式。比如/usr/bin和C:\Users\file.txt。

文件大小

文件大小(File Sizes)保存在一种特殊的称为字节的整数类型中。例如包括 100b, 15kb, 和 100mb。

文件大小单位的完整列表是：

b: bytes
kb: kilobytes (aka 1000 bytes)
mb: megabytes
gb: gigabytes
tb: terabytes
pb: petabytes
kib: kibibytes (aka 1024 bytes)
mib: mebibytes
gib: gibibytes
tib: tebibytes
pib: pebibytes

二进制数据

二进制数据，像图像文件的数据一样，是一组原始字节。

你可以使用 0x[...] 或 0b[...] 或 0o[...] 形式将二进制写成一个字面值：

> 0x[1F FF]
> 0b[1 1010]
> 0o[777]

不完整的字节将用零来填充。

结构化数据

结构化数据是在简单数据的基础上建立的。例如，结构化数据给我们提供了一种在同一数值中表示多个整数的方法，而不是一个单一的整数。目前支持的结构化数据类型有：记录、列表和表格。

记录

记录(Records)持有键值对，很像 JSON 中的对象。由于这些记录有时会有很多字段，所以记录是从上到下打印的，而不是从左到右：

> echo {name: sam, rank: 10}
╭──────┬─────╮
│ name │ sam │
│ rank │ 10  │
╰──────┴─────╯

你可以将其转换到一个表然后遍历该记录：

> echo {name: sam, rank: 10} | transpose key value
╭───┬──────┬───────╮
│ # │ key  │ value │
├───┼──────┼───────┤
│ 0 │ name │  sam  │
│ 1 │ rank │   10  │
╰───┴──────┴───────╯

列表

列表(Lists)可以容纳一个以上的值。这些可以是简单的值，也可以容纳行，而一组记录的组合通常被称为 “表”。

例如，一个字符串的列表：

> echo [sam fred george]
───┬────────
 0 │ sam
 1 │ fred
 2 │ george
───┴────────

表

表(Table)是 Nushell 的一个核心数据结构。当你运行 Nushell 命令时，你会发现许多命令都会将表作为输出返回。表由行和列组成。

我们可以创建自己的表，就像我们创建一个列表一样。因为表也包含列，而不仅仅是值，所以我们需要传入列的名称：

> echo [[column1, column2]; [Value1, Value2]]
───┬─────────┬─────────
 # │ column1 │ column2
───┼─────────┼─────────
 0 │ Value1  │ Value2
───┴─────────┴─────────

我们还可以创建一个有多行数据的表格：

> echo [[column1, column2]; [Value1, Value2] [Value3, Value4]]
───┬─────────┬─────────
 # │ column1 │ column2
───┼─────────┼─────────
 0 │ Value1  │ Value2
 1 │ Value3  │ Value4
───┴─────────┴─────────

你也可以通过一个记录列表来创建表格:

> echo [{name: sam, rank: 10}, {name: bob, rank: 7}]
╭───┬──────┬──────╮
│ # │ name │ rank │
├───┼──────┼──────┤
│ 0 │ sam  │   10 │
│ 1 │ bob  │    7 │
╰───┴──────┴──────╯

块

块(Blocks)表示 Nu 中的一个代码块。例如，在命令 each { |it| echo $it } 中，块是包含在大括号中的部分，{ |it| echo $it }。如果有必要，可以在一对管道符号（例如，|it|）之间指定块参数。

块是表示可以在每行数据上执行的代码的一种有效方法。在each块中使用$it作为参数名是惯例，但并不是必须的：each { |x| echo $x }与each { |it| echo $it }的结果相同。

组

以此为例：

foo {
  line1
  line2; line3 | line4
}

在该代码块内，你有两个独立的组(Groups)直到运行完毕。组是一个以分号分隔的管道集合，其中最后一个管道会输出到屏幕。

line1 是一个独立的组，所以该命令将运行到结束并显示在屏幕上。
line2 是第二组中的一个管道。它会运行，但其内容不会在屏幕上显示。
line3 | line4 是第二组中的第二个管道。它会运行并且它的内容会在屏幕上显示。