数据类型
传统上,Unix Shell 命令之间使用字符串文本进行通信。一个命令通过标准输出(通常缩写为 “stdout”)输出文本,另一个命令通过标准输入(或 “stdin”)读入文本,以此来让两个命令进行通信。
我们可以认为这种通信是基于字符串的。
Nu 在其命令中采用了这种方法,并将其扩展到包括其他类型的数据。目前,Nu 支持两种数据类型:简单的和结构化的数据。
像许多编程语言一样,Nu 使用一组简单和结构化的数据类型对数据进行建模。简单的数据类型包括整数、浮点数、字符串、布尔、日期和路径。它还包括一个用于表示文件大小的特殊类型。
整数
整数(或整形)数字:例子包括 1、5 和 100。
小数
小数是指带有一些小数成分的数字,例如,1.5,2.0,和 15.333。
字符串
代表文本的字符串。在 Nushell 中,我们有几种方法可以表示字符串:
双引号
"my message"
双引号是最常见的引号形式,只要是需要文字的地方,你都可能看到。
单引号
'my message'
单引号也生成一个字符串值,就像双引号一样。这里的区别是,它们允许你在文本中使用双引号,例如:'他说:"你能帮我拿下杯子吗?"'
。
字符串插值
Nushell 支持字符串插值,允许你在以$
为前缀的字符串中运行子表达式。比如:
> echo $"6 x 7 = (6 * 7)"
6 x 7 = 42
> ls | each { |it| echo $"($it.name) is ($it.size)" }
───┬─────────────────────
0 │ genawait is 4.1 KB
1 │ learncpp is 4.1 KB
2 │ nuscripts is 4.1 KB
───┴─────────────────────
裸字符串
> echo hello
Nushell 的一个独特特征是,你也可以创建一个没有任何引号的单字字符串。
上面的内容和如下写法是一样的:
> echo "hello"
另见 字符串的使用。
文本行
文本行(Lines)是具有隐含的操作系统特定行结尾的字符串。使用时需要加上操作系统特定的行尾标识。
列路径
列路径(Column Paths)是指通过表格到特定子表、列、行或单元格的路径。
例如) open data.toml | get foo.0.bar
中的值foo.0.bar
Glob 模式(通配符)
在 Nushell 中,文件操作也允许你传入一个 glob 模式,有时被称为 “通配符”。这允许你给出一个可以匹配多个文件路径的模式。
最常见的模式是 *
,它将匹配所有的路径。通常,你会看到这个模式被用作另一个模式的一部分,例如*.bak
和temp\*
。
在 Nushell 中,我们也支持通过双 *
来遍历其他目录内嵌套得更深的路径。例如,ls **/*
将列出所有嵌套在当前目录下的非隐藏路径。
除了*
,还有?
模式,它将匹配一个单一的字符。例如,你可以通过使用模式p???
来匹配 “port”。
布尔类型
布尔类型是指真或假的状态。它通常用于一个比较的结果,而非直接使用该值。
布尔类型的两个值是true
和false
。
日期
日期和时间被保存在日期(Date)值类型中。系统使用的日期值是有时区的,默认使用 UTC 时区。
日期有三种形式,基于 RFC 3339 标准:
- 日期:
2022-02-02
- 日期和时间 (GMT 格式):
2022-02-02T14:30:00
- 包含时区的日期和时间:
2022-02-02T14:30:00+05:00
时间间隔
时间间隔(Duration)表示时间的长短。一秒钟、五周和一年都是时间间隔。
Eg) 1wk
是一个星期的时间间隔。
下表显示了目前支持的所有时间间隔:
Duration | 时长 |
---|---|
1ns | 1 纳秒 |
1us | 1 微秒 |
1ms | 1 毫秒 |
1sec | 1 秒 |
1min | 1 分钟 |
1hr | 1 小时 |
1day | 1 天 |
1wk | 1 周 |
区间
区间(Ranges)是一种表达从开始到结束的数值序列的方式。它们的形式是'start' + '..' + 'end'
。例如,范围 1..3
表示数字 1、2、和 3。
闭区间和开区间
默认情况下,区间是包含性的,也就是说,结束值被算作区间的一部分。区间1..3
包括数字3
作为区间内的最后一个值。
有时,你可能想要一个达到某个数字的区间,但在输出中不包含该数字。对于这种情况,你可以使用..<
代替..
。例如,1..<5
包含数字 1、2、3 和 4。
开放式区间
区间也可以是开放式的。你可以去掉区间的起点或终点,使其成为开放式的。
比方说,你想从 3 开始计数,但你心里没有一个具体的终点。你可以用 3..
这个区间来表示。当你在右边使用一个无限制的区间时,请记住,这将持续计数尽可能长的时间,这可能是一个非常长的时间,你可能会在 first
这样的命令中使用开放式区间,这样你就可以从区间中取出你想要的指定数量的元素。
你也可以使区间的开始部分开放。在这种情况下,Nushell 将从0
开始向上计数。区间..2
包含数字 0、1 和 2。
文件路径
文件路径(File Paths)是在给定的操作系统中代表文件路径的一种与平台无关的方式。比如/usr/bin
和C:\Users\file.txt
。
文件大小
文件大小(File Sizes)保存在一种特殊的称为字节的整数类型中。例如包括 100b
, 15kb
, 和 100mb
。
文件大小单位的完整列表是:
b
: byteskb
: kilobytes (aka 1000 bytes)mb
: megabytesgb
: gigabytestb
: terabytespb
: petabyteskib
: kibibytes (aka 1024 bytes)mib
: mebibytesgib
: gibibytestib
: tebibytespib
: pebibytes
二进制数据
二进制数据,像图像文件的数据一样,是一组原始字节。
你可以使用 0x[...]
或 0b[...]
或 0o[...]
形式将二进制写成一个字面值:
> 0x[1F FF]
> 0b[1 1010]
> 0o[777]
不完整的字节将用零来填充。
结构化数据
结构化数据是在简单数据的基础上建立的。例如,结构化数据给我们提供了一种在同一数值中表示多个整数的方法,而不是一个单一的整数。目前支持的结构化数据类型有:记录、列表和表格。
记录
记录(Records)持有键值对,很像 JSON 中的对象。由于这些记录有时会有很多字段,所以记录是从上到下打印的,而不是从左到右:
> echo {name: sam, rank: 10}
╭──────┬─────╮
│ name │ sam │
│ rank │ 10 │
╰──────┴─────╯
你可以将其转换到一个表然后遍历该记录:
> echo {name: sam, rank: 10} | transpose key value
╭───┬──────┬───────╮
│ # │ key │ value │
├───┼──────┼───────┤
│ 0 │ name │ sam │
│ 1 │ rank │ 10 │
╰───┴──────┴───────╯
列表
列表(Lists)可以容纳一个以上的值。这些可以是简单的值,也可以容纳行,而一组记录的组合通常被称为 “表”。
例如,一个字符串的列表:
> echo [sam fred george]
───┬────────
0 │ sam
1 │ fred
2 │ george
───┴────────
表
表(Table)是 Nushell 的一个核心数据结构。当你运行 Nushell 命令时,你会发现许多命令都会将表作为输出返回。表由行和列组成。
我们可以创建自己的表,就像我们创建一个列表一样。因为表也包含列,而不仅仅是值,所以我们需要传入列的名称:
> echo [[column1, column2]; [Value1, Value2]]
───┬─────────┬─────────
# │ column1 │ column2
───┼─────────┼─────────
0 │ Value1 │ Value2
───┴─────────┴─────────
我们还可以创建一个有多行数据的表格:
> echo [[column1, column2]; [Value1, Value2] [Value3, Value4]]
───┬─────────┬─────────
# │ column1 │ column2
───┼─────────┼─────────
0 │ Value1 │ Value2
1 │ Value3 │ Value4
───┴─────────┴─────────
你也可以通过一个记录列表来创建表格:
> echo [{name: sam, rank: 10}, {name: bob, rank: 7}]
╭───┬──────┬──────╮
│ # │ name │ rank │
├───┼──────┼──────┤
│ 0 │ sam │ 10 │
│ 1 │ bob │ 7 │
╰───┴──────┴──────╯
块
块(Blocks)表示 Nu 中的一个代码块。例如,在命令 each { |it| echo $it }
中,块是包含在大括号中的部分,{ |it| echo $it }
。如果有必要,可以在一对管道符号(例如,|it|
)之间指定块参数。
块是表示可以在每行数据上执行的代码的一种有效方法。在each块中使用$it
作为参数名是惯例,但并不是必须的:each { |x| echo $x }
与each { |it| echo $it }
的结果相同。
组
以此为例:
foo {
line1
line2; line3 | line4
}
在该代码块内,你有两个独立的组(Groups)直到运行完毕。组是一个以分号分隔的管道集合,其中最后一个管道会输出到屏幕。
line1
是一个独立的组,所以该命令将运行到结束并显示在屏幕上。line2
是第二组中的一个管道。它会运行,但其内容不会在屏幕上显示。line3
|line4
是第二组中的第二个管道。它会运行并且它的内容会在屏幕上显示。