流程控制

Julia 提供了大量的流程控制构件:

前五个流程控制机制是高级编程语言的标准。Task 不是那么的标准:它提供了非局部的流程控制,这使得在暂时挂起的计算任务之间进行切换成为可能。这是一个功能强大的构件:Julia 中的异常处理和协同多任务都是通过 Task 实现的。虽然日常编程并不需要直接使用 Task,但某些问题用 Task 处理会更加简单。

复合表达式

有时一个表达式能够有序地计算若干子表达式,并返回最后一个子表达式的值作为它的值是很方便的。Julia 有两个组件来完成这个: begin 代码块 和 ; 链。这两个复合表达式组件的值都是最后一个子表达式的值。下面是一个 begin 代码块的例子:

  1. julia> z = begin
  2. x = 1
  3. y = 2
  4. x + y
  5. end
  6. 3

因为这些是非常简短的表达式,它们可以简单地被放到一行里,这也是 ; 链的由来:

  1. julia> z = (x = 1; y = 2; x + y)
  2. 3

这个语法在定义简洁的单行函数的时候特别有用,参见函数。尽管很典型,但是并不要求 begin 代码块是多行的,或者 ; 链是单行的:

  1. julia> begin x = 1; y = 2; x + y end
  2. 3
  3. julia> (x = 1;
  4. y = 2;
  5. x + y)
  6. 3

条件表达式

条件表达式(Conditional evaluation)可以根据布尔表达式的值,让部分代码被执行或者不被执行。下面是对 if-elseif-else 条件语法的分析:

  1. if x < y
  2. println("x is less than y")
  3. elseif x > y
  4. println("x is greater than y")
  5. else
  6. println("x is equal to y")
  7. end

如果表达式 x < ytrue,那么对应的代码块会被执行;否则判断条件表达式 x > y,如果它是 true,则执行对应的代码块;如果没有表达式是 true,则执行 else 代码块。下面是一个例子:

  1. julia> function test(x, y)
  2. if x < y
  3. println("x is less than y")
  4. elseif x > y
  5. println("x is greater than y")
  6. else
  7. println("x is equal to y")
  8. end
  9. end
  10. test (generic function with 1 method)
  11. julia> test(1, 2)
  12. x is less than y
  13. julia> test(2, 1)
  14. x is greater than y
  15. julia> test(1, 1)
  16. x is equal to y

elseifelse 代码块是可选的,并且可以使用任意多个 elseif 代码块。 if-elseif-else 组件中的第一个条件表达式为 true 时,其他条件表达式才会被执行,当对应的代码块被执行后,其余的表达式或者代码块将不会被执行。

if 代码块是”有渗漏的”,也就是说它们不会引入局部作用域。这意味着在 if 语句中新定义的变量依然可以在 if 代码块之后使用,尽管这些变量没有在 if 语句之前定义过。所以,我们可以将上面的 test 函数定义为

  1. julia> function test(x,y)
  2. if x < y
  3. relation = "less than"
  4. elseif x == y
  5. relation = "equal to"
  6. else
  7. relation = "greater than"
  8. end
  9. println("x is ", relation, " y.")
  10. end
  11. test (generic function with 1 method)
  12. julia> test(2, 1)
  13. x is greater than y.

变量 relation 是在 if 代码块内部声明的,但可以在外部使用。然而,在利用这种行为的时候,要保证变量在所有的分支下都进行了定义。对上述函数做如下修改会导致运行时错误

  1. julia> function test(x,y)
  2. if x < y
  3. relation = "less than"
  4. elseif x == y
  5. relation = "equal to"
  6. end
  7. println("x is ", relation, " y.")
  8. end
  9. test (generic function with 1 method)
  10. julia> test(1,2)
  11. x is less than y.
  12. julia> test(2,1)
  13. ERROR: UndefVarError: relation not defined
  14. Stacktrace:
  15. [1] test(::Int64, ::Int64) at ./none:7

if 代码块也会返回一个值,这可能对于一些从其他语言转过来的用户来说不是很直观。 这个返回值就是被执行的分支中最后一个被执行的语句的返回值。 所以

  1. julia> x = 3
  2. 3
  3. julia> if x > 0
  4. "positive!"
  5. else
  6. "negative..."
  7. end
  8. "positive!"

需要注意的是,在 Julia 中,经常会用短路求值来表示非常短的条件表达式(单行),这会在下一节中介绍。

与 C, MATLAB, Perl, Python,以及 Ruby 不同,但跟 Java,还有一些别的严谨的类型语言类似:一个条件表达式的值如果不是 true 或者 false 的话,会返回错误:

  1. julia> if 1
  2. println("true")
  3. end
  4. ERROR: TypeError: non-boolean (Int64) used in boolean context

这个错误是说,条件判断结果的类型:Int64 是错的,而不是期望的 Bool

所谓的 “三元运算符”, ?:,很类似 if-elseif-else 语法,它用于选择性获取单个表达式的值,而不是选择性执行大段的代码块。它因在很多语言中是唯一一个有三个操作数的运算符而得名:

  1. a ? b : c

? 之前的表达式 a, 是一个条件表达式,如果条件 atrue,三元运算符计算在 : 之前的表达式 b;如果条件 afalse,则执行 : 后面的表达式 c。注意,?: 旁边的空格是强制的,像 a?b:c 这种表达式不是一个有效的三元表达式(但在?: 之后的换行是允许的)。

理解这种行为的最简单方式是看一个实际的例子。在前一个例子中,虽然在三个分支中都有调用 println,但实质上是选择打印哪一个字符串。在这种情况下,我们可以用三元运算符更紧凑地改写。为了简明,我们先尝试只有两个分支的版本:

  1. julia> x = 1; y = 2;
  2. julia> println(x < y ? "less than" : "not less than")
  3. less than
  4. julia> x = 1; y = 0;
  5. julia> println(x < y ? "less than" : "not less than")
  6. not less than

如果表达式 x < y 为真,整个三元运算符会执行字符串 "less than",否则执行字符串 "not less than"。原本的三个分支的例子需要链式嵌套使用三元运算符:

  1. julia> test(x, y) = println(x < y ? "x is less than y" :
  2. x > y ? "x is greater than y" : "x is equal to y")
  3. test (generic function with 1 method)
  4. julia> test(1, 2)
  5. x is less than y
  6. julia> test(2, 1)
  7. x is greater than y
  8. julia> test(1, 1)
  9. x is equal to y

为了方便链式传值,运算符从右到左连接到一起。

重要地是,与 if-elseif-else 类似,: 之前和之后的表达式只有在条件表达式为 true 或者 false 时才会被相应地执行:

  1. julia> v(x) = (println(x); x)
  2. v (generic function with 1 method)
  3. julia> 1 < 2 ? v("yes") : v("no")
  4. yes
  5. "yes"
  6. julia> 1 > 2 ? v("yes") : v("no")
  7. no
  8. "no"

短路求值

Julia 中的 &&|| 运算符分别对应于逻辑“与”和“或”操作,并通常都这样使用。 但是,它们具有 逻辑短路 的特殊性质:不一定评估其第二个参数,下面会详细介绍。 (也有按位 &| 运算符可用作逻辑“与”和“或”的短路行为,但要注意 &| 的评估时的优先级高于 &&|| 。)

短路求值与条件求值非常相似。 这种行为在大多数具有 &&|| 布尔运算符的命令式编程语言中都可以找到:在一系列由这些运算符连接的布尔表达式中,为了得到整个链的最终布尔值,仅仅只有最小数量的表达式被计算。 一些语言(如 Python)将它们称为and&&)和or||)。 更准确地说,这意味着:

  • 在表达式 a && b 中,子表达式 b 仅当 atrue 的时候才会被执行。
  • 在表达式 a || b 中,子表达式 b 仅在 afalse 的时候才会被执行。

这里的原因是:如果 afalse,那么无论 b 的值是多少,a && b 一定是 false。同理,如果 atrue,那么无论 b 的值是多少,a || b 的值一定是 true。&&|| 都依赖于右边,但是 &&|| 有更高的优先级。我们可以简单地测试一下这个行为:

  1. julia> t(x) = (println(x); true)
  2. t (generic function with 1 method)
  3. julia> f(x) = (println(x); false)
  4. f (generic function with 1 method)
  5. julia> t(1) && t(2)
  6. 1
  7. 2
  8. true
  9. julia> t(1) && f(2)
  10. 1
  11. 2
  12. false
  13. julia> f(1) && t(2)
  14. 1
  15. false
  16. julia> f(1) && f(2)
  17. 1
  18. false
  19. julia> t(1) || t(2)
  20. 1
  21. true
  22. julia> t(1) || f(2)
  23. 1
  24. true
  25. julia> f(1) || t(2)
  26. 1
  27. 2
  28. true
  29. julia> f(1) || f(2)
  30. 1
  31. 2
  32. false

你可以用同样的方式测试不同 &&|| 运算符的组合条件下的关联和优先级。

这种行为在 Julia 中经常被用来作为简短 if 语句的替代。 可以用 <cond> && <statement> (可读为: <cond> and then <statement>)来替换 if <cond> <statement> end。 类似的, 可以用 <cond> || <statement> (可读为: <cond> or else <statement>)来替换 if ! <cond> <statement> end.

例如,可以像这样定义递归阶乘:

  1. julia> function fact(n::Int)
  2. n >= 0 || error("n must be non-negative")
  3. n == 0 && return 1
  4. n * fact(n-1)
  5. end
  6. fact (generic function with 1 method)
  7. julia> fact(5)
  8. 120
  9. julia> fact(0)
  10. 1
  11. julia> fact(-1)
  12. ERROR: n must be non-negative
  13. Stacktrace:
  14. [1] error at ./error.jl:33 [inlined]
  15. [2] fact(::Int64) at ./none:2
  16. [3] top-level scope

短路求值的布尔运算可以用位布尔运算符来完成,见数学运算和初等函数&|。这些是普通的函数,同时也刚好支持中缀运算符语法,但总是会计算它们的所有参数:

  1. julia> f(1) & t(2)
  2. 1
  3. 2
  4. false
  5. julia> t(1) | t(2)
  6. 1
  7. 2
  8. true

if, elseif 或者三元运算符中的条件表达式相同,&& 或者 || 的操作数必须是布尔值(true 或者 false)。在链式嵌套的条件表达式中, 除最后一项外,使用非布尔值会导致错误:

  1. julia> 1 && true
  2. ERROR: TypeError: non-boolean (Int64) used in boolean context

但在链的末尾允许使用任意类型的表达式,此表达式会根据前面的条件被执行并返回:

  1. julia> true && (x = (1, 2, 3))
  2. (1, 2, 3)
  3. julia> false && (x = (1, 2, 3))
  4. false

重复执行:循环

有两个用于重复执行表达式的组件:while 循环和 for 循环。下面是一个 while 循环的例子:

  1. julia> i = 1;
  2. julia> while i <= 5
  3. println(i)
  4. global i += 1
  5. end
  6. 1
  7. 2
  8. 3
  9. 4
  10. 5

while 循环会执行条件表达式(例子中为 i <= 5),只要它为 true,就一直执行while 循环的主体部分。当 while 循环第一次执行时,如果条件表达式为 false,那么主体代码就一次也不会被执行。

for 循环使得常见的重复执行代码写起来更容易。 像之前 while 循环中用到的向上和向下计数是可以用 for 循环更简明地表达:

  1. julia> for i = 1:5
  2. println(i)
  3. end
  4. 1
  5. 2
  6. 3
  7. 4
  8. 5

这里的 1:5 是一个范围对象,代表数字 1, 2, 3, 4, 5 的序列。for 循环在这些值之中迭代,对每一个变量 i 进行赋值。for 循环与之前 while 循环的一个非常重要区别是作用域,即变量的可见性。如果变量 i 没有在另一个作用域里引入,在 for 循环内,它就只在 for 循环内部可见,在外部和后面均不可见。你需要一个新的交互式会话实例或者一个新的变量名来测试这个特性:

  1. julia> for j = 1:5
  2. println(j)
  3. end
  4. 1
  5. 2
  6. 3
  7. 4
  8. 5
  9. julia> j
  10. ERROR: UndefVarError: j not defined

参见变量作用域中对变量作用域的详细解释以及它在 Julia 中是如何工作的。

一般来说,for 循环组件可以用于迭代任一个容器。在这种情况下,相比 =,另外的(但完全相同)关键字 in 或者 则更常用,因为它使得代码更清晰:

  1. julia> for i in [1,4,0]
  2. println(i)
  3. end
  4. 1
  5. 4
  6. 0
  7. julia> for s ["foo","bar","baz"]
  8. println(s)
  9. end
  10. foo
  11. bar
  12. baz

在手册后面的章节中会介绍和讨论各种不同的迭代容器(比如,多维数组)。

为了方便,我们可能会在测试条件不成立之前终止一个 while 循环,或者在访问到迭代对象的结尾之前停止一个 for 循环,这可以用关键字 break 来完成:

  1. julia> i = 1;
  2. julia> while true
  3. println(i)
  4. if i >= 5
  5. break
  6. end
  7. global i += 1
  8. end
  9. 1
  10. 2
  11. 3
  12. 4
  13. 5
  14. julia> for j = 1:1000
  15. println(j)
  16. if j >= 5
  17. break
  18. end
  19. end
  20. 1
  21. 2
  22. 3
  23. 4
  24. 5

没有关键字 break 的话,上面的 while 循环永远不会自己结束,而 for 循环会迭代到 1000,这些循环都可以使用 break 来提前结束。

在某些场景下,需要直接结束此次迭代,并立刻进入下次迭代,continue 关键字可以用来完成此功能:

  1. julia> for i = 1:10
  2. if i % 3 != 0
  3. continue
  4. end
  5. println(i)
  6. end
  7. 3
  8. 6
  9. 9

这是一个有点做作的例子,因为我们可以通过否定这个条件,把 println 调用放到 if 代码块里来更简洁的实现同样的功能。在实际应用中,在 continue 后面还会有更多的代码要运行,并且调用 continue 的地方可能会有多个。

多个嵌套的 for 循环可以合并到一个外部循环,可以用来创建其迭代对象的笛卡尔积:

  1. julia> for i = 1:2, j = 3:4
  2. println((i, j))
  3. end
  4. (1, 3)
  5. (1, 4)
  6. (2, 3)
  7. (2, 4)

有了这个语法,迭代变量依然可以正常使用循环变量来进行索引,例如 for i = 1:n, j = 1:i 是合法的,但是在一个循环里面使用 break 语句则会跳出整个嵌套循环,不仅仅是内层循环。每次内层循环运行的时候,变量(ij)会被赋值为他们当前的迭代变量值。所以对 i 的赋值对于接下来的迭代是不可见的:

  1. julia> for i = 1:2, j = 3:4
  2. println((i, j))
  3. i = 0
  4. end
  5. (1, 3)
  6. (1, 4)
  7. (2, 3)
  8. (2, 4)

如果这个例子给每个变量一个关键字 for 来重写,那么输出会不一样:第二个和第四个变量包含 0

可以使用 zip 在单个 for 循环中同时迭代多个容器:

  1. julia> for (j, k) in zip([1 2 3], [4 5 6 7])
  2. println((j,k))
  3. end
  4. (1, 4)
  5. (2, 5)
  6. (3, 6)

使用 zip 将创建一个迭代器,它是一个包含传递给它的容器的子迭代器的元组。 zip 迭代器将按顺序迭代所有子迭代器,在 for 循环的第 $i$ 次迭代中选择每个子迭代器的第 $i$ 个元素。 一旦任何子迭代器用完,for 循环就会停止。

异常处理

当一个意外条件发生时,一个函数可能无法向调用者返回一个合理的值。在这种情况下,最好让意外条件终止程序并打印出调试的错误信息,或者根据程序员预先提供的异常处理代码来采取恰当的措施。

内置的 Exception

当一个意外的情况发生时,会抛出 Exception。下面列出的内置 Exception 都会中断正常的控制流程。

Exception
ArgumentError
BoundsError
CompositeException
DimensionMismatch
DivideError
DomainError
EOFError
ErrorException
InexactError
InitError
InterruptException
InvalidStateException
KeyError
LoadError
OutOfMemoryError
ReadOnlyMemoryError
RemoteException
MethodError
OverflowError
Meta.ParseError
SystemError
TypeError
UndefRefError
UndefVarError
StringIndexError

例如,当输入参数为负实数时,sqrt 函数会抛出一个 DomainError

  1. julia> sqrt(-1)
  2. ERROR: DomainError with -1.0:
  3. sqrt will only return a complex result if called with a complex argument. Try sqrt(Complex(x)).
  4. Stacktrace:
  5. [...]

你可能需要根据下面的方式来定义你自己的异常:

  1. julia> struct MyCustomException <: Exception end

-函数)throw 函数

我们可以用 throw 显式地创建异常。例如,若一个函数只对非负数有定义,当输入参数是负数的时候,可以用 throw 抛出一个 DomainError

  1. julia> f(x) = x>=0 ? exp(-x) : throw(DomainError(x, "argument must be nonnegative"))
  2. f (generic function with 1 method)
  3. julia> f(1)
  4. 0.36787944117144233
  5. julia> f(-1)
  6. ERROR: DomainError with -1:
  7. argument must be nonnegative
  8. Stacktrace:
  9. [1] f(::Int64) at ./none:1

注意 DomainError 后面不接括号的话不是一个异常,而是一个异常类型。我们需要调用它来获得一个 Exception 对象:

  1. julia> typeof(DomainError(nothing)) <: Exception
  2. true
  3. julia> typeof(DomainError) <: Exception
  4. false

另外,一些异常类型会接受一个或多个参数来进行错误报告:

  1. julia> throw(UndefVarError(:x))
  2. ERROR: UndefVarError: x not defined

我们可以仿照 UndefVarError 的写法,用自定义异常类型来轻松实现这个机制:

  1. julia> struct MyUndefVarError <: Exception
  2. var::Symbol
  3. end
  4. julia> Base.showerror(io::IO, e::MyUndefVarError) = print(io, e.var, " not defined")

Note

错误信息的第一个单词最好用小写。例如:

size(A) == size(B) || throw(DimensionMismatch("size of A not equal to size of B"))

就比

size(A) == size(B) || throw(DimensionMismatch("Size of A not equal to size of B")).

更好。

但是,有时保留大写首字母是有意义的,例如函数的参数就是大写字母时:

size(A,1) == size(B,2) || throw(DimensionMismatch("A has first dimension...")).

错误

我们可以用 error 函数生成一个 ErrorException 来中断正常的控制流程。

假设我们希望在计算负数的平方根时让程序立即停止执行。为了实现它,我们可以定义一个挑剔的 sqrt 函数,当它的参数是负数时,产生一个错误:

  1. julia> fussy_sqrt(x) = x >= 0 ? sqrt(x) : error("negative x not allowed")
  2. fussy_sqrt (generic function with 1 method)
  3. julia> fussy_sqrt(2)
  4. 1.4142135623730951
  5. julia> fussy_sqrt(-1)
  6. ERROR: negative x not allowed
  7. Stacktrace:
  8. [1] error at ./error.jl:33 [inlined]
  9. [2] fussy_sqrt(::Int64) at ./none:1
  10. [3] top-level scope

如果另一个函数调用 fussy_sqrt 和一个负数, 它会立马返回, 在交互会话中显示错误信息,而不会继续执行调用的函数:

  1. julia> function verbose_fussy_sqrt(x)
  2. println("before fussy_sqrt")
  3. r = fussy_sqrt(x)
  4. println("after fussy_sqrt")
  5. return r
  6. end
  7. verbose_fussy_sqrt (generic function with 1 method)
  8. julia> verbose_fussy_sqrt(2)
  9. before fussy_sqrt
  10. after fussy_sqrt
  11. 1.4142135623730951
  12. julia> verbose_fussy_sqrt(-1)
  13. before fussy_sqrt
  14. ERROR: negative x not allowed
  15. Stacktrace:
  16. [1] error at ./error.jl:33 [inlined]
  17. [2] fussy_sqrt at ./none:1 [inlined]
  18. [3] verbose_fussy_sqrt(::Int64) at ./none:3
  19. [4] top-level scope

try/catch 语句

通过 try / catch 语句,可以测试 Exception 并 优雅处理可能会破坏应用程序的事情。 例如, 在下面的代码中,平方根函数会引发异常。 通过 在其周围放置 try / catch 块可以缓解。 您可以选择如何 处理此异常,无论是记录它,返回占位符值还是 就像下面仅打印一句话。 要注意的是 在决定如何处理异常时,使用try / catch 块 比使用条件分支处理要慢得多。 以下是使用try / catch 块处理异常的更多示例:

  1. julia> try
  2. sqrt("ten")
  3. catch e
  4. println("You should have entered a numeric value")
  5. end
  6. You should have entered a numeric value

try/catch 语句允许保存 Exception 到一个变量中。在下面这个做作的例子中,如果 x 是可索引的,则计算 x 的第二项的平方根,否则就假设 x 是一个实数,并返回它的平方根:

  1. julia> sqrt_second(x) = try
  2. sqrt(x[2])
  3. catch y
  4. if isa(y, DomainError)
  5. sqrt(complex(x[2], 0))
  6. elseif isa(y, BoundsError)
  7. sqrt(x)
  8. end
  9. end
  10. sqrt_second (generic function with 1 method)
  11. julia> sqrt_second([1 4])
  12. 2.0
  13. julia> sqrt_second([1 -4])
  14. 0.0 + 2.0im
  15. julia> sqrt_second(9)
  16. 3.0
  17. julia> sqrt_second(-9)
  18. ERROR: DomainError with -9.0:
  19. sqrt will only return a complex result if called with a complex argument. Try sqrt(Complex(x)).
  20. Stacktrace:
  21. [...]

注意 catch 后面的字符会被一直认为是异常的名字,所以在写 try/catch 单行表达式时,需要特别小心。下面的代码不会在错误的情况下返回 x 的值:

  1. try bad() catch x end

正确的做法是在 catch 后添加一个分号或者直接换行:

  1. try bad() catch; x end
  2. try bad()
  3. catch
  4. x
  5. end

try/catch 结构的强大之处在于能够立即将深度嵌套的计算展开到调用函数堆栈中的更高级别。 在某些情况下,没有发生错误,但需要能够展开堆栈并将值传递到更高级别。 Julia 提供了 rethrowbacktracecatch_backtracecurrent_exceptions 函数来进行更高级的错误处理。

finally 子句

在进行状态改变或者使用类似文件的资源的编程时,经常需要在代码结束的时候进行必要的清理工作(比如关闭文件)。由于异常会使得部分代码块在正常结束之前退出,所以可能会让上述工作变得复杂。finally 关键字提供了一种方式,无论代码块是如何退出的,都能够让代码块在退出时运行某段代码。

这里是一个确保一个打开的文件被关闭的例子:

  1. f = open("file")
  2. try
  3. # operate on file f
  4. finally
  5. close(f)
  6. end

当控制流离开 try 代码块(例如,遇到 return,或者正常结束),close(f) 就会被执行。如果 try 代码块由于异常退出,这个异常会继续传递。catch 代码块可以和 try 还有 finally 配合使用。这时 finally 代码块会在 catch 处理错误之后才运行。

Tasks 任务(或协程)

Task 是一种允许计算以更灵活的方式被中断或者恢复的流程控制特性。 我们提及它只是为了说明的完整性;详细的介绍参见:异步编程