table 库

table 库是由一些辅助函数构成的,这些函数将 table 作为数组来操作。

下标从 1 开始

Lua 中,数组下标从 1 开始计数。

官方解释:Lua lists have a base index of 1 because it was thought to be most friendly for non-programmers, as it makes indices correspond to ordinal element positions.

确实,对于我们数数来说,总是从 1 开始数的,而从 0 开始对于描述偏移量这样的东西有利。而 Lua 最初设计是一种类似 XML 的数据描述语言,所以索引(index)反应的是数据在里面的位置,而不是偏移量。

在初始化一个数组的时候,若不显式地用 键值对 方式赋值,则会默认用数字作为下标,从 1 开始。由于在 Lua 内部实际采用哈希表和数组分别保存键值对、普通值,所以不推荐混合使用这两种赋值方式。

  1. local color={first="red", "blue", third="green", "yellow"}
  2. print(color["first"]) --> output: red
  3. print(color[1]) --> output: blue
  4. print(color["third"]) --> output: green
  5. print(color[2]) --> output: yellow
  6. print(color[3]) --> output: nil

从其他语言过来的开发者会觉得比较坑的一点是,当我们把 table 当作栈或者队列使用的时候,容易犯错:

  • 追加到 table 的末尾用的是 s[#s+1] = something,而不是 s[#s] = something,而且如果这个 something 是一个 nil 的话,会导致这一次压栈(或者入队列)没有存入任何东西,#s 的值没有变。 示例如下:

    1. -- 情况 1 使用 `#str+1`, 要添加的值为“真值”或 false
    2. str = {'a', 'b', 'c'}
    3. str[#str+1] = 'd'
    4. print('str_len:' .. #str) -- 打印出 str 的元素个数
    5. for i,v in ipairs(str) do
    6. print(i,v) -- 打印 str 的元素
    7. end
    8. -- output: (正确的结果)
    9. str_len:4
    10. 1 a
    11. 2 b
    12. 3 c
    13. 4 d
    14. -- 注:false 也是可以正常添加的。
    15. -- 情况 2 使用 `#str+1`, 要添加的值为 nil
    16. str = {'a', 'b', 'c'}
    17. str[#str+1] = nil
    18. print('str_len:' .. #str) -- 打印出 str 的元素个数
    19. for i,v in ipairs(str) do
    20. print(i,v) -- 打印 str 的元素
    21. end
    22. -- output: (正确的结果)
    23. str_len:3
    24. 1 a
    25. 2 b
    26. 3 c
    27. -- str 的元素个数没有变化
    28. -- 情况 3 使用 `#str`, 要添加的值为“真值”或 false
    29. str = {'a', 'b', 'c'}
    30. str[#str] = 'd'
    31. print('str_len:' .. #str) -- 打印出 str 的元素个数
    32. for i,v in ipairs(str) do
    33. print(i,v) -- 打印 str 的元素
    34. end
    35. -- output: (不期望的结果)
    36. str_len:3
    37. 1 a
    38. 2 b
    39. 3 d
    40. -- str 的元素个数没有变化,但是最后一个元素被覆盖了,并不是期望的添加一个新元素
    41. -- 情况 4 使用 `#str`, 要添加的值为 nil
    42. str = {'a', 'b', 'c'}
    43. str[#str] = nil
    44. print('str_len:' .. #str) -- 打印出 str 的元素个数
    45. for i,v in ipairs(str) do
    46. print(i,v) -- 打印 str 的元素
    47. end
    48. -- output: (不期望的结果)
    49. str_len:2
    50. 1 a
    51. 2 b
    52. -- str 的元素少了一个,不光没有添加反而删除了一个
  • 如果 s = { 1, 2, 3, 4, 5, 6 },你令 s[4] = nil#s 会令你“匪夷所思”地变成 3。 示例如下:

    1. s = { 1, 2, 3, 4, 5, 6 }
    2. s[4] = nil
    3. print('s_len:' .. #s) -- 打印出 s 的元素个数
    4. for i,v in ipairs(s) do
    5. print(i,v) -- 打印 s 的元素
    6. end
    7. -- output:
    8. s_len:3
    9. 1 1
    10. 2 2
    11. 3 3

table.getn 获取长度

取长度操作符写作一元操作 #。字符串的长度是它的字节数(就是以一个字符一个字节计算的字符串长度)。

对于常规的数组,里面从 1 到 n 放着一些非空的值的时候,它的长度就精确的为 n,即最后一个值的下标。如果数组有一个“空洞”(就是说,nil 值被夹在非空值之间),那么 #t 可能是指向任何一个是 nil 值的前一个位置的下标(就是说,任何一个 nil 值都有可能被当成数组的结束)。这也就说明对于有“空洞”的情况,table 的长度存在一定的 不可确定性

  1. local tblTest1 = { 1, a = 2, 3 }
  2. print("Test1 " .. table.getn(tblTest1))
  3. local tblTest2 = { 1, nil }
  4. print("Test2 " .. table.getn(tblTest2))
  5. local tblTest3 = { 1, nil, 2 }
  6. print("Test3 " .. table.getn(tblTest3))
  7. local tblTest4 = { 1, nil, 2, nil }
  8. print("Test4 " .. table.getn(tblTest4))
  9. local tblTest5 = { 1, nil, 2, nil, 3, nil }
  10. print("Test5 " .. table.getn(tblTest5))
  11. local tblTest6 = { 1, nil, 2, nil, 3, nil, 4, nil }
  12. print("Test6 " .. table.getn(tblTest6))

我们使用 Lua 5.1 和 LuaJIT 2.1 分别执行这个用例,结果如下:

  1. # lua test.lua
  2. Test1 2
  3. Test2 1
  4. Test3 3
  5. Test4 1
  6. Test5 3
  7. Test6 1
  8. # luajit test.lua
  9. Test1 2
  10. Test2 1
  11. Test3 1
  12. Test4 1
  13. Test5 1
  14. Test6 1

这一段的输出结果,就是这么 匪夷所思。请问,你以后还敢在 Lua 的 table 中用 nil 值吗?如果你继续往后面加 nil,你可能会发现点什么。你可能认为你发现的是个规律。但是,你千万不要认为这是个规律,因为这是错误的。

不要在 Lua 的 table 中使用 nil 值,如果一个元素要删除,直接 remove,不要用 nil 去代替

table.concat (table [, sep [, i [, j ] ] ])

对于元素是 string 或者 number 类型的表 table,返回 table[i]..sep..table[i+1] ··· sep..table[j] 连接成的字符串。填充字符串 sep 默认为空白字符串。起始索引位置 i 默认为 1,结束索引位置 j 默认是 table 的长度。如果 i 大于 j,返回一个空字符串。

示例代码

  1. local a = {1, 3, 5, "hello" }
  2. print(table.concat(a)) -- output: 135hello
  3. print(table.concat(a, "|")) -- output: 1|3|5|hello
  4. print(table.concat(a, " ", 4, 2)) -- output:
  5. print(table.concat(a, " ", 2, 4)) -- output: 3 5 hello

当需要循环拼接字符时,推荐使用table.concat。因为若使用..在循环中拼接字符,会产生大量的中间字符串。如果拼接的字符串很大,经过多次循环拼接后,其内存开销急剧增大,也会同时触发多次GC,甚至会导致 Lua 虚拟机内存不足。

问题示例代码

  1. local chunk, eof = ngx.arg[1], ngx.arg[2]
  2. if not ngx.ctx.buffer then
  3. ngx.ctx.buffer = ""
  4. end
  5. if eof then
  6. local body = body_filter.transform_json_body(match_t, ngx.ctx.buffer) --calc
  7. ngx.arg[1] = body
  8. else
  9. ngx.ctx.buffer = ngx.ctx.buffer .. chunk
  10. ngx.arg[1] = nil
  11. end

问题现象:当响应 body 较大时,luajit 虚拟机会概率性报错内存不足not enough memory,同时 openresty 占用的内存居高不下。

正确代码

  1. local chunk, eof = ngx.arg[1], ngx.arg[2]
  2. if not ngx.ctx.buffer_table then
  3. ngx.ctx.buffer_table = {}
  4. end
  5. if eof then
  6. local buffer = table.concat(ngx.ctx.buffer_table) -- 使用 table.concat 拼接
  7. local body = body_filter.transform_json_body(match_t, buffer)
  8. ngx.arg[1] = body
  9. else
  10. ngx.arg[1] = nil
  11. table.insert(ngx.ctx.buffer_table, chunk)
  12. end

table.insert (table, [pos ,] value)

在(数组型)表 table 的 pos 索引位置插入 value,其它元素向后移动到空的地方。pos 的默认值是表的长度加一,即默认是插在表的最后。

示例代码

  1. local a = {1, 8} --a[1] = 1,a[2] = 8
  2. table.insert(a, 1, 3) --在表索引为 1 处插入 3
  3. print(a[1], a[2], a[3])
  4. table.insert(a, 10) --在表的最后插入 10
  5. print(a[1], a[2], a[3], a[4])
  6. -->output
  7. 3 1 8
  8. 3 1 8 10

table.maxn (table)

返回(数组型)表 table 的最大索引编号;如果此表没有正的索引编号,返回 0。

当长度省略时,此函数通常需要 O(n) 的时间复杂度来计算 table 的末尾。因此用这个函数省略索引位置的调用形式来作 table 元素的末尾追加,是高代价操作。

示例代码

  1. local a = {}
  2. a[-1] = 10
  3. print(table.maxn(a))
  4. a[5] = 10
  5. print(table.maxn(a))
  6. -->output
  7. 0
  8. 5

此函数的行为不同于 # 运算符,因为 # 可以返回数组中任意一个 nil 空洞或最后一个 nil 之前的元素索引。当然,该函数的开销相比 # 运算符也会更大一些。

table.remove (table [, pos])

在表 table 中删除索引为 pos(pos 只能是 number 型)的元素,并返回这个被删除的元素,它后面所有元素的索引值都会减一。pos 的默认值是表的长度,即默认是删除表的最后一个元素。

示例代码

  1. local a = { 1, 2, 3, 4}
  2. print(table.remove(a, 1)) --删除索引为 1 的元素
  3. print(a[1], a[2], a[3], a[4])
  4. print(table.remove(a)) --删除最后一个元素
  5. print(a[1], a[2], a[3], a[4])
  6. -->output
  7. 1
  8. 2 3 4 nil
  9. 4
  10. 2 3 nil nil

table.sort (table [, comp])

按照给定的比较函数 comp 给表 table 排序,也就是从 table[1] 到 table[n],这里 n 表示 table 的长度。 比较函数有两个参数,如果希望第一个参数排在第二个的前面,就应该返回 true,否则返回 false。 如果比较函数 comp 没有给出,默认从小到大排序。

示例代码

  1. local function compare(x, y) --从大到小排序
  2. return x > y --如果第一个参数大于第二个就返回 true,否则返回 false
  3. end
  4. local a = { 1, 7, 3, 4, 25}
  5. table.sort(a) --默认从小到大排序
  6. print(a[1], a[2], a[3], a[4], a[5])
  7. table.sort(a, compare) --使用比较函数进行排序
  8. print(a[1], a[2], a[3], a[4], a[5])
  9. -->output
  10. 1 3 4 7 25
  11. 25 7 4 3 1

table 其他非常有用的函数

LuaJIT 2.1 新增加的 table.newtable.clear 函数是非常有用的。前者主要用来预分配 Lua table 空间,后者主要用来高效的释放 table 空间,并且它们都是可以被 JIT 编译的。具体可以参考一下 OpenResty 捆绑的 lua-resty-* 库,里面有些实例可以作为参考。