格式化时间与日期
在这一节中你将处理既有时间又有日期的字符串,这种格式的时间在web服务器中最常见到,例如Apache,Nginx等。由于目前还没有讲到文件IO,所以这里我将文本硬编码写到程序中,这不会影响程序的功能。
本节代码timeDate.go
将分3部分展示,其中第一部分:
package main
import (
"fmt"
"regexp"
"time"
)
func main() {
logs := []string{"127.0.0.1 - - [16/Nov/2017:10:49:46 +0200] 325504",
"127.0.0.1 - - [16/Nov/2017:10:16:41 +0200] \"GET /CVEN HTTP/1.1\" 200 12531 \"-\" \"Mozilla/5.0 AppleWebKit/537.36",
"127.0.0.1 200 9412 - - [12/Nov/2017:06:26:05 +0200] \"GET \"http://www.mtsoukalos.eu/taxonomy/term/47\" 1507",
"[12/Nov/2017:16:27:21 +0300]",
"[12/Nov/2017:20:88:21 +0200]",
"[12/Nov/2017:20:21 +0200]",
}
由于我们不能确定数据的格式,所以样本数据尽量覆盖不同格式的数据,包括像"[12/Nov/2017:20:21 +0200]"
这种不完整的数据,[12/Nov/2017:20:88:21 +0200]
这种本身存在错误的数据(秒数是88)。
第二部分代码:
for _, logEntry := range logs {
r := regexp.MustCompile(`.*\[(\d\d\/\w+/\d\d\d\d:\d\d:\d\d:\d\d.*)\].*`)
if r.MatchString(logEntry) {
match := r.FindStringSubmatch(logEntry)
我们使用正则表达式来匹配正确的时间格式,在拿到时间字符串后,剩下的任务就交给time.Parse()
好了。
最后一部分代码:
dt, err := time.Parse("02/Jan/2006:15:04:05 -0700", match[1])
if err == nil {
newFormat := dt.Format(time.RFC850)
fmt.Println(newFormat)
} else {
fmt.Println("Not a valid date time format!")
}
} else {
fmt.Println("Not a match!")
}
}
}
一旦正则表达式匹配到了时间字符串,time.Parse()
就会去解析判断其是否是一个有效的时间。如果是,timeDate.go
就会将时间以RFC850格式打印出来。
执行timeDate.go
,你将得到下面的输出:
$ go run timeDate.go
Thursday, 16-Nov-17 10:49:46 +0200 Thursday, 16-Nov-17 10:16:41 +0200 Sunday, 12-Nov-17 06:26:05 +0200 Sunday, 12-Nov-17 16:27:21 +0300 Not a valid date time format! Not a match!