格式化时间与日期

在这一节中你将处理既有时间又有日期的字符串,这种格式的时间在web服务器中最常见到,例如ApacheNginx等。由于目前还没有讲到文件IO,所以这里我将文本硬编码写到程序中,这不会影响程序的功能。

本节代码timeDate.go将分3部分展示,其中第一部分:

  1. package main
  2. import (
  3. "fmt"
  4. "regexp"
  5. "time"
  6. )
  7. func main() {
  8. logs := []string{"127.0.0.1 - - [16/Nov/2017:10:49:46 +0200] 325504",
  9. "127.0.0.1 - - [16/Nov/2017:10:16:41 +0200] \"GET /CVEN HTTP/1.1\" 200 12531 \"-\" \"Mozilla/5.0 AppleWebKit/537.36",
  10. "127.0.0.1 200 9412 - - [12/Nov/2017:06:26:05 +0200] \"GET \"http://www.mtsoukalos.eu/taxonomy/term/47\" 1507",
  11. "[12/Nov/2017:16:27:21 +0300]",
  12. "[12/Nov/2017:20:88:21 +0200]",
  13. "[12/Nov/2017:20:21 +0200]",
  14. }

由于我们不能确定数据的格式,所以样本数据尽量覆盖不同格式的数据,包括像"[12/Nov/2017:20:21 +0200]"这种不完整的数据,[12/Nov/2017:20:88:21 +0200]这种本身存在错误的数据(秒数是88)。

第二部分代码:

  1. for _, logEntry := range logs {
  2. r := regexp.MustCompile(`.*\[(\d\d\/\w+/\d\d\d\d:\d\d:\d\d:\d\d.*)\].*`)
  3. if r.MatchString(logEntry) {
  4. match := r.FindStringSubmatch(logEntry)

我们使用正则表达式来匹配正确的时间格式,在拿到时间字符串后,剩下的任务就交给time.Parse()好了。

最后一部分代码:

  1. dt, err := time.Parse("02/Jan/2006:15:04:05 -0700", match[1])
  2. if err == nil {
  3. newFormat := dt.Format(time.RFC850)
  4. fmt.Println(newFormat)
  5. } else {
  6. fmt.Println("Not a valid date time format!")
  7. }
  8. } else {
  9. fmt.Println("Not a match!")
  10. }
  11. }
  12. }

一旦正则表达式匹配到了时间字符串,time.Parse()就会去解析判断其是否是一个有效的时间。如果是,timeDate.go就会将时间以RFC850格式打印出来。

执行timeDate.go,你将得到下面的输出:

$ go run timeDate.go

Thursday, 16-Nov-17 10:49:46 +0200 Thursday, 16-Nov-17 10:16:41 +0200 Sunday, 12-Nov-17 06:26:05 +0200 Sunday, 12-Nov-17 16:27:21 +0300 Not a valid date time format! Not a match!