逐字符读取文本文件
在本节中,你将学会如何逐字符读取文本文件,这是一个非常少见的需求,除非你想创建文本编辑器。相关的Go
代码参考byCharacter.go
,将分为四部分介绍。
byCharacter.go
第一部分代码如下:
package main
import (
"bufio"
"flag"
"fmt"
"io"
"os"
)
如你所见,本程序不需要使用正则表达式。
byCharacter.go
第二部分代码如下:
func charByChar(file string) error {
var err error
f, err := os.Open(file)
if err != nil {
return err
}
defer f.Close()
r := bufio.NewReader(f)
for {
line, err := r.ReadString('\n')
if err == io.EOF {
break
} else if err != nil {
fmt.Printf("error reading file %s", err)
return err
}
byCharacter.go
第三部分代码如下:
for _, x := range line {
fmt.Println(string(x))
}
}
return nil
}
此处,你读取每一行,并使用range
分割。range
返回两个值:丢弃第一个值,它是line
变量中当前字符的位置,并使用第二个值。但是,该值不是字符-这就是为什么必须使用string()
函数将其转换为字符的原因。
注意,由于fmt.Println(string(x))
语句,每个字符都按行打印,这意味着程序的输出将很大。如果想要压缩输出,应该使用fmt.Print()
函数。
byCharacter.go
的最后一部分代码如下:
func main() {
flag.Parse()
if len(flag.Args()) == 0 {
fmt.Printf("usage: byChar <file1> [<file2> ...]\n")
return
}
for _, file := range flag.Args() {
err := charByChar(file)
if err != nil {
fmt.Println(err)
}
}
}
执行byCharacter.go
会产生如下输出:
$ go run byCharacter.go /tmp/adobegc.log
0
1
/
0
8
/
1
8
注意,上述Go
代码也能用来统计输入文件的字符个数,即是Go
版本的wc(1)
命令行实现。