从文件中读取所需的数据量

从文件中读取所需的数据量

在本节中，你将学习如何准确读取所需的数据量。这种技术在读取二进制文件时特别有用，在二进制文件中，必须以特定的方式解码读取的数据。不过，这种技术仍然适用于文本文件。

这种技术背后的逻辑并不难：创建一个所需大小的字节切片，并使用该字节切片进行读取。为了更有趣一点，我们将使用一个函数实现这个功能，这个函数具有两个参数。一个参数用于指定需要读取的数据量，另一个参数将使用*os.File文件类型，用于访问所需的文件。该函数的返回值将是所读取的数据。

本节的实现文件是readSize.go，分为四部分。程序接受一个简单的参数，为字节切片的大小。

当使用当前技术时，这个特定的程序可以帮助你使用所需的缓冲区大小复制任何文件。

readSize.go的第一部分代码如下：

package main
import (
    "fmt"
    "io"
    "os"
    "strconv"
)

readSize.go的第二部分代码如下：

func readSize(f *os.File, size int) []byte {
    buffer := make([]byte, size)
    n, err := f.Read(buffer)
    if err == io.EOF {
        return nil
    }
    if err != nil {
        fmt.Println(err)
        return nil
    }
    return buffer[0:n]
}

这即是前面讨论的函数。尽管代码相当直接，但仍有一点需要解释。io.Reader.Read()方法返回两个参数：读取的字节数以及error变量。

readSize()函数的作用是：使用io.Read()的第一个返回值返回字节切片大小。虽然这是一个很小的细节，而且只有在到达文件末尾时才重要，但是它确保实用程序的输出与输入相同，并且不包含任何额外的字符。最后，还要检查io.EOF,表示已经到达文件的末尾。当发生错误时，函数返回。

代码的第三部分如下：

func main() {
    arguments := os.Args
    if len(arguments) != 3 {
        fmt.Println("<buffer size> <filename>")
        return
    }
    bufferSize, err := strconv.Atoi(os.Args[1])
    if err != nil {
        fmt.Println(err)
        return
    }
    file := os.Args[2]
    f, err := os.Open(file)
    if err != nil {
        fmt.Println(err)
        return
    }
    defer f.Close()

readSize.go的最后一部分代码如下：

    for {
        readData := readSize(f, bufferSize)
        if readData != nil {
            fmt.Println(string(readData))
        } else {
            break
        }
    }
}

所以，你需要一直读取输入文件，直到返回错误或者nil。

执行readSize.go，传入处理的二进制文件，并使用wc(1)处理它的输出，来验证程序的正确性。

$ go run readSize.go 1000 /bin/ls | wc
     80     1032     38688
$ wc /bin/ls
     80     1032     38688     /bin/ls

08.6 从文件中读取所需的数据量

从文件中读取所需的数据量