Go 语言编译原理与优化

编译阶段 (Compilation)

debug 参数

-m 打印编译器更多想法的细节

  1. -gcflags '-m'

-S 打印汇编

  1. -gcflags '-S'

优化和内联

默认开启了优化和内联,但是debug的时候开启可能会出现一些奇怪的问题,通过下面的参数可以禁止任何优化

  1. -gcflags '-N -l'

内联级别:

  • -gcflags='-l -l' 内联级别2,更积极,可能更快,可能会制作更大的二进制文件。
  • -gcflags='-l -l -l' 内联级别3,再次更加激进,二进制文件肯定更大,也许更快,但也许会有 bug。
  • -gcflags=-l=4 (4个-l)在 Go 1.11 中将支持实验性的中间栈内联优化

逃逸分析

  • 如果一个局部变量值超越了函数调用的生命周期,编译器自动将它逃逸到堆
  • 如果一个通过new或make来分配的对象,在函数内即使将指针传递给了其它函数,其它函数会被内联到当前函数,相当于指针不会逃逸出本函数,最终不返回指针的话,该指针对应的值也都会分配在栈上,而不是在堆

链接阶段 (Linking)

  • Go 支持 internal 和 external 两种链接方式: internal 使用 go 自身实现的 linker,external 需要启动外部的 linker
  • linker 的主要工作是将 .o (object file) 链接成最终可执行的二进制
  • 对应命令: go tool link,对应源码: $GOROOT/src/cmd/link
  • 通过 -ldflags 给链接器传参,参数详见: go tool link --help

关于 CGO

  • 启用cgo可以调用外部依赖的c库
  • go的编译器会判断环境变量 CGO_ENABLED 来决定是否启用cgo,默认 CGO_ENABLED=1 即启用cgo
  • 源码文件头部的 build tag 可以根据cgo是否启用决定源码是否被编译(// +build cgo 表示希望cgo启用时被编译,相反的是 // +build !cgo)
  • 标准库中有部分实现有两份源码,比如: $GOROOT/src/os/user/lookup_unix.go$GOROOT/src/os/user/cgo_lookup_unix.go ,它们有相同的函数,但实现不一样,前者是纯go实现,后者是使用cgo调用外部依赖来实现,标准库中使用cgo比较常见的是 net 包。

internal linking

  • link 默认使用 internal 方式
  • 直接使用 go 本身的实现的 linker 来链接代码,
  • 功能比较简单,仅仅是将 .o 和预编译的 .a 写到最终二进制文件中(.a文件在 $GOROOT/pkg$GOPATH/pkg 中,其实就是.o文件打包的压缩包,通过 tar -zxvf 可以解压出来查看)

external linking

  • 会启动外部 linker (gcc/clang),通过 -ldflags '-linkmode "external"' 启用 external linking
  • 通过 -extldflags 给外部 linker 传参,比如: -ldflags '-linkmode "external" -extldflags "-static"'

go编译出来就是一个二进制,自带runtime,不需要解释器,但并不意味着就不需要任何依赖,但也可以通过静态链接来做到完全不用任何依赖,全部”揉“到一个二进制文件中。实现静态链接的方法:

  • 如果是 external linking,可以这样: -ldflags '-linkmode external -extldflags -static'
  • 如果用默认的 internal linking,可以这样: -ldflags '-d'

ldflags 其它常用参数

  • -s -w 是去除符号表和DWARF调试信息(可以减小二进制体积,但不利于调试,可在用于生产环境),示例: -ldflags '-s -w'
  • -X 可以给变量注入值,比如编译时用脚本动态注入当前版本和 commit id 到代码的变量中,通常程序的 version 子命令或参数输出当前版本信息时就用这种方式实现,示例:-ldflags '-X myapp/pkg/version/version=v1.0.0'

使用 Docker 编译

使用 Docker 编译可以不用依赖本机 go 环境,将编译环境标准化,特别在有外部动态链接库依赖的情况下很有用,可以直接 run 一个容器来编译,给它挂载源码目录和二进制输出目录,这样我们就可以拿到编译出来的二进制了,这里以编译cfssl为例:

  1. ROOT_PKG=github.com/cloudflare/cfssl
  2. CMD_PKG=$ROOT_PKG/cmd
  3. LOCAL_SOURCE_PATH=/Users/roc/go/src/$ROOT_PKG
  4. LOCAL_OUTPUT_PATH=$PWD
  5. GOPATH=/go/src
  6. ROOT_PATH=$GOPATH/$ROOT_PKG
  7. CMD_PATH=$GOPATH/$CMD_PKG
  8. docker run --rm \
  9. -v $LOCAL_SOURCE_PATH:$ROOT_PATH \
  10. -v $LOCAL_OUTPUT_PATH:/output \
  11. -w $ROOT_PATH \
  12. golang:1.13 \
  13. go build -v \
  14. -ldflags '-d' \
  15. -o /output/ \
  16. $CMD_PATH/...

编译镜像可以参考下面示例(使用docker多阶段构建,完全静态编译,没有外部依赖):

  1. FROM golang:1.12-stretch as builder
  2. MAINTAINER rockerchen@tencent.com
  3. ENV BUILD_DIR /go/src/cloud.tencent.com/qc_container_cluster/hpa-metrics-server
  4. WORKDIR $BUILD_DIR
  5. COPY ./ $BUILD_DIR
  6. RUN CGO_ENABLED=0 go build -v -o /hpa-metrics-server \
  7. -ldflags '-d' \
  8. ./
  9. FROM ubuntu:16.04
  10. MAINTAINER rockerchen@tencent.com
  11. RUN apt-get update -y
  12. RUN DEBIAN_FRONTEND=noninteractive apt-get install -y curl iproute2 inetutils-tools telnet inetutils-ping
  13. RUN apt-get install --no-install-recommends --no-install-suggests ca-certificates -y
  14. COPY --from=builder /hpa-metrics-server /hpa-metrics-server
  15. RUN chmod a+x /hpa-metrics-server

参考资料