Go语言中定义"零值有效"类型的指南

发表时间: 2024-05-08 11:24

1. Go 类型的零值

当通过声明或调用new为变量分配存储空间, 或者通过复合文字字面量或make调用创建新值, 并且还不提供显式初始化的情况下, Go会为变量或值提供默认值。

Go 语言的每种原生类型都有其默认值, 这个默认值就是这个类型的零值。下面是 Go 规范定义的内置原生类型的默认值(零值)。

所有整型类型:0

浮点类型:0.0

布尔类型:false

字符串类型:""

指针、interface、slice、channel、map、function:nil


另外 Go 的零值初始是递归的, 即诸如数组、结构体等类型的零值初始化就是对其组成元素逐一进行零值初始化。


2. 零值可用

我们现在知道了 Go 类型的零值, 接下来我们来说"可用"。

Go 从诞生以来就秉承着尽量保持“零值可用”的理念, 我们来看两个例子。

第一个例子是关于 slice 的:

var zeroSlice []intzeroSlice = append(zeroSlice, 1)fmt.Println(zeroSlice) // 输出:[1]

我们声明了一个 []int 类型的 slice:zeroSlice, 我们并没有对其进行显式初始化, 这样 zeroSlice 这个变量被 Go 编译器置为零值:nil。

按传统的思维, 对于值为 nil 这样的变量我们要给其赋上合理的值后才能使用。但是 Go 具备零值可用的特性, 我们可以直接对其使用 append 操作, 并且不会出现引用 nil 的错误。

第二个例子是通过 nil 指针调用方法的:

package mainimport (    "fmt"    "net")func main() {    var p *net.TCPAddr    fmt.Println(p) //输出:<nil>}

我们声明了一个 net.TCPAddr 的指针变量, 我们并未对其显式初始化, 指针变量 p 会被 Go 编译器赋值为 nil。

我们在标准输出上输出该变量, fmt.Println 会调用 p.String()。我们来看看 TCPAddr 这个类型的 String 方法实现:

// $GOROOT/src/net/tcpsock.go

func (a *TCPAddr) String() string {    if a == nil {        return "<nil>"    }    ip := ipEmptyString(a.IP)    if a.Zone != "" {    		return JoinHostPort(ip+"%"+a.Zone, itoa(a.Port))    }    return JoinHostPort(ip, itoa(a.Port))}

我们看到 Go 标准库在定义 TCPAddr 类型以及其方法时充分考虑了"零值可用"的理念, 使得通过值为 nil 的 TCPAddr 指针变量依然可以调用 String 方法。

在 Go 标准库和运行时代码中还有很多践行"零值可用"理念的好例子, 最典型的莫过于 sync.Mutex 和 bytes.Buffer 了。

package mainimport (    "fmt"    "sync")func main() {    var num int    var mu sync.Mutex    mu.Lock()    num += 1    fmt.Println(num)    mu.Unlock()}

Go 标准库的设计者很"贴心"地将 sync.Mutex 结构体的零值状态设计为可用状态, 这样让 Mutex 的调用者可以"省略"对 Mutex 的初始化而直接使用 Mutex。

Go 标准库中的 bytes.Buffer 亦是如此:

package mainimport (    "bytes"    "fmt")func main() {    var b bytes.Buffer    b.Write([]byte("Effective Go"))    fmt.Println(b.String()) // 输出:Effective Go}

我们看到我们无需对 bytes.Buffer 类型的变量 b 进行任何显式初始化即可直接通过 b 调用其方法进行写入操作, 这源于 bytes.Buffer 底层存储数据的是同样支持零值可用策略的 slice 类型:

// $GOROOT/src/bytes/buffer.go// A Buffer is a variable-sized buffer of bytes with Read and Write methods.// The zero value for Buffer is an empty buffer ready to use.type Buffer struct {    buf []byte // contents are the bytes buf[off : len(buf)]    off int // read at &buf[off], write at &buf[len(buf)]    lastRead readOp // last read operation, so that Unread* can work correctly.}

3. 小结

Go 语言零值可用的理念给内置类型、标准库的使用者带来很多便利。不过 Go 并非所有类型都是零值可用的,并且零值可用也是有一定限制的,比如:slice 的零值可用不能通过下标形式操作数据:

var s []ints[0] = 12 // 报错!s = append(s, 12) // OK

另外像 map 这样的内置类型也没有提供零值可用的支持:

var m map[string]intm["tonybai"] = 1 // 报错!var m map[string]intm = map[string]int{} //初始化mapm["tonybai"] = 1 //okm1 := make(map[string]intm1["tonybai"] = 1 // OK

另外零值可用的类型要注意尽量避免值拷贝:

var mu sync.Mutexmu1 := mu // Error: 避免值拷贝foo(mu) // Error: 避免值拷贝

我们可以通过指针方式传递类似 Mutex 这样的类型。

对于我们 Go 开发者而言, 保持与 Go 一致的理念, 给自定义的类型一个合理的零值, 并坚持保持自定义类型是零值可用的, 这样我们的 Go 代码会表现的更加符合 Go 惯用法。