golang杂耍大师混乱的笔记
本文截选至the way to go 中文版
从字符串中读取内容
函数 strings.NewReader(str)
用于生成一个 Reader
并读取字符串中的内容,然后返回指向该 Reader
的指针,从其它类型读取内容的函数还有:
Read()
从 []byte 中读取内容。ReadByte()
和ReadRune()
从字符串中读取下一个 byte 或者 rune。
字符串与其它类型的转换
与字符串相关的类型转换都是通过 strconv
包实现的。
该包包含了一些变量用于获取程序运行的操作系统平台下 int 类型所占的位数,如:strconv.IntSize
。
任何类型 T 转换为字符串总是成功的。
针对从数字类型转换到字符串,Go 提供了以下函数:
strconv.Itoa(i int) string
返回数字 i 所表示的字符串类型的十进制数。strconv.FormatFloat(f float64, fmt byte, prec int, bitSize int) string
将 64 位浮点型的数字转换为字符串,其中fmt
表示格式(其值可以是'b'
、'e'
、'f'
或'g'
),prec
表示精度,bitSize
则使用 32 表示 float32,用 64 表示 float64。
将字符串转换为其它类型 tp 并不总是可能的,可能会在运行时抛出错误 parsing "…": invalid argument
。
针对从字符串类型转换为数字类型,Go 提供了以下函数:
strconv.Atoi(s string) (i int, err error)
将字符串转换为 int 型。strconv.ParseFloat(s string, bitSize int) (f float64, err error)
将字符串转换为 float64 型。
利用多返回值的特性,这些函数会返回 2 个值,第 1 个是转换后的结果(如果转换成功),第 2 个是可能出现的错误,因此,我们一般使用以下形式来进行从字符串到其它类型的转换:
1 | val, err = strconv.Atoi(s) |
时间和日期
time
包为我们提供了一个数据类型 time.Time
(作为值使用)以及显示和测量时间和日期的功能函数。
当前时间可以使用 time.Now()
获取,或者使用 t.Day()
、t.Minute()
等等来获取时间的一部分;你甚至可以自定义时间格式化字符串,例如: fmt.Printf("%02d.%02d.%4d\n", t.Day(), t.Month(), t.Year())
将会输出 21.07.2011
。
Duration 类型表示两个连续时刻所相差的纳秒数,类型为 int64。Location 类型映射某个时区的时间,UTC 表示通用协调世界时间。
包中的一个预定义函数 func (t Time) Format(layout string) string
可以根据一个格式化字符串来将一个时间 t 转换为相应格式的字符串,你可以使用一些预定义的格式,如:time.ANSIC
或 time.RFC822
。
一般的格式化设计是通过对于一个标准时间的格式化描述来展现的,这听起来很奇怪,但看下面这个例子你就会一目了然:
1 | fmt.Println(t.Format("02 Jan 2006 15:04")) |
输出:
1 | 21 Jul 2011 10:31 |
其它有关时间操作的文档请参阅 官方文档
1 | package main |
输出的结果已经写在每行 //
的后面。
如果你需要在应用程序在经过一定时间或周期执行某项任务(事件处理的特例),则可以使用 time.After
或者 time.Ticker
另外,time.Sleep(d Duration)
可以实现对某个进程(实质上是 goroutine)时长为 d 的暂停。
测试多返回值函数的错误
Go 语言的函数经常使用两个返回值来表示执行是否成功:返回某个值以及 true 表示成功;返回零值(或 nil)和 false 表示失败(第 4.4 节)。当不使用 true 或 false 的时候,也可以使用一个 error 类型的变量来代替作为第二个返回值:成功执行的话,error 的值为 nil,否则就会包含相应的错误信息(Go 语言中的错误类型为 error: var err error
,我们将会在第 13 章进行更多地讨论)。这样一来,就很明显需要用一个 if 语句来测试执行结果;由于其符号的原因,这样的形式又称之为 comma,ok 模式(pattern)。
在第 4.7 节的程序 string_conversion.go
中,函数 strconv.Atoi
的作用是将一个字符串转换为一个整数。之前我们忽略了相关的错误检查:
1 | anInt, _ = strconv.Atoi(origStr) |
如果 origStr 不能被转换为整数,anInt 的值会变成 0 而 _
无视了错误,程序会继续运行。
这样做是非常不好的:程序应该在最接近的位置检查所有相关的错误,至少需要暗示用户有错误发生并对函数进行返回,甚至中断程序。
我们在第二个版本中对代码进行了改进:
1 | package main |
这是测试 err 变量是否包含一个真正的错误(if err != nil
)的习惯用法。如果确实存在错误,则会打印相应的错误信息然后通过 return 提前结束函数的执行。我们还可以使用携带返回值的 return 形式,例如 return err
。这样一来,函数的调用者就可以检查函数执行过程中是否存在错误了。
习惯用法
1 | value, err := pack1.Function1(param1) |
由于本例的函数调用者属于 main 函数,所以程序会直接停止运行。
如果我们想要在错误发生的同时终止程序的运行,我们可以使用 os
包的 Exit
函数:
习惯用法
1 | if err != nil { |
(此处的退出代码 1 可以使用外部脚本获取到)
有时候,你会发现这种习惯用法被连续重复地使用在某段代码中。
当没有错误发生时,代码继续运行就是唯一要做的事情,所以 if 语句块后面不需要使用 else 分支。
示例 2:我们尝试通过 os.Open
方法打开一个名为 name
的只读文件:
1 | f, err := os.Open(name) |
示例 3:可以将错误的获取放置在 if 语句的初始化部分:
习惯用法
1 | if err := file.Chmod(0664); err != nil { |
示例 4:或者将 ok-pattern 的获取放置在 if 语句的初始化部分,然后进行判断:
习惯用法
1 | if value, ok := readData(); ok { |
注意事项
如果您像下面一样,没有为多返回值的函数准备足够的变量来存放结果:
1 | func mySqrt(f float64) (v float64, ok bool) { |
您会得到一个编译错误:multiple-value mySqrt() in single-value context
。
正确的做法是:
1 | t, ok := mySqrt(25.0) |
注意事项 2
当您将字符串转换为整数时,且确定转换一定能够成功时,可以将 Atoi
函数进行一层忽略错误的封装:
1 | func atoi (s string) (n int) { |
实际上,fmt
包最简单的打印函数也有 2 个返回值:
1 | count, err := fmt.Println(x) // number of bytes printed, nil or 0, error |
当打印到控制台时,可以将该函数返回的错误忽略;但当输出到文件流、网络流等具有不确定因素的输出对象时,应该始终检查是否有错误发生
or-range 结构
这是 Go 特有的一种的迭代结构,您会发现它在许多情况下都非常有用。它可以迭代任何一个集合(包括数组和 map,详见第 7 和 8 章)。语法上很类似其它语言中 foreach 语句,但您依旧可以获得每次迭代所对应的索引。一般形式为:for ix, val := range coll { }
。
要注意的是,val
始终为集合中对应索引的值拷贝,因此它一般只具有只读性质,对它所做的任何修改都不会影响到集合中原有的值(译者注:如果 val
为指针,则会产生指针的拷贝,依旧可以修改集合中的原值)。一个字符串是 Unicode 编码的字符(或称之为 rune
)集合,因此您也可以用它迭代字符串:
1 | for pos, char := range str { |
每个 rune 字符和索引在 for-range 循环中是一一对应的。它能够自动根据 UTF-8 规则识别 Unicode 编码的字符。
1 | package main |
输出:
1 | The length of str is: 27 |
请将输出结果和进行对比。
我们可以看到,常用英文字符使用 1 个字节表示,而汉字(严格来说,“Chinese: 日本語”的Chinese应该是Japanese**)使用 3 个字符表示。
命名的返回值(named return variables)
如下 里的函数带有一个 int
参数,返回两个 int
值;其中一个函数的返回值在函数调用时就已经被赋予了一个初始零值。
getX2AndX3
与 getX2AndX3_2
两个函数演示了如何使用非命名返回值与命名返回值的特性。当需要返回多个非命名返回值时,需要使用 ()
把它们括起来,比如 (int, int)
。
命名返回值作为结果形参(result parameters)被初始化为相应类型的零值,当需要返回的时候,我们只需要一条简单的不带参数的return语句。需要注意的是,即使只有一个命名返回值,也需要使用 ()
括起来
1 | package main |
输出结果:
1 | num = 10, 2x num = 20, 3x num = 30 |
警告:
- return 或 return var 都是可以的。
- 不过
return var = expression
(表达式) 会引发一个编译错误:syntax error: unexpected =, expecting semicolon or newline or }
。
即使函数使用了命名返回值,你依旧可以无视它而返回明确的值。
任何一个非命名返回值(使用非命名返回值是很糟的编程习惯)在 return
语句里面都要明确指出包含返回值的变量或是一个可计算的值(就像上面警告所指出的那样)。
尽量使用命名返回值:会使代码更清晰、更简短,同时更加容易读懂。
改变外部变量(outside variable)
传递指针给函数不但可以节省内存(因为没有复制变量的值),而且赋予了函数直接修改外部变量的能力,所以被修改的变量不再需要使用 return
返回。如下的例子,reply
是一个指向 int
变量的指针,通过这个指针,我们在函数内修改了这个 int
变量的数值。
1 | package main |
这仅仅是个指导性的例子,当需要在函数内改变一个占用内存比较大的变量时,性能优势就更加明显了。然而,如果不小心使用的话,传递一个指针很容易引发一些不确定的事,所以,我们要十分小心那些可以改变外部变量的函数,在必要时,需要添加注释以便其他人能够更加清楚的知道函数里面到底发生了什么。
defer 和追踪
关键字 defer 允许我们推迟到函数返回之前(或任意位置执行 return
语句之后)一刻才执行某个语句或函数(为什么要在返回之后才执行这些语句?因为 return
语句同样可以包含一些操作,而不是单纯地返回某个值)。
关键字 defer 的用法类似于面向对象编程语言 Java 和 C# 的 finally
语句块,它一般用于释放某些已分配的资源。
1 | package main |
输出:
1 | In Function1 at the top |
请将 defer 关键字去掉并对比输出结果。
使用 defer 的语句同样可以接受参数,下面这个例子就会在执行 defer 语句时打印 0
:
1 | func a() { |
当有多个 defer 行为被注册时,它们会以逆序执行(类似栈,即后进先出):
1 | func f() { |
上面的代码将会输出:4 3 2 1 0
。
关键字 defer 允许我们进行一些函数执行完成后的收尾工作,例如:
- 关闭文件流
1 | // open a file |
- 解锁一个加锁的资源
1 | mu.Lock() |
- 打印最终报告
1 | printHeader() |
- 关闭数据库链接
1 | // open a database connection |
合理使用 defer 语句能够使得代码更加简洁。
以下代码模拟了上面描述的第 4 种情况:
1 | package main |
输出:
1 | ok, connected to db |
使用 defer 语句实现代码追踪
一个基础但十分实用的实现代码执行追踪的方案就是在进入和离开某个函数打印相关的消息,即可以提炼为下面两个函数:
1 | func trace(s string) { fmt.Println("entering:", s) } |
以下代码展示了何时调用这两个函数:
1 | package main |
输出:
1 | entering: b |
上面的代码还可以修改为更加简便的版本
1 | package main |
使用 defer 语句来记录函数的参数与返回值
下面的代码展示了另一种在调试时使用 defer 语句的手法:
1 | package main |
输出:
1 | Output: 2011/10/04 10:46:11 func1("Go") = 7, EOF |
将函数作为参数
函数可以作为其它函数的参数进行传递,然后在其它函数内调用执行,一般称之为回调。下面是一个将函数作为参数的简单例子(function_parameter.go):
1 | package main |
输出:
1 | The sum of 1 and 2 is: 3 |
将函数作为返回值
在程序 function_return.go
中我们将会看到函数 Add2 和 Adder 均会返回签名为 func(b int) int
的函数:
1 | func Add2() (func(b int) int) |
函数 Add2 不接受任何参数,但函数 Adder 接受一个 int 类型的整数作为参数。
我们也可以将 Adder 返回的函数存到变量中(function_return.go)。
1 | package main |
输出:
1 | Call Add2 for 3 gives: 5 |
下例为一个略微不同的实现(function_closure.go):
1 | package main |
函数 Adder() 现在被赋值到变量 f 中(类型为 func(int) int
)。
输出:
1 | 1 - 21 - 321 |
三次调用函数 f 的过程中函数 Adder() 中变量 delta 的值分别为:1、20 和 300。
我们可以看到,在多次调用中,变量 x 的值是被保留的,即 0 + 1 = 1
,然后 1 + 20 = 21
,最后 21 + 300 = 321
:闭包函数保存并积累其中的变量的值,不管外部函数退出与否,它都能够继续操作外部函数中的局部变量。
这些局部变量同样可以是参数,例如之前例子中的 Adder(as int)
。
这些例子清楚地展示了如何在 Go 语言中使用闭包。
在闭包中使用到的变量可以是在闭包函数体内声明的,也可以是在外部函数声明的:
1 | var g int |
这样闭包函数就能够被应用到整个集合的元素上,并修改它们的值。然后这些变量就可以用于表示或计算全局或平均值。
通过内存缓存来提升性能
当在进行大量的计算时,提升性能最直接有效的一种方式就是避免重复计算。通过在内存中缓存和重复利用相同计算的结果,称之为内存缓存。最明显的例子就是生成斐波那契数列的程序(详见第 6.6 和 6.11 节):
要计算数列中第 n 个数字,需要先得到之前两个数的值,但很明显绝大多数情况下前两个数的值都是已经计算过的。即每个更后面的数都是基于之前计算结果的重复计算。
而我们要做就是将第 n 个数的值存在数组中索引为 n 的位置(详见第 7 章),然后在数组中查找是否已经计算过,如果没有找到,则再进行计算。
程序 Listing 6.17 - fibonacci_memoization.go 就是依照这个原则实现的,下面是计算到第 40 位数字的性能对比:
- 普通写法:4.730270 秒
- 内存缓存:0.001000 秒
内存缓存的优势显而易见,而且您还可以将它应用到其它类型的计算中,例如使用 map(详见第 7 章)而不是数组或切片:
1 | package main |
内存缓存的技术在使用计算成本相对昂贵的函数时非常有用(不仅限于例子中的递归),譬如大量进行相同参数的运算。这种技术还可以应用于纯函数中,即相同输入必定获得相同输出的函数。
声明、初始化和 make
概念
map 是引用类型,可以使用如下声明:
1 | var map1 map[keytype]valuetype |
([keytype]
和 valuetype
之间允许有空格,但是 gofmt 移除了空格)
在声明的时候不需要知道 map 的长度,map 是可以动态增长的。
未初始化的 map 的值是 nil。
key 可以是任意可以用 == 或者 != 操作符比较的类型,比如 string、int、float。所以数组、切片和结构体不能作为 key (译者注:含有数组切片的结构体不能作为 key,只包含内建类型的 struct 是可以作为 key 的),但是指针和接口类型可以。如果要用结构体作为 key 可以提供 Key()
和 Hash()
方法,这样可以通过结构体的域计算出唯一的数字或者字符串的 key。
value 可以是任意类型的;通过使用空接口类型(详见第 11.9 节),我们可以存储任意值,但是使用这种类型作为值时需要先做一次类型断言(详见第 11.3 节)。
map 传递给函数的代价很小:在 32 位机器上占 4 个字节,64 位机器上占 8 个字节,无论实际上存储了多少数据。通过 key 在 map 中寻找值是很快的,比线性查找快得多,但是仍然比从数组和切片的索引中直接读取要慢 100 倍;所以如果你很在乎性能的话还是建议用切片来解决问题。
map 也可以用函数作为自己的值,这样就可以用来做分支结构(详见第 5 章):key 用来选择要执行的函数。
如果 key1 是 map1 的key,那么 map1[key1]
就是对应 key1 的值,就如同数组索引符号一样(数组可以视为一种简单形式的 map,key 是从 0 开始的整数)。
key1 对应的值可以通过赋值符号来设置为 val1:map1[key1] = val1
。
令 v := map1[key1]
可以将 key1 对应的值赋值给 v;如果 map 中没有 key1 存在,那么 v 将被赋值为 map1 的值类型的空值。
常用的 len(map1)
方法可以获得 map 中的 pair 数目,这个数目是可以伸缩的,因为 map-pairs 在运行时可以动态添加和删除。
示例 8.1 make_maps.go
1 | package main |
输出结果:
1 | Map literal at "one" is: 1 |
mapLit 说明了 map literals
的使用方法: map 可以用 {key1: val1, key2: val2}
的描述方法来初始化,就像数组和结构体一样。
map 是 引用类型 的: 内存用 make 方法来分配。
map 的初始化:var map1 = make(map[keytype]valuetype)
。
或者简写为:map1 := make(map[keytype]valuetype)
。
上面例子中的 mapCreated 就是用这种方式创建的:mapCreated := make(map[string]float32)
。
相当于:mapCreated := map[string]float32{}
。
mapAssigned 也是 mapList 的引用,对 mapAssigned 的修改也会影响到 mapLit 的值。
不要使用 new,永远用 make 来构造 map
注意 如果你错误的使用 new() 分配了一个引用对象,你会获得一个空引用的指针,相当于声明了一个未初始化的变量并且取了它的地址:
1 | mapCreated := new(map[string]float32) |
接下来当我们调用:mapCreated["key1"] = 4.5
的时候,编译器会报错:
1 | invalid operation: mapCreated["key1"] (index of type *map[string]float32). |
为了说明值可以是任意类型的,这里给出了一个使用 func() int
作为值的 map:
1 | package main |
输出结果为:map[1:0x10903be0 5:0x10903ba0 2:0x10903bc0]
: 整形都被映射到函数地址。
map 容量
和数组不同,map 可以根据新增的 key-value 对动态的伸缩,因此它不存在固定长度或者最大限制。但是你也可以选择标明 map 的初始容量 capacity
,就像这样:make(map[keytype]valuetype, cap)
。例如:
1 | map2 := make(map[string]float32, 100) |
当 map 增长到容量上限的时候,如果再增加新的 key-value 对,map 的大小会自动加 1。所以出于性能的考虑,对于大的 map 或者会快速扩张的 map,即使只是大概知道容量,也最好先标明。
这里有一个 map 的具体例子,即将音阶和对应的音频映射起来:
1 | noteFrequency := map[string]float32 { |
用切片作为 map 的值
既然一个 key 只能对应一个 value,而 value 又是一个原始类型,那么如果一个 key 要对应多个值怎么办?例如,当我们要处理unix机器上的所有进程,以父进程(pid 为整形)作为 key,所有的子进程(以所有子进程的 pid 组成的切片)作为 value。通过将 value 定义为 []int
类型或者其他类型的切片,就可以优雅的解决这个问题。
这里有一些定义这种 map 的例子:
1 | mp1 := make(map[int][]int) |
切片
7.2.1 概念
切片(slice)是对数组一个连续片段的引用(该数组我们称之为相关数组,通常是匿名的),所以切片是一个引用类型(因此更类似于 C/C++ 中的数组类型,或者 Python 中的 list 类型)。这个片段可以是整个数组,或者是由起始和终止索引标识的一些项的子集。需要注意的是,终止索引标识的项不包括在切片内。切片提供了一个相关数组的动态窗口。
切片是可索引的,并且可以由 len()
函数获取长度。
给定项的切片索引可能比相关数组的相同元素的索引小。和数组不同的是,切片的长度可以在运行时修改,最小为 0 最大为相关数组的长度:切片是一个 长度可变的数组。
切片提供了计算容量的函数 cap()
可以测量切片最长可以达到多少:它等于切片的长度 + 数组除切片之外的长度。如果 s 是一个切片,cap(s)
就是从 s[0]
到数组末尾的数组长度。切片的长度永远不会超过它的容量,所以对于 切片 s 来说该不等式永远成立:0 <= len(s) <= cap(s)
。
多个切片如果表示同一个数组的片段,它们可以共享数据;因此一个切片和相关数组的其他切片是共享存储的,相反,不同的数组总是代表不同的存储。数组实际上是切片的构建块。
优点 因为切片是引用,所以它们不需要使用额外的内存并且比使用数组更有效率,所以在 Go 代码中 切片比数组更常用。
声明切片的格式是: var identifier []type
(不需要说明长度)。
一个切片在未初始化之前默认为 nil,长度为 0。
切片的初始化格式是:var slice1 []type = arr1[start:end]
。
这表示 slice1 是由数组 arr1 从 start 索引到 end-1
索引之间的元素构成的子集(切分数组,start:end 被称为 slice 表达式)。所以 slice1[0]
就等于 arr1[start]
。这可以在 arr1 被填充前就定义好。
如果某个人写:var slice1 []type = arr1[:]
那么 slice1 就等于完整的 arr1 数组(所以这种表示方式是 arr1[0:len(arr1)]
的一种缩写)。另外一种表述方式是:slice1 = &arr1
。
arr1[2:]
和 arr1[2:len(arr1)]
相同,都包含了数组从第三个到最后的所有元素。
arr1[:3]
和 arr1[0:3]
相同,包含了从第一个到第三个元素(不包括第四个)。
如果你想去掉 slice1 的最后一个元素,只要 slice1 = slice1[:len(slice1)-1]
。
一个由数字 1、2、3 组成的切片可以这么生成:s := [3]int{1,2,3}[:]
(注: 应先用s := [3]int{1, 2, 3}
生成数组, 再使用s[:]
转成切片) 甚至更简单的 s := []int{1,2,3}
。
s2 := s[:]
是用切片组成的切片,拥有相同的元素,但是仍然指向相同的相关数组。
一个切片 s 可以这样扩展到它的大小上限:s = s[:cap(s)]
,如果再扩大的话就会导致运行时错误(参见第 7.7 节)。
对于每一个切片(包括 string),以下状态总是成立的:
1 | s == s[:i] + s[i:] // i是一个整数且: 0 <= i <= len(s) |
切片也可以用类似数组的方式初始化:var x = []int{2, 3, 5, 7, 11}
。这样就创建了一个长度为 5 的数组并且创建了一个相关切片。
切片在内存中的组织方式实际上是一个有 3 个域的结构体:指向相关数组的指针,切片长度以及切片容量。下图给出了一个长度为 2,容量为 4 的切片y。
y[0] = 3
且y[1] = 5
。- 切片
y[0:4]
由 元素 3,5,7 和 11 组成。
示例 7.7 array_slices.go
1 | package main |
输出:
1 | Slice at 0 is 2 |
如果 s2 是一个 slice,你可以将 s2 向后移动一位 s2 = s2[1:]
,但是末尾没有移动。切片只能向后移动,s2 = s2[-1:]
会导致编译错误。切片不能被重新分片以获取数组的前一个元素。
注意 绝对不要用指针指向 slice。切片本身已经是一个引用类型,所以它本身就是一个指针!!
问题 7.2: 给定切片 b:= []byte{'g', 'o', 'l', 'a', 'n', 'g'}
,那么 b[1:4]
、b[:2]
、b[2:]
和 b[:]
分别是什么?
7.2.2 将切片传递给函数
如果你有一个函数需要对数组做操作,你可能总是需要把参数声明为切片。当你调用该函数时,把数组分片,创建为一个 切片引用并传递给该函数。这里有一个计算数组元素和的方法:
1 | func sum(a []int) int { |
7.2.3 用 make() 创建一个切片
当相关数组还没有定义时,我们可以使用 make() 函数来创建一个切片 同时创建好相关数组:var slice1 []type = make([]type, len)
。
也可以简写为 slice1 := make([]type, len)
,这里 len
是数组的长度并且也是 slice
的初始长度。
所以定义 s2 := make([]int, 10)
,那么 cap(s2) == len(s2) == 10
。
make 接受 2 个参数:元素的类型以及切片的元素个数。
如果你想创建一个 slice1,它不占用整个数组,而只是占用以 len 为个数个项,那么只要:slice1 := make([]type, len, cap)
。
make 的使用方式是:func make([]T, len, cap)
,其中 cap 是可选参数。
所以下面两种方法可以生成相同的切片:
1 | make([]int, 50, 100) |
下图描述了使用 make 方法生成的切片的内存结构:[
1 | package main |
输出:
1 | Slice at 0 is 0 |
因为字符串是纯粹不可变的字节数组,它们也可以被切分成 切片。
练习 7.4: fobinacci_funcarray.go: 为练习 7.3 写一个新的版本,主函数调用一个使用序列个数作为参数的函数,该函数返回一个大小为序列个数的 Fibonacci 切片。
7.2.4 new() 和 make() 的区别
看起来二者没有什么区别,都在堆上分配内存,但是它们的行为不同,适用于不同的类型。
- new(T) 为每个新的类型T分配一片内存,初始化为 0 并且返回类型为*T的内存地址:这种方法 返回一个指向类型为 T,值为 0 的地址的指针,它适用于值类型如数组和结构体(参见第 10 章);它相当于
&T{}
。 - make(T) 返回一个类型为 T 的初始值,它只适用于3种内建的引用类型:切片、map 和 channel(参见第 8 章,第 13 章)。
换言之,new 函数分配内存,make 函数初始化;下图给出了区别:
在图 7.3 的第一幅图中:
1 | var p *[]int = new([]int) // *p == nil; with len and cap 0 |
在第二幅图中, p := make([]int, 0)
,切片 已经被初始化,但是指向一个空的数组。
以上两种方式实用性都不高。下面的方法:
1 | var v []int = make([]int, 10, 50) |
或者
1 | v := make([]int, 10, 50) |
这样分配一个有 50 个 int 值的数组,并且创建了一个长度为 10,容量为 50 的 切片 v,该 切片 指向数组的前 10 个元素。
问题 7.3 给定 s := make([]byte, 5)
,len(s) 和 cap(s) 分别是多少?s = s[2:4]
,len(s) 和 cap(s) 又分别是多少?
问题 7.4 假设 s1 := []byte{'p', 'o', 'e', 'm'}
且 s2 := s1[2:]
,s2 的值是多少?如果我们执行 s2[1] = 't'
,s1 和 s2 现在的值又分别是多少?
译者注:如何理解new、make、slice、map、channel的关系
1.slice、map以及channel都是golang内建的一种引用类型,三者在内存中存在多个组成部分, 需要对内存组成部分初始化后才能使用,而make就是对三者进行初始化的一种操作方式
2. new 获取的是存储指定变量内存地址的一个变量,对于变量内部结构并不会执行相应的初始化操作, 所以slice、map、channel需要make进行初始化并获取对应的内存地址,而非new简单的获取内存地址
7.2.5 多维 切片
和数组一样,切片通常也是一维的,但是也可以由一维组合成高维。通过分片的分片(或者切片的数组),长度可以任意动态变化,所以 Go 语言的多维切片可以任意切分。而且,内层的切片必须单独分配(通过 make 函数)。
7.2.6 bytes 包
类型 []byte
的切片十分常见,Go 语言有一个 bytes 包专门用来解决这种类型的操作方法。
bytes 包和字符串包十分类似(参见第 4.7 节)。而且它还包含一个十分有用的类型 Buffer:
1 | import "bytes" |
这是一个长度可变的 bytes 的 buffer,提供 Read 和 Write 方法,因为读写长度未知的 bytes 最好使用 buffer。
Buffer 可以这样定义:var buffer bytes.Buffer
。
或者使用 new 获得一个指针:var r *bytes.Buffer = new(bytes.Buffer)
。
或者通过函数:func NewBuffer(buf []byte) *Buffer
,创建一个 Buffer 对象并且用 buf 初始化好;NewBuffer 最好用在从 buf 读取的时候使用。
通过 buffer 串联字符串
类似于 Java 的 StringBuilder 类。
在下面的代码段中,我们创建一个 buffer,通过 buffer.WriteString(s)
方法将字符串 s 追加到后面,最后再通过 buffer.String()
方法转换为 string:
1 | var buffer bytes.Buffer |
这种实现方式比使用 +=
要更节省内存和 CPU,尤其是要串联的字符串数目特别多的时候。
修改字符串中的某个字符
Go 语言中的字符串是不可变的,也就是说 str[index]
这样的表达式是不可以被放在等号左侧的。如果尝试运行 str[i] = 'D'
会得到错误:cannot assign to str[i]
。
因此,您必须先将字符串转换成字节数组,然后再通过修改数组中的元素值来达到修改字符串的目的,最后将字节数组转换回字符串格式。
例如,将字符串 “hello” 转换为 “cello”:
1 | s := "hello" |
所以,您可以通过操作切片来完成对字符串的操作。
7.6.5 字节数组对比函数
下面的 Compare
函数会返回两个字节数组字典顺序的整数对比结果,即 0 if a == b, -1 if a < b, 1 if a > b
。
1 | func Compare(a, b[]byte) int { |
搜索及排序切片和数组
标准库提供了 sort
包来实现常见的搜索和排序操作。您可以使用 sort
包中的函数 func Ints(a []int)
来实现对 int 类型的切片排序。例如 sort.Ints(arri)
,其中变量 arri 就是需要被升序排序的数组或切片。为了检查某个数组是否已经被排序,可以通过函数 IntsAreSorted(a []int) bool
来检查,如果返回 true 则表示已经被排序。
类似的,可以使用函数 func Float64s(a []float64)
来排序 float64 的元素,或使用函数 func Strings(a []string)
排序字符串元素。
想要在数组或切片中搜索一个元素,该数组或切片必须先被排序(因为标准库的搜索算法使用的是二分法)。然后,您就可以使用函数 func SearchInts(a []int, n int) int
进行搜索,并返回对应结果的索引值。
当然,还可以搜索 float64 和字符串:
1 | func SearchFloat64s(a []float64, x float64) int |
您可以通过查看 官方文档 来获取更详细的信息。
这就是如何使用 sort
包的方法,我们会在第 11.6 节对它的细节进行深入,并实现一个属于我们自己的版本。
append 函数常见操作
我们在第 7.5 节提到的 append 非常有用,它能够用于各种方面的操作:
-
将切片 b 的元素追加到切片 a 之后:
a = append(a, b...)
-
复制切片 a 的元素到新的切片 b 上:
1
2b = make([]T, len(a))
copy(b, a) -
删除位于索引 i 的元素:
a = append(a[:i], a[i+1:]...)
-
切除切片 a 中从索引 i 至 j 位置的元素:
a = append(a[:i], a[j:]...)
-
为切片 a 扩展 j 个元素长度:
a = append(a, make([]T, j)...)
-
在索引 i 的位置插入元素 x:
a = append(a[:i], append([]T{x}, a[i:]...)...)
-
在索引 i 的位置插入长度为 j 的新切片:
a = append(a[:i], append(make([]T, j), a[i:]...)...)
-
在索引 i 的位置插入切片 b 的所有元素:
a = append(a[:i], append(b, a[i:]...)...)
-
取出位于切片 a 最末尾的元素 x:
x, a = a[len(a)-1], a[:len(a)-1]
-
将元素 x 追加到切片 a:
a = append(a, x)
因此,您可以使用切片和 append 操作来表示任意可变长度的序列。
从数学的角度来看,切片相当于向量,如果需要的话可以定义一个向量作为切片的别名来进行操作。