如何在 Go 开发中高效而又快速地生成随机数呢?相信大家首先想到的就是使用标准库自带的 math/rand 包,或者使用开源的第三方包(比如 github.com/valyala/fastrand)来实现。

Go 运行时自带了 runtime.fastrand 函数来生成随机数,并且在标准库实现和运行时大量使用该函数。由于该函数为非导出,所以不能直接使用,这里就要借助上篇博客介绍过的黑科技//go:指令来实现了。

Uint32方法

首先我们创建文件 randx.go:

1
2
3
4
5
6
package randx

import _ "unsafe"

//go:linkname Uint32 runtime.fastrand
func Uint32() uint32

这里我们使用了 //go:linkname 指令来使用 runtime.fastrand。对,就这么简单。

当然也要跑个 benchmark 比较下性能,创建 randx_test.go:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
package randx

import (
	"fmt"
	"math/rand"
	"testing"

	"github.com/valyala/fastrand"
)

func BenchmarkMathRandUint32(b *testing.B) {
	b.RunParallel(func(p *testing.PB) {
		for p.Next() {
			_ = rand.Uint32()
		}
	})
}

func BenchmarkValyalaFastrandUint32(b *testing.B) {
	b.RunParallel(func(p *testing.PB) {
		for p.Next() {
			_ = fastrand.Uint32()
		}
	})
}

func BenchmarkRandxUint32(b *testing.B) {
	b.RunParallel(func(p *testing.PB) {
		for p.Next() {
			_ = Uint32()
		}
	})
}

go test -benchmem -run=^$ examples/randx -bench ^(BenchmarkMathRandUint32|BenchmarkValyalaFastrandUint32|BenchmarkRandxUint32)$ -v -count=3

goos: darwin
goarch: amd64
pkg: examples/randx
BenchmarkMathRandUint32
BenchmarkMathRandUint32-4          	12069022	        99.4 ns/op	       0 B/op	       0 allocs/op
BenchmarkMathRandUint32-4          	16135767	       102 ns/op	       0 B/op	       0 allocs/op
BenchmarkMathRandUint32-4          	15315223	        79.9 ns/op	       0 B/op	       0 allocs/op
BenchmarkValyalaFastrandUint32
BenchmarkValyalaFastrandUint32-4   	89770212	        15.9 ns/op	       0 B/op	       0 allocs/op
BenchmarkValyalaFastrandUint32-4   	96881473	        13.3 ns/op	       0 B/op	       0 allocs/op
BenchmarkValyalaFastrandUint32-4   	74856798	        20.4 ns/op	       0 B/op	       0 allocs/op
BenchmarkRandxUint32
BenchmarkRandxUint32-4             	543834252	         1.85 ns/op	       0 B/op	       0 allocs/op
BenchmarkRandxUint32-4             	670786326	         2.26 ns/op	       0 B/op	       0 allocs/op
BenchmarkRandxUint32-4             	682215212	         2.23 ns/op	       0 B/op	       0 allocs/op
PASS
ok  	examples/randx	15.871s

通过压测结果对比,可以明显看出runtime.fastrand的性能是碾压式的。

关于runtime.fastrand的源码实现,感兴趣的朋友可以继续研究下,源码地址戳这

Uint32n方法

Uint32 实现方式类似:

1
2
//go:linkname Uint32n runtime.fastrandn
func Uint32n(max uint32) uint32

看下 runtime.fastrandn 源码实现:

1
2
3
4
5
func fastrandn(n uint32) uint32 {
	// 类似于fastrand() % n, 但是更快
	// 参考连接:https://lemire.me/blog/2016/06/27/a-fast-alternative-to-the-modulo-reduction/
	return uint32(uint64(fastrand()) * uint64(n) >> 32)
}

小结

通过借助 //go:指令来使用 runtime 库自带的非导出方法,从而实现超高性能的随机数生成器。

另外,也复习了强大的 //go: 指令使用方式,在一些特殊场景下灵活运用该工具可以达到出乎意料的效果。

最后,想说的就是 Go 源码里面的宝藏还是很多的,值得深挖。