原文地址:Golang 大杀器之性能剖析 PProfhtml
写了几吨代码,实现了几百个接口。功能测试也经过了,终于成功的部署上线了node
结果,性能不佳,什么鬼?😭git
想要进行性能优化,首先瞩目在 Go 自身提供的工具链来做为分析依据,本文将带你学习、使用 Go 后花园,涉及以下:github
pprof 是用于可视化和分析性能分析数据的工具golang
pprof 以 profile.proto 读取分析样本的集合,并生成报告以可视化并帮助分析数据(支持文本和图形报告)web
profile.proto 是一个 Protocol Buffer v3 的描述文件,它描述了一组 callstack 和 symbolization 信息, 做用是表示统计分析的一组采样的调用栈,是很常见的 stacktrace 配置文件格式性能优化
咱们将编写一个简单且有点问题的例子,用于基本的程序初步分析app
(1)demo.go,文件内容:函数
package main import ( "log" "net/http" _ "net/http/pprof" "github.com/EDDYCJY/go-pprof-example/data" ) func main() { go func() { for { log.Println(data.Add("https://github.com/EDDYCJY")) } }() http.ListenAndServe("0.0.0.0:6060", nil) }
(2)data/d.go,文件内容:工具
package data var datas []string func Add(str string) string { data := []byte(str) sData := string(data) datas = append(datas, sData) return sData }
运行这个文件,你的 HTTP 服务会多出 /debug/pprof 的 endpoint 可用于观察应用程序的状况
查看当前总览:访问 http://127.0.0.1:6060/debug/pprof/
/debug/pprof/ profiles: 0 block 5 goroutine 3 heap 0 mutex 9 threadcreate full goroutine stack dump
这个页面中有许多子页面,我们继续深究下去,看看能够获得什么?
$HOST/debug/pprof/profile
,默认进行 30s 的 CPU Profiling,获得一个分析用的 profile 文件$HOST/debug/pprof/block
,查看致使阻塞同步的堆栈跟踪$HOST/debug/pprof/goroutine
,查看当前全部运行的 goroutines 堆栈跟踪$HOST/debug/pprof/heap
,查看活动对象的内存分配状况$HOST/debug/pprof/mutex
,查看致使互斥锁的竞争持有者的堆栈跟踪$HOST/debug/pprof/threadcreate
,查看建立新OS线程的堆栈跟踪(1)go tool pprof http://localhost:6060/debug/pprof/profile?seconds=60
$ go tool pprof http://localhost:6060/debug/pprof/profile\?seconds\=60 Fetching profile over HTTP from http://localhost:6060/debug/pprof/profile?seconds=60 Saved profile in /Users/eddycjy/pprof/pprof.samples.cpu.007.pb.gz Type: cpu Duration: 1mins, Total samples = 26.55s (44.15%) Entering interactive mode (type "help" for commands, "o" for options) (pprof)
执行该命令后,需等待 60 秒(可调整 seconds 的值),pprof 会进行 CPU Profiling。结束后将默认进入 pprof 的交互式命令模式,能够对分析的结果进行查看或导出。具体可执行 pprof help
查看命令说明
(pprof) top10 Showing nodes accounting for 25.92s, 97.63% of 26.55s total Dropped 85 nodes (cum <= 0.13s) Showing top 10 nodes out of 21 flat flat% sum% cum cum% 23.28s 87.68% 87.68% 23.29s 87.72% syscall.Syscall 0.77s 2.90% 90.58% 0.77s 2.90% runtime.memmove 0.58s 2.18% 92.77% 0.58s 2.18% runtime.freedefer 0.53s 2.00% 94.76% 1.42s 5.35% runtime.scanobject 0.36s 1.36% 96.12% 0.39s 1.47% runtime.heapBitsForObject 0.35s 1.32% 97.44% 0.45s 1.69% runtime.greyobject 0.02s 0.075% 97.51% 24.96s 94.01% main.main.func1 0.01s 0.038% 97.55% 23.91s 90.06% os.(*File).Write 0.01s 0.038% 97.59% 0.19s 0.72% runtime.mallocgc 0.01s 0.038% 97.63% 23.30s 87.76% syscall.Write
最后一列为函数名称,在大多数的状况下,咱们能够经过这五列得出一个应用程序的运行状况,加以优化 🤔
(2)go tool pprof http://localhost:6060/debug/pprof/heap
$ go tool pprof http://localhost:6060/debug/pprof/heap Fetching profile over HTTP from http://localhost:6060/debug/pprof/heap Saved profile in /Users/eddycjy/pprof/pprof.alloc_objects.alloc_space.inuse_objects.inuse_space.008.pb.gz Type: inuse_space Entering interactive mode (type "help" for commands, "o" for options) (pprof) top Showing nodes accounting for 837.48MB, 100% of 837.48MB total flat flat% sum% cum cum% 837.48MB 100% 100% 837.48MB 100% main.main.func1
(3) go tool pprof http://localhost:6060/debug/pprof/block
(4) go tool pprof http://localhost:6060/debug/pprof/mutex
这是使人期待的一小节。在这以前,咱们须要简单的编写好测试用例来跑一下
(1)新建 data/d_test.go,文件内容:
package data import "testing" const url = "https://github.com/EDDYCJY" func TestAdd(t *testing.T) { s := Add(url) if s == "" { t.Errorf("Test.Add error!") } } func BenchmarkAdd(b *testing.B) { for i := 0; i < b.N; i++ { Add(url) } }
(2)执行测试用例
$ go test -bench=. -cpuprofile=cpu.prof pkg: github.com/EDDYCJY/go-pprof-example/data BenchmarkAdd-4 10000000 187 ns/op PASS ok github.com/EDDYCJY/go-pprof-example/data 2.300s
-memprofile 也能够了解一下
$ go tool pprof -http=:8080 cpu.prof
$ go tool pprof cpu.prof $ (pprof) web
若是出现 Could not execute dot; may need to install graphviz.
,就是提示你要安装 graphviz
了 (请右拐谷歌)
(1)Top
(2)Graph
框越大,线越粗表明它占用的时间越大哦
(3)Peek
(4)Source
经过 PProf 的可视化界面,咱们可以更方便、更直观的看到 Go 应用程序的调用链、使用状况等,而且在 View 菜单栏中,还支持如上多种方式的切换
你想一想,在烦恼不知道什么问题的时候,能用这些辅助工具来检测问题,是否是瞬间效率翻倍了呢 👌
另外一种可视化数据的方法是火焰图,需手动安装原生 PProf 工具:
(1) 安装 PProf
$ go get -u github.com/google/pprof
(2) 启动 PProf 可视化界面:
$ pprof -http=:8080 cpu.prof
(3) 查看 PProf 可视化界面
打开 PProf 的可视化界面时,你会明显发现比官方工具链的 PProf 精致一些,而且多了 Flame Graph(火焰图)
它就是本次的目标之一,它的最大优势是动态的。调用顺序由上到下(A -> B -> C -> D),每一块表明一个函数,越大表明占用 CPU 的时间更长。同时它也支持点击块深刻进行分析!
在本章节,粗略地介绍了 Go 的性能利器 PProf。在特定的场景中,PProf 给定位、剖析问题带了极大的帮助
但愿本文对你有所帮助,另外建议可以本身实际操做一遍,最好是能够深刻琢磨一下,内含大量的用法、知识点 🤓
你很优秀的看到了最后,那么有两道简单的思考题,但愿拓展你的思路
(1)flat 必定大于 cum 吗,为何?什么场景下 cum 会比 flat 大?
(2)本章节的 demo 代码,有什么性能问题?怎么解决它?
来,晒出你的想法!😆