本文以leetcode的一题为例来说解如何经过PProf来优化咱们的程序,题目以下:Longest Substring Without Repeating Charactersgit
func lengthOfNonRepeatingSubStr(s string) int {
lastOccurred := make(map[rune]int)
start := 0
maxLength := 0
for i, ch := range []rune(s) {
if lastI, ok := lastOccurred[ch]; ok && lastI >= start {
start = lastI + 1
}
if i-start+1 > maxLength {
maxLength = i - start + 1
}
lastOccurred[ch] = i
}
return maxLength
}
复制代码
性能检测可知 200次, 花费时间 6970790 ns/op github
go test -bench . -cpuprofile cpu.out //首先生成cpuprofile文件
go tool pprof -http=:8080 ./启动 PProf 可视化界面 分析cpu.out文件
复制代码
经过访问 http://localhost:8080/ui/ 能够查看到以下页面golang
能够看到主要消耗时间在2大块,一个是mapaccess,mapassign,还有一块是decoderune。 decoderune主要是对UFT8字符的解码,将字符串转换成 []rune(s)
这个是不能避免的。因此主要去解决map的访问和赋值问题,也就是代码中的lastOccurred
bash
因为map须要进行算hash 判重,分配空间等操做会致使操做慢下来,解决思路就是用空间换时间,经过slice来替换map.微信
修改后的代码以下:函数
func lengthOfNonRepeatingSubStr2(s string) int {
lastOccurred := make([]int, 0xffff)
//赋给一个初始值
for i := range lastOccurred {
lastOccurred[i] = -1
}
start := 0
maxLength := 0
for i, ch := range []rune(s) {
if lastI := lastOccurred[ch]; lastI != -1 && lastI >= start {
start = lastI + 1
}
if i-start+1 > maxLength {
maxLength = i - start + 1
}
lastOccurred[ch] = i
}
return maxLength
}
复制代码
性能检测可知 500, 花费时间 2578859 ns/op。 相比以前的6970790 ns/op 已经又很大的优化了性能
经过pprof查看除了decoderune外还有一部分时间花费在makeslice上面,这是因为每次调用函数都要makeslicke,能够slice移到函数外面进行声明。具体能够本身操做下,而后查看下pprof图上面的makeslice是否有消除。优化
PProf具使用可查看 Golang 大杀器之性能剖析 PProfui
本文亦在微信公众号【小道资讯】发布,欢迎扫码关注! spa