Go 語言性能測試
本文來學習一下如何進行 Go 語言的性能測試。這里需要學習一個 Go 語言官方提供的工具 pprof:
- runtime/pprof:采集程序(非 Server)的運行數(shù)據(jù)進行分析;
- net/http/pprof:采集 HTTP Server 的運行時數(shù)據(jù)進行分析。
上述兩個包的底層實現(xiàn)是一樣的,一般建議直接在主函數(shù)上加上 http 服務而使用第二個包,畢竟可視化顯示易于觀察和操作。故本文僅介紹 net/http/pprof
的用法。
1. pprof 使用方法
直接在程序入口,也就是 main 函數(shù)所在的文件中導入 pprof。
import _ "net/http/pprof"
示例代碼如下:
package main
import (
"fmt"
"net/http"
_ "net/http/pprof"
"time"
)
func main() {
//打印數(shù)字
go printNum()
//打印字符
go printChar()
http.ListenAndServe("0.0.0.0:9300", nil)//啟動一個服務用于查看性能分析可視化頁面
}
func printChar() {
for i := '0'; ; i++ {
fmt.Println("printChar:", string(i))
time.Sleep(time.Second)
}
}
func printNum() {
for i := 0; ; i++ {
fmt.Println("printNum:", i)
time.Sleep(time.Second)
}
}
上述代碼啟動,pprof 會在這個服務上自動創(chuàng)建路由:
debug/pprof/
在瀏覽器中輸入127.0.0.1:9300/debug/pprof/
,會出現(xiàn)如下頁面:
這個路由下還有幾個子頁面:
- allocs:內(nèi)存分配情況;
- block:獲取導致阻塞的 goroutine 堆棧(如 channel, mutex 等);
- cmdline:當前程序激活的命令行啟動參數(shù);
- goroutine:當前當前運行的 goroutine 的堆棧信息;
- heap:存活對象的內(nèi)存分配情況;
- mutex :互斥鎖的競爭持有者的堆棧跟蹤;
- profile:默認進行 30s 的 CPU Profiling,得到一個分析用的 profile 文件;
- threadcreate:操作系統(tǒng)線程跟蹤;
- trace:得到一個分析用的 trace 文件。
2. 使用工具分析 profile 和 trace
當在127.0.0.1:9300/debug/pprof/
中點擊 profile 和 trace 時會分別得到一個文件,我們可以使用 Go 語言自帶的工具對這兩個文件進行解析。在解析之前,需要編譯得到程序代碼的可執(zhí)行文件,配合分析文件使用。
2.1 解析 profile
使用如下命令行進入解析頁面:
go tool pprof .\firstgo.exe .\profile
執(zhí)行結(jié)果:
如上如所示,我們進入了 pprof 的命令行界面,可以輸入top
來查看前 10 行數(shù)的 CPU 占用情況:
- flat:采樣頻率(10ms);
- flat%:采樣頻率(10ms)下,CPU 運行耗時總比例;
- sum%:給定函數(shù)累積使用 CPU 總比例,如第二行 sum% =40.00% = 20.00% + 20.00%;
- cum:當前函數(shù)加上它之上的調(diào)用運行總耗時,包括函數(shù)等待子函數(shù)返回;
- cum%:CPU 運行耗時總比例;
- 最后一列為函數(shù)名稱。
還可使用 help 指令來查看 pprof 所有操作,讀者可以自行探索。
2.2 解析 trace
使用如下命令解析 trace 文件:
go tool trace .\firstgo.exe .\trace
此時會自動打開一個 web 頁面:
- View trace:查看跟蹤;
- Goroutine analysis:Goroutine 分析;
- Network blocking profile:網(wǎng)絡阻塞概況;
- Synchronization blocking profile:同步阻塞概況;
- Syscall blocking profile:系統(tǒng)調(diào)用阻塞概況;
- Scheduler latency profile:調(diào)度延遲概況;
- User defined tasks:用戶自定義任務;
- User defined regions:用戶自定義區(qū)域;
- Minimum mutator utilization:最低 Mutator 利用率。
我們可以看到有的鏈接后面跟著(?),是因為這些鏈接的使用需要配合第三方工具,可以點進去查看缺失的內(nèi)容,下載安裝后就可以使用了,一般使用前兩個就可以分析程序的執(zhí)行情況了。
3. 小結(jié)
本文主要介紹了 Go 語言自帶的工具 pprof 的用法,以及其生成分析文件的解析。需要注意的是每個分析文件都要配合這個程序的可執(zhí)行文件使用。還有就是建議大家在開發(fā)過程中盡量時不時的用一下 pprof,可以使開發(fā)出來的程序更穩(wěn)定更高效。