首頁猿問 Go：通過切片切片（二維切片）訪問...

Go：通過切片切片（二維切片）訪問數(shù)組時的意外性能

Go

紅顏莎娜 2021-10-04 17:10:27

我正在用矩陣乘法在 Go 中做一些性能實(shí)驗，并遇到了一些意想不到的結(jié)果。版本 1：func newMatrix(n int) [][]int { m := make([][]int, n) buf := make([]int, n*n) for i := range m { m[i] = buf[i*n : (i+1)*n] } return m}func mult1(m1, m2, res [][]int) [][]int { for i := range m1 { for k := range m1[0] { for j := range m2[0] { res[i][j] += m1[i][k] * m2[k][j] } } } return res}我從線性數(shù)組創(chuàng)建了多個表示矩陣行的切片。版本 2：func mult2(m1, m2, res []int, n int) []int { for i := 0; i < n; i++ { for k := 0; k < n; k++ { for j := 0; j < n; j++ { res[i*n+j] += m1[i*n+k] * m2[k*n+j] } } } return res}在這個版本中，我只是使用一個線性數(shù)組并從乘法中索引到它。將 2 個 2048x2048 矩陣相乘得到以下執(zhí)行時間： version 1: 35.550813801s version 2: 19.090223468s版本 2 的速度幾乎是版本 2 的兩倍。我使用以下方法進(jìn)行測量：start := time.Now()mult(m1, m2, m3)stop := time.Now()我知道使用切片會提供另一層間接性，這可能會影響緩存性能，但是我沒想到會有如此大的差異。不幸的是，我還沒有找到任何適用于 Mac 的好工具，可以分析 Go 中的緩存效率，所以我不能確定這是否是導(dǎo)致性能差異的原因。所以我想我問的是這是預(yù)期的行為還是我遺漏了什么？軟硬件：Go version 1.4.2 darwin/amd64；OS X 10.10.3；2 GHz 四核 i7。

查看完整描述