第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號安全,請及時綁定郵箱和手機(jī)立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

Go:通過切片切片(二維切片)訪問數(shù)組時的意外性能

Go:通過切片切片(二維切片)訪問數(shù)組時的意外性能

Go
紅顏莎娜 2021-10-04 17:10:27
我正在用矩陣乘法在 Go 中做一些性能實(shí)驗,并遇到了一些意想不到的結(jié)果。版本 1:func newMatrix(n int) [][]int {    m := make([][]int, n)    buf := make([]int, n*n)    for i := range m {        m[i] = buf[i*n : (i+1)*n]    }    return m}func mult1(m1, m2, res [][]int) [][]int {    for i := range m1 {        for k := range m1[0] {            for j := range m2[0] {                res[i][j] += m1[i][k] * m2[k][j]            }        }    }    return res}我從線性數(shù)組創(chuàng)建了多個表示矩陣行的切片。版本 2:func mult2(m1, m2, res []int, n int) []int {    for i := 0; i < n; i++ {        for k := 0; k < n; k++ {            for j := 0; j < n; j++ {                res[i*n+j] += m1[i*n+k] * m2[k*n+j]            }        }    }    return res}在這個版本中,我只是使用一個線性數(shù)組并從乘法中索引到它。將 2 個 2048x2048 矩陣相乘得到以下執(zhí)行時間: version 1: 35.550813801s version 2: 19.090223468s版本 2 的速度幾乎是版本 2 的兩倍。我使用以下方法進(jìn)行測量:start := time.Now()mult(m1, m2, m3)stop := time.Now()我知道使用切片會提供另一層間接性,這可能會影響緩存性能,但是我沒想到會有如此大的差異。不幸的是,我還沒有找到任何適用于 Mac 的好工具,可以分析 Go 中的緩存效率,所以我不能確定這是否是導(dǎo)致性能差異的原因。所以我想我問的是這是預(yù)期的行為還是我遺漏了什么?軟硬件:Go version 1.4.2 darwin/amd64;OS X 10.10.3;2 GHz 四核 i7。
查看完整描述

2 回答

?
MYYA

TA貢獻(xiàn)1868條經(jīng)驗 獲得超4個贊

不幸的是,我沒有足夠的聲譽(yù)將其作為評論,但除了VAndrei的觀點(diǎn)之外,值得注意的是,兩個提供的示例使用不同的 for 循環(huán)。之后第一個示例如何執(zhí)行s/i := range m1/i := 0; i < n; i++/?

檢查“l(fā)ist mult1”和“l(fā)ist mult2”輸出在 pprof 中的樣子也很有用。有一個很棒的教程可以非??焖俚亻_始使用 Go 的 pprof:Profiling Go Programs By Russ Cox


查看完整回答
反對 回復(fù) 2021-10-04
  • 2 回答
  • 0 關(guān)注
  • 262 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動學(xué)習(xí)伙伴

公眾號

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號