2 回答

TA貢獻1783條經驗 獲得超4個贊
Rust 程序可以用慣用的方式編寫,以更快地執(zhí)行嗎?
是的。要創(chuàng)建包含幾個元素的向量,請使用vec![]宏:
let mut work: Vec<f64> = vec![0.0, 1.0];
for _x in 1..100000000 {
work.swap(0, 1);
}
那么這段代碼更快嗎?是的。查看生成的程序集:
example::main:
mov eax, 99999999
.LBB0_1:
add eax, -11
jne .LBB0_1
ret
在我的 PC 上,它的運行速度比您的原始代碼快 30 倍。
為什么程序集仍然包含這個什么都不做的循環(huán)?為什么編譯器無法看到兩個push
es 與 相同vec![0.0, 1.0]
?這兩個問題都很好,而且都可能指向 LLVM 或 Rust 編譯器中的缺陷。
然而,遺憾的是,從您的微基準測試中沒有太多有用的信息?;鶞蕼y試很難,真的很難。有太多的陷阱,連專業(yè)人士都會掉進去。就您而言,基準測試在幾個方面存在缺陷。首先,您以后永遠不會觀察向量的內容(它從未被使用過)。這就是為什么一個好的編譯器可以刪除所有甚至觸及向量的代碼(就像上面的 Rust 編譯器所做的那樣)。所以這不好。
除此之外,這與任何真正的性能關鍵代碼都不相似。即使稍后會觀察到向量,奇數次交換也等于單次交換。所以除非你想看看優(yōu)化器是否能理解這個交換規(guī)則,否則遺憾的是你的基準測試并不是很有用。

TA貢獻1906條經驗 獲得超3個贊
(不是答案)但為了擴充 Lukas 所寫的內容,以下是 Go 1.11 為循環(huán)本身生成的內容:
xorl CX, CX
movsd 8(AX), X0
movsd (AX), X1
movsd X0, (AX)
movsd X1, 8(AX)
incq CX
cmpq CX, $100000000
jlt 68
(由https://godbolt.org提供)
在任何一種情況下,請注意,您測量的時間很可能主要由進程的啟動和初始化決定,因此您實際上并未測量循環(huán)執(zhí)行的速度。IOW 你的方法是不正確的。
- 2 回答
- 0 關注
- 141 瀏覽
添加回答
舉報