在x86上實現(xiàn)水平浮點向量和的最快方法你有三個(或四個)浮動向量。最快的方法是什么?SSE(移動,洗牌,添加,移動)總是比X87快嗎?SSE4.2中的水平添加說明值得嗎?搬到FPU,然后是Faddp,F(xiàn)addp要花多少錢?最快的指令順序是什么?“試著把事情安排好,這樣你就可以一次把四個向量和起來”將不會被接受為答案。*-)
在x86上實現(xiàn)水平浮點向量和的最快方法
HUWWW
2019-06-09 16:58:44